Système de Recommandation d'Anime
Ce projet explore diverses techniques de système de recommandation pour recommandations d'anime utilisant données de MyAnimeList. Le projet implémente trois approches principales: Filtrage Collaboratif (recommandations basées sur préférences utilisateur et similarités avec autres utilisateurs), Filtrage Basé sur le Contenu (recommandations basées sur descriptions de produits et similarité entre items), et recommandations Basées sur Similarité Utilisateur (basées sur similarités de profils utilisateur). Le projet utilise la bibliothèque Surprise pour algorithmes de filtrage collaboratif incluant variantes KNN, SVD, SVD++, SlopeOne, CoClustering et modèles basés sur SGD. Il inclut métriques d'évaluation complètes (MAE, RMSE, Hit Rate, ARHR, User Coverage), réglage d'hyperparamètres avec GridSearchCV et comparaison systématique de modèles.
Aperçu
Ce projet explore diverses techniques de système de recommandation pour recommandations d'anime utilisant données de MyAnimeList. Le projet implémente trois approches principales: Filtrage Collaboratif (recommandations basées sur préférences utilisateur et similarités avec autres utilisateurs), Filtrage Basé sur le Contenu (recommandations basées sur descriptions de produits et similarité entre items), et recommandations Basées sur Similarité Utilisateur (basées sur similarités de profils utilisateur). Le projet utilise la bibliothèque Surprise pour algorithmes de filtrage collaboratif incluant variantes KNN, SVD, SVD++, SlopeOne, CoClustering et modèles basés sur SGD. Il inclut métriques d'évaluation complètes (MAE, RMSE, Hit Rate, ARHR, User Coverage), réglage d'hyperparamètres avec GridSearchCV et comparaison systématique de modèles.
Fonctionnalités clés
Filtrage collaboratif avec 9+ algorithmes (variantes KNN, SVD, SVD++, SlopeOne, CoClustering, SGD)
Filtrage basé sur le contenu pour similarité de produits
Recommandations basées sur similarité utilisateur
Métriques d'évaluation complètes (MAE, RMSE, Hit Rate, ARHR, User Coverage)
Réglage d'hyperparamètres avec GridSearchCV
Persistance et comparaison de modèles
Gestion de jeu de données à grande échelle (données MyAnimeList 1.1GB+)
Optimisation de matrice creuse
Fonction de recommandation Top-N
Analyse statistique et visualisation
pages.portfolio.projects.anime_recommendation_system.features.10
Principales fonctionnalités
Implémentation de 9+ algorithmes de filtrage collaboratif utilisant bibliothèque Surprise
Création de framework d'évaluation complet avec plusieurs métriques
Réalisation de réglage d'hyperparamètres avec GridSearchCV
Gestion de jeu de données MyAnimeList à grande échelle (1.1GB+)
Comparaison d'approches collaboratives, basées sur le contenu et similarité utilisateur
Développement de fonction de recommandation Top-N avec résultats personnalisés
Défis et solutions
Dispersion des Données
Traitement de matrice utilisateur-item hautement creuse utilisant filtrage basé sur seuil et factorisation de matrice
Problème de Démarrage à Froid
Implémentation de filtrage basé sur le contenu et approches hybrides pour nouveaux utilisateurs/items
Scalabilité
Utilisation de structures de données efficaces, matrices creuses et algorithmes optimisés pour grand jeu de données
Réglage d'Hyperparamètres
Application de GridSearchCV pour recherche systématique d'hyperparamètres et suivi de performance
Métriques d'Évaluation
Développement de suite de métriques complète couvrant perspectives précision, classement et couverture
Comparaison de Modèles
Création de framework d'évaluation standardisé pour comparaison systématique d'algorithmes
Technologies
Recommendation Systems
Data Processing
Visualization
Analysis
Evaluation
Environment
Informations du projet
- Statut
- Completed
- Année
- 2024
- Architecture
- Système de Recommandation Multi-Approche avec Méthodes Collaboratives, Basées sur le Contenu et Similarité Utilisateur
- Category
- Data Science