🎌

Système de Recommandation d'Anime

Completed 2024 Système de Recommandation Multi-Approche avec Méthodes Collaboratives, Basées sur le Contenu et Similarité Utilisateur

Ce projet explore diverses techniques de système de recommandation pour recommandations d'anime utilisant données de MyAnimeList. Le projet implémente trois approches principales: Filtrage Collaboratif (recommandations basées sur préférences utilisateur et similarités avec autres utilisateurs), Filtrage Basé sur le Contenu (recommandations basées sur descriptions de produits et similarité entre items), et recommandations Basées sur Similarité Utilisateur (basées sur similarités de profils utilisateur). Le projet utilise la bibliothèque Surprise pour algorithmes de filtrage collaboratif incluant variantes KNN, SVD, SVD++, SlopeOne, CoClustering et modèles basés sur SGD. Il inclut métriques d'évaluation complètes (MAE, RMSE, Hit Rate, ARHR, User Coverage), réglage d'hyperparamètres avec GridSearchCV et comparaison systématique de modèles.

Data Science Apprentissage automatique Développement Python Systèmes de Recommandation Filtrage Collaboratif Filtrage Basé sur le Contenu Récupération d'Information

Aperçu

Ce projet explore diverses techniques de système de recommandation pour recommandations d'anime utilisant données de MyAnimeList. Le projet implémente trois approches principales: Filtrage Collaboratif (recommandations basées sur préférences utilisateur et similarités avec autres utilisateurs), Filtrage Basé sur le Contenu (recommandations basées sur descriptions de produits et similarité entre items), et recommandations Basées sur Similarité Utilisateur (basées sur similarités de profils utilisateur). Le projet utilise la bibliothèque Surprise pour algorithmes de filtrage collaboratif incluant variantes KNN, SVD, SVD++, SlopeOne, CoClustering et modèles basés sur SGD. Il inclut métriques d'évaluation complètes (MAE, RMSE, Hit Rate, ARHR, User Coverage), réglage d'hyperparamètres avec GridSearchCV et comparaison systématique de modèles.

Fonctionnalités clés

Filtrage collaboratif avec 9+ algorithmes (variantes KNN, SVD, SVD++, SlopeOne, CoClustering, SGD)

Filtrage basé sur le contenu pour similarité de produits

Recommandations basées sur similarité utilisateur

Métriques d'évaluation complètes (MAE, RMSE, Hit Rate, ARHR, User Coverage)

Réglage d'hyperparamètres avec GridSearchCV

Persistance et comparaison de modèles

Gestion de jeu de données à grande échelle (données MyAnimeList 1.1GB+)

Optimisation de matrice creuse

Fonction de recommandation Top-N

Analyse statistique et visualisation

pages.portfolio.projects.anime_recommendation_system.features.10

Principales fonctionnalités

Implémentation de 9+ algorithmes de filtrage collaboratif utilisant bibliothèque Surprise

Création de framework d'évaluation complet avec plusieurs métriques

Réalisation de réglage d'hyperparamètres avec GridSearchCV

Gestion de jeu de données MyAnimeList à grande échelle (1.1GB+)

Comparaison d'approches collaboratives, basées sur le contenu et similarité utilisateur

Développement de fonction de recommandation Top-N avec résultats personnalisés

Défis et solutions

Dispersion des Données

Traitement de matrice utilisateur-item hautement creuse utilisant filtrage basé sur seuil et factorisation de matrice

Problème de Démarrage à Froid

Implémentation de filtrage basé sur le contenu et approches hybrides pour nouveaux utilisateurs/items

Scalabilité

Utilisation de structures de données efficaces, matrices creuses et algorithmes optimisés pour grand jeu de données

Réglage d'Hyperparamètres

Application de GridSearchCV pour recherche systématique d'hyperparamètres et suivi de performance

Métriques d'Évaluation

Développement de suite de métriques complète couvrant perspectives précision, classement et couverture

Comparaison de Modèles

Création de framework d'évaluation standardisé pour comparaison systématique d'algorithmes

Technologies

Recommendation Systems

Surprise KNN SVD SVD++ SlopeOne CoClustering SGD

Data Processing

Pandas NumPy

Visualization

Matplotlib Seaborn Plotly

Analysis

SciPy Statsmodels

Evaluation

GridSearchCV Cross-Validation

Environment

Python Jupyter Notebook

Informations du projet

Statut
Completed
Année
2024
Architecture
Système de Recommandation Multi-Approche avec Méthodes Collaboratives, Basées sur le Contenu et Similarité Utilisateur
Category
Data Science