🎌

Anime-Empfehlungssystem

Completed 2024 Multi-Ansatz-Empfehlungssystem mit kollaborativen, inhalts-basierten und Benutzer-Ähnlichkeits-Methoden

Dieses Projekt erkundet verschiedene Empfehlungssystem-Techniken für Anime-Empfehlungen mit Daten von MyAnimeList. Das Projekt implementiert drei Hauptansätze: Kollaboratives Filtern (Empfehlungen basierend auf Benutzer-Präferenzen und Ähnlichkeiten mit anderen Benutzern), Inhalts-basiertes Filtern (Empfehlungen basierend auf Produktbeschreibungen und Ähnlichkeit zwischen Items) und Benutzer-Ähnlichkeits-basierte Empfehlungen (basierend auf Benutzer-Profil-Ähnlichkeiten). Das Projekt verwendet die Surprise-Bibliothek für kollaborative Filterungs-Algorithmen einschließlich KNN-Varianten, SVD, SVD++, SlopeOne, CoClustering und SGD-basierte Modelle. Es umfasst umfassende Evaluierungs-Metriken (MAE, RMSE, Hit Rate, ARHR, User Coverage), Hyperparameter-Tuning mit GridSearchCV und systematischen Modell-Vergleich.

Data Science Maschinelles Lernen Python-Entwicklung Empfehlungssysteme Kollaboratives Filtern Inhalts-basiertes Filtern Informations-Retrieval

Übersicht

Dieses Projekt erkundet verschiedene Empfehlungssystem-Techniken für Anime-Empfehlungen mit Daten von MyAnimeList. Das Projekt implementiert drei Hauptansätze: Kollaboratives Filtern (Empfehlungen basierend auf Benutzer-Präferenzen und Ähnlichkeiten mit anderen Benutzern), Inhalts-basiertes Filtern (Empfehlungen basierend auf Produktbeschreibungen und Ähnlichkeit zwischen Items) und Benutzer-Ähnlichkeits-basierte Empfehlungen (basierend auf Benutzer-Profil-Ähnlichkeiten). Das Projekt verwendet die Surprise-Bibliothek für kollaborative Filterungs-Algorithmen einschließlich KNN-Varianten, SVD, SVD++, SlopeOne, CoClustering und SGD-basierte Modelle. Es umfasst umfassende Evaluierungs-Metriken (MAE, RMSE, Hit Rate, ARHR, User Coverage), Hyperparameter-Tuning mit GridSearchCV und systematischen Modell-Vergleich.

Schlüsselfunktionen

Kollaboratives Filtern mit 9+ Algorithmen (KNN-Varianten, SVD, SVD++, SlopeOne, CoClustering, SGD)

Inhalts-basiertes Filtern für Produkt-Ähnlichkeit

Benutzer-Ähnlichkeits-basierte Empfehlungen

Umfassende Evaluierungs-Metriken (MAE, RMSE, Hit Rate, ARHR, User Coverage)

Hyperparameter-Tuning mit GridSearchCV

Modell-Persistenz und Vergleich

Großskalige Datensatz-Behandlung (1.1GB+ MyAnimeList-Daten)

Spärliche Matrix-Optimierung

Top-N-Empfehlungs-Funktion

Statistische Analyse und Visualisierung

pages.portfolio.projects.anime_recommendation_system.features.10

Technische Highlights

Implementierung von 9+ kollaborativen Filterungs-Algorithmen mit Surprise-Bibliothek

Erstellung umfassendes Evaluierungs-Framework mit mehreren Metriken

Durchführung Hyperparameter-Tuning mit GridSearchCV

Handhabung großskaliger MyAnimeList-Datensätze (1.1GB+)

Vergleich kollaborativer, inhalts-basierter und Benutzer-Ähnlichkeits-Ansätze

Entwicklung Top-N-Empfehlungs-Funktion mit personalisierten Ergebnissen

Herausforderungen und Lösungen

Daten-Sparsity

Behandlung hoch spärlicher Benutzer-Item-Matrix mit schwellenwert-basiertem Filtern und Matrix-Faktorisierung

Cold-Start-Problem

Implementierung inhalts-basiertes Filtern und hybride Ansätze für neue Benutzer/Items

Skalierbarkeit

Verwendung effizienter Datenstrukturen, spärlicher Matrizen und optimierter Algorithmen für große Datensätze

Hyperparameter-Tuning

Anwendung von GridSearchCV zur systematischen Hyperparameter-Suche und Performance-Tracking

Evaluierungs-Metriken

Entwicklung umfassender Metrik-Suite abdeckend Genauigkeits-, Ranking- und Coverage-Perspektiven

Modell-Vergleich

Erstellung standardisiertes Evaluierungs-Framework zur systematischen Algorithmus-Vergleich

Technologien

Recommendation Systems

Surprise KNN SVD SVD++ SlopeOne CoClustering SGD

Data Processing

Pandas NumPy

Visualization

Matplotlib Seaborn Plotly

Analysis

SciPy Statsmodels

Evaluation

GridSearchCV Cross-Validation

Environment

Python Jupyter Notebook

Projektinformationen

Status
Completed
Jahr
2024
Architektur
Multi-Ansatz-Empfehlungssystem mit kollaborativen, inhalts-basierten und Benutzer-Ähnlichkeits-Methoden
Category
Data Science