📈

Herz-Krankheits Naive Bayes & Logistische Regression

Completed 2024 ML-Experimentierung mit mehreren Klassifikatoren und Präprozessierungsstrategien

Dieses Projekt implementiert und vergleicht mehrere Klassifikationsalgorithmen für Herz-Krankheits-Vorhersage: Naive Bayes-Varianten (Gaussian, Categorical und Mixed) und Logistische Regression. Das Projekt demonstriert verschiedene Ansätze zur Handhabung gemischter Datentypen (numerisch, kategorisch, ordinal, binär) und umfassendes Hyperparameter-Tuning mit GridSearchCV. Jedes Modell wird auf dem Heart Disease UCI-Datensatz mit ordnungsgemäßen Präprozessierungs-Pipelines und Kreuzvalidierung evaluiert. Das Projekt zeigt modellspezifische Präprozessierungsstrategien, Solver-Penalty-Kompatibilitätsbehandlung und umfassende Evaluierungsmetriken.

Data Science Maschinelles Lernen Python-Entwicklung Gesundheitsanalyse Klassifikation Modell-Tuning Statistisches Lernen

Übersicht

Dieses Projekt implementiert und vergleicht mehrere Klassifikationsalgorithmen für Herz-Krankheits-Vorhersage: Naive Bayes-Varianten (Gaussian, Categorical und Mixed) und Logistische Regression. Das Projekt demonstriert verschiedene Ansätze zur Handhabung gemischter Datentypen (numerisch, kategorisch, ordinal, binär) und umfassendes Hyperparameter-Tuning mit GridSearchCV. Jedes Modell wird auf dem Heart Disease UCI-Datensatz mit ordnungsgemäßen Präprozessierungs-Pipelines und Kreuzvalidierung evaluiert. Das Projekt zeigt modellspezifische Präprozessierungsstrategien, Solver-Penalty-Kompatibilitätsbehandlung und umfassende Evaluierungsmetriken.

Schlüsselfunktionen

pages.portfolio.projects.heart_disease_naive_bayes_logistic.features.0

Logistische Regression mit Hyperparameter-Tuning

Modellspezifische Präprozessierungsstrategien

Umfassendes Hyperparameter-Tuning mit GridSearchCV

Kreuzvalidierung für robuste Evaluierung

Solver-Penalty-Kompatibilitätsbehandlung

Vollständige Evaluierungsmetrik-Suite

Gemischte Datentyp-Behandlung (numerisch, kategorisch, ordinal, binär)

pages.portfolio.projects.heart_disease_naive_bayes_logistic.features.8

Technische Highlights

Vergleich mehrerer Naive Bayes-Varianten und Logistische Regression auf Herz-Krankheits-Daten

Implementierung modellspezifischer Präprozessierung für optimale Performance

Handhabung von Solver-Penalty-Kompatibilitätsproblemen in Logistischer Regression

Erreichung starker Performance mit abgestimmten Modellen

Umfassende Evaluierung mit Kreuzvalidierung

pages.portfolio.projects.heart_disease_naive_bayes_logistic.highlights.5

Herausforderungen und Lösungen

Gemischte Datentypen

Handhabung numerischer, kategorischer, ordinaler und binärer Variablen mit angemessener Präprozessierung

Solver-Penalty-Kompatibilität

Verwaltung von Solver- und Penalty-Kombinationen in Logistischer Regression für optimale Performance

Modell-Vergleich

Vergleich mehrerer Algorithmen mit fairen Evaluierungsmetriken und Präprozessierung

Technologien

ML Models

GaussianNB CategoricalNB MixedNB LogisticRegression

Tuning

GridSearchCV

Preprocessing

KNNImputer SimpleImputer OneHotEncoder OrdinalEncoder LabelEncoder MinMaxScaler

Pipeline

Pipeline ColumnTransformer

Data

Pandas NumPy

Environment

Python Jupyter Notebook

Projektinformationen

Status
Completed
Jahr
2024
Architektur
ML-Experimentierung mit mehreren Klassifikatoren und Präprozessierungsstrategien
Category
Data Science