🧪

Herz-Krankheits-Modellierung (ML3)

Completed 2024 • ML-Experimentierung mit SVM/LDA und abgestimmter Präprozessierung

ML3 erweitert die Herz-Krankheits-Arbeit mit KNN-basierter Imputation, SVM-Varianten (LinearSVC/SVC) grid-abgestimmt über C/Gamma/Kernel und LDA grid-abgestimmt über Solver/Shrinkage. Es erhält stratifizierte Splits aus vorheriger Präprozessierung, evaluiert Genauigkeit/Präzision/Recall/F1 und behandelt sklearn predict-Quirks durch Übergeben von numpy-Arrays. KNN-imputierte Präprozessierung nutzt RandomizedSearchCV zur Rechenkontrolle während Erkundung des Hyperparameter-Raums.

Data Science Maschinelles Lernen Python-Entwicklung Gesundheitsanalyse Klassifikation Modell-Tuning

Übersicht

Schlüsselfunktionen

✓

KNN-imputierte Präprozessierung für Herz-Krankheits-Daten

✓

SVM (LinearSVC/SVC) abgestimmt über C/Gamma/Kernel

✓

LDA abgestimmt über Solver und Shrinkage

✓

GridSearchCV und RandomizedSearchCV für effiziente Hyperparameter-Suche

✓

pages.portfolio.projects.heart_disease_ml3.features.4

✓

Stratifizierte Splits aus Präprozessierung erhalten

✓

Umgehung für sklearn predict Array-Anforderungen (DataFrame zu numpy)

Technische Highlights

⚡

Vergleich von SVM und LDA mit abgestimmten Hyperparametern auf Herz-Krankheits-Daten

⚡

Verwendung von KNN-imputierter Präprozessierung und randomisierter Suche zur Rechenverwaltung

⚡

Bericht starker LDA-Performance (Acc ~0.87, F1 ~0.86) und abgestimmter SVC-Ergebnisse

⚡

Handhabung sklearn predict-Quirk durch Konvertierung von DataFrames zu numpy-Arrays

Herausforderungen und Lösungen

Suchraum-Größe

Ausgewogene exhaustive Grid-Suche mit randomisierter Suche für die KNN-imputierte Variante

API-Quirks

Gewährleistung predict-Kompatibilität durch Verwendung von numpy-Arrays mit bestimmten sklearn-Versionen

Modell-Abdeckung

Benchmark mehrerer Klassifikatoren (SVM-Varianten, LDA) zur Findung bestperformender Konfigurationen

Technologien

ML

Scikit-learn SVC/LinearSVC LDA GridSearchCV RandomizedSearchCV

Data

Pandas NumPy

Viz

Matplotlib Seaborn

Environment

Python Jupyter Notebook

Projektinformationen

Status: Completed
Jahr: 2024
Architektur: ML-Experimentierung mit SVM/LDA und abgestimmter Präprozessierung
Category: Data Science

Zurück zu Portfolio Projekte anzeigen Data Science