🧪

Herz-Krankheits-Modellierung (ML3)

Completed 2024 ML-Experimentierung mit SVM/LDA und abgestimmter Präprozessierung

ML3 erweitert die Herz-Krankheits-Arbeit mit KNN-basierter Imputation, SVM-Varianten (LinearSVC/SVC) grid-abgestimmt über C/Gamma/Kernel und LDA grid-abgestimmt über Solver/Shrinkage. Es erhält stratifizierte Splits aus vorheriger Präprozessierung, evaluiert Genauigkeit/Präzision/Recall/F1 und behandelt sklearn predict-Quirks durch Übergeben von numpy-Arrays. KNN-imputierte Präprozessierung nutzt RandomizedSearchCV zur Rechenkontrolle während Erkundung des Hyperparameter-Raums.

Data Science Maschinelles Lernen Python-Entwicklung Gesundheitsanalyse Klassifikation Modell-Tuning

Übersicht

ML3 erweitert die Herz-Krankheits-Arbeit mit KNN-basierter Imputation, SVM-Varianten (LinearSVC/SVC) grid-abgestimmt über C/Gamma/Kernel und LDA grid-abgestimmt über Solver/Shrinkage. Es erhält stratifizierte Splits aus vorheriger Präprozessierung, evaluiert Genauigkeit/Präzision/Recall/F1 und behandelt sklearn predict-Quirks durch Übergeben von numpy-Arrays. KNN-imputierte Präprozessierung nutzt RandomizedSearchCV zur Rechenkontrolle während Erkundung des Hyperparameter-Raums.

Schlüsselfunktionen

KNN-imputierte Präprozessierung für Herz-Krankheits-Daten

SVM (LinearSVC/SVC) abgestimmt über C/Gamma/Kernel

LDA abgestimmt über Solver und Shrinkage

GridSearchCV und RandomizedSearchCV für effiziente Hyperparameter-Suche

pages.portfolio.projects.heart_disease_ml3.features.4

Stratifizierte Splits aus Präprozessierung erhalten

Umgehung für sklearn predict Array-Anforderungen (DataFrame zu numpy)

Technische Highlights

Vergleich von SVM und LDA mit abgestimmten Hyperparametern auf Herz-Krankheits-Daten

Verwendung von KNN-imputierter Präprozessierung und randomisierter Suche zur Rechenverwaltung

Bericht starker LDA-Performance (Acc ~0.87, F1 ~0.86) und abgestimmter SVC-Ergebnisse

Handhabung sklearn predict-Quirk durch Konvertierung von DataFrames zu numpy-Arrays

Herausforderungen und Lösungen

Suchraum-Größe

Ausgewogene exhaustive Grid-Suche mit randomisierter Suche für die KNN-imputierte Variante

API-Quirks

Gewährleistung predict-Kompatibilität durch Verwendung von numpy-Arrays mit bestimmten sklearn-Versionen

Modell-Abdeckung

Benchmark mehrerer Klassifikatoren (SVM-Varianten, LDA) zur Findung bestperformender Konfigurationen

Technologien

ML

Scikit-learn SVC/LinearSVC LDA GridSearchCV RandomizedSearchCV

Data

Pandas NumPy

Viz

Matplotlib Seaborn

Environment

Python Jupyter Notebook

Projektinformationen

Status
Completed
Jahr
2024
Architektur
ML-Experimentierung mit SVM/LDA und abgestimmter Präprozessierung
Category
Data Science