🧪

Modélisation Maladie Cardiaque (ML3)

Completed 2024 Expérimentation ML avec SVM/LDA et prétraitement réglé

ML3 étend le travail sur maladie cardiaque avec imputation basée sur KNN, variantes SVM (LinearSVC/SVC) réglées en grille sur C/gamma/noyau, et LDA réglé en grille sur solveur/rétrécissement. Il préserve les divisions stratifiées du prétraitement précédent, évalue précision/rappel/F1, et gère les quirks predict sklearn en passant des tableaux numpy. Le prétraitement KNN-imputé exploite RandomizedSearchCV pour contrôler le calcul tout en explorant l'espace d'hyperparamètres.

Data Science Apprentissage automatique Développement Python Analyse de Santé Classification Réglage de Modèle

Aperçu

ML3 étend le travail sur maladie cardiaque avec imputation basée sur KNN, variantes SVM (LinearSVC/SVC) réglées en grille sur C/gamma/noyau, et LDA réglé en grille sur solveur/rétrécissement. Il préserve les divisions stratifiées du prétraitement précédent, évalue précision/rappel/F1, et gère les quirks predict sklearn en passant des tableaux numpy. Le prétraitement KNN-imputé exploite RandomizedSearchCV pour contrôler le calcul tout en explorant l'espace d'hyperparamètres.

Fonctionnalités clés

Prétraitement KNN-imputé pour données de maladie cardiaque

SVM (LinearSVC/SVC) réglé sur C/gamma/noyau

LDA réglé sur solveur et rétrécissement

GridSearchCV et RandomizedSearchCV pour recherche d'hyperparamètres efficace

pages.portfolio.projects.heart_disease_ml3.features.4

Divisions stratifiées préservées du prétraitement

Contournement pour exigences de tableau numpy sklearn predict (DataFrame vers numpy)

Principales fonctionnalités

Comparaison de SVM et LDA avec hyperparamètres réglés sur données de maladie cardiaque

Utilisation de prétraitement KNN-imputé et recherche randomisée pour gérer le calcul

Rapport de performance LDA forte (Acc ~0.87, F1 ~0.86) et résultats SVC réglés

Gestion du quirk predict sklearn en convertissant DataFrames en tableaux numpy

Défis et solutions

Taille de l'Espace de Recherche

Équilibrage de recherche en grille exhaustive avec recherche randomisée pour la variante KNN-imputée

Quirks API

Assurance de compatibilité predict en utilisant des tableaux numpy avec certaines versions sklearn

Couverture de Modèle

Évaluation comparative de plusieurs classificateurs (variantes SVM, LDA) pour trouver configurations les plus performantes

Technologies

ML

Scikit-learn SVC/LinearSVC LDA GridSearchCV RandomizedSearchCV

Data

Pandas NumPy

Viz

Matplotlib Seaborn

Environment

Python Jupyter Notebook

Informations du projet

Statut
Completed
Année
2024
Architecture
Expérimentation ML avec SVM/LDA et prétraitement réglé
Category
Data Science