Modélisation Maladie Cardiaque (ML3)
ML3 étend le travail sur maladie cardiaque avec imputation basée sur KNN, variantes SVM (LinearSVC/SVC) réglées en grille sur C/gamma/noyau, et LDA réglé en grille sur solveur/rétrécissement. Il préserve les divisions stratifiées du prétraitement précédent, évalue précision/rappel/F1, et gère les quirks predict sklearn en passant des tableaux numpy. Le prétraitement KNN-imputé exploite RandomizedSearchCV pour contrôler le calcul tout en explorant l'espace d'hyperparamètres.
Aperçu
ML3 étend le travail sur maladie cardiaque avec imputation basée sur KNN, variantes SVM (LinearSVC/SVC) réglées en grille sur C/gamma/noyau, et LDA réglé en grille sur solveur/rétrécissement. Il préserve les divisions stratifiées du prétraitement précédent, évalue précision/rappel/F1, et gère les quirks predict sklearn en passant des tableaux numpy. Le prétraitement KNN-imputé exploite RandomizedSearchCV pour contrôler le calcul tout en explorant l'espace d'hyperparamètres.
Fonctionnalités clés
Prétraitement KNN-imputé pour données de maladie cardiaque
SVM (LinearSVC/SVC) réglé sur C/gamma/noyau
LDA réglé sur solveur et rétrécissement
GridSearchCV et RandomizedSearchCV pour recherche d'hyperparamètres efficace
pages.portfolio.projects.heart_disease_ml3.features.4
Divisions stratifiées préservées du prétraitement
Contournement pour exigences de tableau numpy sklearn predict (DataFrame vers numpy)
Principales fonctionnalités
Comparaison de SVM et LDA avec hyperparamètres réglés sur données de maladie cardiaque
Utilisation de prétraitement KNN-imputé et recherche randomisée pour gérer le calcul
Rapport de performance LDA forte (Acc ~0.87, F1 ~0.86) et résultats SVC réglés
Gestion du quirk predict sklearn en convertissant DataFrames en tableaux numpy
Défis et solutions
Taille de l'Espace de Recherche
Équilibrage de recherche en grille exhaustive avec recherche randomisée pour la variante KNN-imputée
Quirks API
Assurance de compatibilité predict en utilisant des tableaux numpy avec certaines versions sklearn
Couverture de Modèle
Évaluation comparative de plusieurs classificateurs (variantes SVM, LDA) pour trouver configurations les plus performantes
Technologies
ML
Data
Viz
Environment
Informations du projet
- Statut
- Completed
- Année
- 2024
- Architecture
- Expérimentation ML avec SVM/LDA et prétraitement réglé
- Category
- Data Science