📈

Naive Bayes et Régression Logistique Maladie Cardiaque

Completed 2024 Expérimentation ML avec plusieurs classificateurs et stratégies de prétraitement

Ce projet implémente et compare plusieurs algorithmes de classification pour la prédiction de maladie cardiaque: variantes Naive Bayes (Gaussian, Categorical et Mixed) et Régression Logistique. Le projet démontre différentes approches pour gérer des types de données mixtes (numériques, catégorielles, ordinales, binaires) et réglage d'hyperparamètres complet utilisant GridSearchCV. Chaque modèle est évalué sur le jeu de données Heart Disease UCI avec pipelines de prétraitement appropriés et validation croisée. Le projet présente des stratégies de prétraitement spécifiques au modèle, gestion de compatibilité solveur-pénalité et métriques d'évaluation complètes.

Data Science Apprentissage automatique Développement Python Analyse de Santé Classification Réglage de Modèle Apprentissage Statistique

Aperçu

Ce projet implémente et compare plusieurs algorithmes de classification pour la prédiction de maladie cardiaque: variantes Naive Bayes (Gaussian, Categorical et Mixed) et Régression Logistique. Le projet démontre différentes approches pour gérer des types de données mixtes (numériques, catégorielles, ordinales, binaires) et réglage d'hyperparamètres complet utilisant GridSearchCV. Chaque modèle est évalué sur le jeu de données Heart Disease UCI avec pipelines de prétraitement appropriés et validation croisée. Le projet présente des stratégies de prétraitement spécifiques au modèle, gestion de compatibilité solveur-pénalité et métriques d'évaluation complètes.

Fonctionnalités clés

pages.portfolio.projects.heart_disease_naive_bayes_logistic.features.0

Régression Logistique avec réglage d'hyperparamètres

Stratégies de prétraitement spécifiques au modèle

Réglage d'hyperparamètres complet avec GridSearchCV

Validation croisée pour évaluation robuste

Gestion de compatibilité solveur-pénalité

Suite complète de métriques d'évaluation

Gestion de types de données mixtes (numérique, catégoriel, ordinal, binaire)

pages.portfolio.projects.heart_disease_naive_bayes_logistic.features.8

Principales fonctionnalités

Comparaison de plusieurs variantes Naive Bayes et Régression Logistique sur données de maladie cardiaque

Implémentation de prétraitement spécifique au modèle pour performance optimale

Gestion de problèmes de compatibilité solveur-pénalité dans Régression Logistique

Atteinte de performance forte avec modèles réglés

Évaluation complète avec validation croisée

pages.portfolio.projects.heart_disease_naive_bayes_logistic.highlights.5

Défis et solutions

Types de Données Mixtes

Gestion de variables numériques, catégorielles, ordinales et binaires avec prétraitement approprié

Compatibilité Solveur-Pénalité

Gestion de combinaisons solveur et pénalité dans Régression Logistique pour performance optimale

Comparaison de Modèles

Comparaison de plusieurs algorithmes avec métriques d'évaluation équitables et prétraitement

Technologies

ML Models

GaussianNB CategoricalNB MixedNB LogisticRegression

Tuning

GridSearchCV

Preprocessing

KNNImputer SimpleImputer OneHotEncoder OrdinalEncoder LabelEncoder MinMaxScaler

Pipeline

Pipeline ColumnTransformer

Data

Pandas NumPy

Environment

Python Jupyter Notebook

Informations du projet

Statut
Completed
Année
2024
Architecture
Expérimentation ML avec plusieurs classificateurs et stratégies de prétraitement
Category
Data Science