🤖

Apprentissage Profond - Classification de Langue des Signes

Completed 2024 Projet d'Apprentissage Profond Multi-Solution avec CNN Personnalisé, Transfer Learning VGG16 et Framework de Réseaux de Neurones

Ce projet explore techniques d'apprentissage profond pour classification d'images et modélisation de réseaux de neurones. L'objectif principal est développement d'un système de reconnaissance d'alphabet de langue des signes utilisant jeu de données Sign Language MNIST, où le but est classifier signes de main statiques représentant lettres A-Z (excluant J et Z qui nécessitent mouvements dynamiques). Le projet inclut également un framework pour régression/classification de réseaux de neurones sur jeu de données Heart Disease UCI. Le projet démontre plusieurs approches: architectures CNN personnalisées construites à partir de zéro, transfer learning avec modèles pré-entraînés (VGG16), techniques d'augmentation de données (RandomFlip, RandomRotation, RandomZoom, RandomTranslation, RandomCrop) et optimisation d'hyperparamètres utilisant GridSearchCV.

Data Science Apprentissage automatique Développement Python Apprentissage Profond Vision par Ordinateur Classification d'Images Transfer Learning

Aperçu

Ce projet explore techniques d'apprentissage profond pour classification d'images et modélisation de réseaux de neurones. L'objectif principal est développement d'un système de reconnaissance d'alphabet de langue des signes utilisant jeu de données Sign Language MNIST, où le but est classifier signes de main statiques représentant lettres A-Z (excluant J et Z qui nécessitent mouvements dynamiques). Le projet inclut également un framework pour régression/classification de réseaux de neurones sur jeu de données Heart Disease UCI. Le projet démontre plusieurs approches: architectures CNN personnalisées construites à partir de zéro, transfer learning avec modèles pré-entraînés (VGG16), techniques d'augmentation de données (RandomFlip, RandomRotation, RandomZoom, RandomTranslation, RandomCrop) et optimisation d'hyperparamètres utilisant GridSearchCV.

Fonctionnalités clés

Architectures CNN personnalisées construites à partir de zéro pour classification de langue des signes

Transfer learning VGG16 avec poids ImageNet pré-entraînés

Augmentation de données avec 7+ techniques (flip, rotation, zoom, translation, crop)

Réglage d'hyperparamètres avec GridSearchCV

Point de contrôle de modèles et arrêt anticipé

Classification 24 classes (lettres A-Z excluant J, Z)

Framework de réseaux de neurones pour données tabulaires (Heart Disease UCI)

Plusieurs approches de solution (3 implémentations différentes)

Persistance de modèles et préservation de mappage de classes

Métriques d'évaluation complètes (précision, rappel, F1-score)

pages.portfolio.projects.deep_learning_sign_language.features.10

pages.portfolio.projects.deep_learning_sign_language.features.11

Principales fonctionnalités

Développement d'architectures CNN personnalisées pour reconnaissance de langue des signes

Implémentation de transfer learning VGG16 avec tête de classification personnalisée

Application de techniques d'augmentation de données complètes

Réalisation d'optimisation d'hyperparamètres avec GridSearchCV

Création de framework de réseaux de neurones pour analyse de données tabulaires

Atteinte de performance de modèle robuste avec point de contrôle et arrêt anticipé

Défis et solutions

Complexité de Classification d'Images

Traitement de reconnaissance de langue des signes nécessitant compréhension de formes et positions de main utilisant architectures CNN

Données d'Entraînement Limitées

Implémentation de techniques d'augmentation de données pour augmenter artificiellement taille de jeu de données et améliorer généralisation

Surapprentissage

Utilisation de couches dropout, arrêt anticipé et augmentation de données pour prévenir mémorisation de modèle

Sélection d'Hyperparamètres

Application de GridSearchCV pour recherche systématique d'hyperparamètres et validation croisée

Adaptation de Transfer Learning

Adaptation de modèle VGG16 pré-entraîné au domaine de langue des signes avec tête de classification personnalisée et fine-tuning

Ressources Computationnelles

Optimisation d'architectures avec conceptions efficaces, point de contrôle de modèles et arrêt anticipé pour gestion de ressources

Technologies

Deep Learning

TensorFlow Keras CNN VGG16 Transfer Learning

Neural Networks

Conv2D MaxPooling2D Dropout Dense Sequential

Data Augmentation

RandomFlip RandomRotation RandomZoom RandomTranslation RandomCrop Resizing Rescaling

Data Processing

Pandas NumPy Scikit-learn

Visualization

Matplotlib Seaborn Plotly

Optimization

GridSearchCV EarlyStopping ModelCheckpoint

Environment

Python Jupyter Notebook

Informations du projet

Statut
Completed
Année
2024
Architecture
Projet d'Apprentissage Profond Multi-Solution avec CNN Personnalisé, Transfer Learning VGG16 et Framework de Réseaux de Neurones
Category
Data Science