Apprentissage Profond - Classification de Langue des Signes
Ce projet explore techniques d'apprentissage profond pour classification d'images et modélisation de réseaux de neurones. L'objectif principal est développement d'un système de reconnaissance d'alphabet de langue des signes utilisant jeu de données Sign Language MNIST, où le but est classifier signes de main statiques représentant lettres A-Z (excluant J et Z qui nécessitent mouvements dynamiques). Le projet inclut également un framework pour régression/classification de réseaux de neurones sur jeu de données Heart Disease UCI. Le projet démontre plusieurs approches: architectures CNN personnalisées construites à partir de zéro, transfer learning avec modèles pré-entraînés (VGG16), techniques d'augmentation de données (RandomFlip, RandomRotation, RandomZoom, RandomTranslation, RandomCrop) et optimisation d'hyperparamètres utilisant GridSearchCV.
Aperçu
Ce projet explore techniques d'apprentissage profond pour classification d'images et modélisation de réseaux de neurones. L'objectif principal est développement d'un système de reconnaissance d'alphabet de langue des signes utilisant jeu de données Sign Language MNIST, où le but est classifier signes de main statiques représentant lettres A-Z (excluant J et Z qui nécessitent mouvements dynamiques). Le projet inclut également un framework pour régression/classification de réseaux de neurones sur jeu de données Heart Disease UCI. Le projet démontre plusieurs approches: architectures CNN personnalisées construites à partir de zéro, transfer learning avec modèles pré-entraînés (VGG16), techniques d'augmentation de données (RandomFlip, RandomRotation, RandomZoom, RandomTranslation, RandomCrop) et optimisation d'hyperparamètres utilisant GridSearchCV.
Fonctionnalités clés
Architectures CNN personnalisées construites à partir de zéro pour classification de langue des signes
Transfer learning VGG16 avec poids ImageNet pré-entraînés
Augmentation de données avec 7+ techniques (flip, rotation, zoom, translation, crop)
Réglage d'hyperparamètres avec GridSearchCV
Point de contrôle de modèles et arrêt anticipé
Classification 24 classes (lettres A-Z excluant J, Z)
Framework de réseaux de neurones pour données tabulaires (Heart Disease UCI)
Plusieurs approches de solution (3 implémentations différentes)
Persistance de modèles et préservation de mappage de classes
Métriques d'évaluation complètes (précision, rappel, F1-score)
pages.portfolio.projects.deep_learning_sign_language.features.10
pages.portfolio.projects.deep_learning_sign_language.features.11
Principales fonctionnalités
Développement d'architectures CNN personnalisées pour reconnaissance de langue des signes
Implémentation de transfer learning VGG16 avec tête de classification personnalisée
Application de techniques d'augmentation de données complètes
Réalisation d'optimisation d'hyperparamètres avec GridSearchCV
Création de framework de réseaux de neurones pour analyse de données tabulaires
Atteinte de performance de modèle robuste avec point de contrôle et arrêt anticipé
Défis et solutions
Complexité de Classification d'Images
Traitement de reconnaissance de langue des signes nécessitant compréhension de formes et positions de main utilisant architectures CNN
Données d'Entraînement Limitées
Implémentation de techniques d'augmentation de données pour augmenter artificiellement taille de jeu de données et améliorer généralisation
Surapprentissage
Utilisation de couches dropout, arrêt anticipé et augmentation de données pour prévenir mémorisation de modèle
Sélection d'Hyperparamètres
Application de GridSearchCV pour recherche systématique d'hyperparamètres et validation croisée
Adaptation de Transfer Learning
Adaptation de modèle VGG16 pré-entraîné au domaine de langue des signes avec tête de classification personnalisée et fine-tuning
Ressources Computationnelles
Optimisation d'architectures avec conceptions efficaces, point de contrôle de modèles et arrêt anticipé pour gestion de ressources
Technologies
Deep Learning
Neural Networks
Data Augmentation
Data Processing
Visualization
Optimization
Environment
Informations du projet
- Statut
- Completed
- Année
- 2024
- Architecture
- Projet d'Apprentissage Profond Multi-Solution avec CNN Personnalisé, Transfer Learning VGG16 et Framework de Réseaux de Neurones
- Category
- Data Science