📊

Analyse de Données de Tirs Policiers Fatals

Completed 2024 Pipeline d'Analyse de Données Complet avec Tests Statistiques et Visualisation

Ce projet est une étude d'analyse de données complète d'interactions fatales entre forces de l'ordre et citoyens aux USA. L'analyse couvre données de 2015 à 2024, examinant tirs policiers fatals, décès de forces de l'ordre, motifs démographiques, distributions géographiques, tendances temporelles et relations statistiques. Le projet utilise plusieurs jeux de données de Washington Post et autres sources pour fournir insights sur interactions police-civils, facteurs de santé mentale, disparités raciales et implication d'agences de forces de l'ordre. Il inclut tests d'hypothèses statistiques (tests t, ANOVA, chi-carré), régression linéaire pour tendances temporelles, visualisation géographique sur cartes USA et analyse croisée complète de plusieurs variables.

Data Science Développement Python Analyse Statistique Visualisation de Données Analyse Géographique Science Sociale Politique Publique

Aperçu

Ce projet est une étude d'analyse de données complète d'interactions fatales entre forces de l'ordre et citoyens aux USA. L'analyse couvre données de 2015 à 2024, examinant tirs policiers fatals, décès de forces de l'ordre, motifs démographiques, distributions géographiques, tendances temporelles et relations statistiques. Le projet utilise plusieurs jeux de données de Washington Post et autres sources pour fournir insights sur interactions police-civils, facteurs de santé mentale, disparités raciales et implication d'agences de forces de l'ordre. Il inclut tests d'hypothèses statistiques (tests t, ANOVA, chi-carré), régression linéaire pour tendances temporelles, visualisation géographique sur cartes USA et analyse croisée complète de plusieurs variables.

Fonctionnalités clés

Analyse complète de tirs policiers fatals (2015-2024)

Visualisation géographique sur cartes USA avec GeoPandas

Tests d'hypothèses statistiques (tests t, ANOVA, chi-carré)

Régression linéaire pour tendances temporelles

Analyse démographique (âge, genre, race) avec tests statistiques

Analyse de facteurs de santé mentale et analyse croisée

Analyse d'agences de forces de l'ordre et classements

Analyse temporelle (tendances mensuelles, motifs saisonniers)

Analyse de nombre de décès au niveau état et comté

Analyse comparative de décès de forces de l'ordre vs civils

pages.portfolio.projects.fatal_police_shootings_analysis.features.10

Principales fonctionnalités

Analyse de plusieurs jeux de données de Washington Post et autres sources

Création de visualisations géographiques sur cartes USA montrant emplacements d'événements

Réalisation de tests d'hypothèses statistiques complets

Identification de tendances temporelles utilisant régression linéaire

Analyse de motifs démographiques avec méthodes statistiques appropriées

Examen de facteurs de santé mentale et leurs relations

Défis et solutions

Sources de Données Multiples

Intégration de données de plusieurs sources avec formats différents utilisant procédures de chargement et nettoyage standardisées

Données Manquantes

Analyse et gestion soignées de valeurs manquantes dans colonnes critiques comme oricodes et données démographiques

Données Géographiques

Conversion de données de localisation en coordonnées géographiques utilisant GeoPandas et Shapely

Hypothèses de Tests Statistiques

Vérification d'hypothèses (normalité, indépendance) avant réalisation de tests statistiques

Traitement de Grand Jeu de Données

Optimisation d'opérations Pandas et utilisation de traitement par morceaux pour gestion efficace de grands jeux de données

Analyse Temporelle

Implémentation d'agrégation de séries temporelles, régression linéaire et visualisations temporelles pour analyse de tendances

Technologies

Data Processing

Pandas NumPy xlrd

Visualization

Matplotlib Seaborn GeoPandas WordCloud

Statistical Analysis

SciPy Hypothesis Testing Regression Analysis

Geographic

Shapely GeoPandas

Data

Python Jupyter Notebook

Informations du projet

Statut
Completed
Année
2024
Architecture
Pipeline d'Analyse de Données Complet avec Tests Statistiques et Visualisation
Category
Data Science