📊

Tödliche Polizeischüsse Datenanalyse

Completed 2024 Umfassende Datenanalyse-Pipeline mit statistischen Tests und Visualisierung

Dieses Projekt ist eine umfassende Datenanalyse-Studie tödlicher Interaktionen zwischen Strafverfolgung und Bürgern in den USA. Die Analyse umfasst Daten von 2015 bis 2024, untersucht tödliche Polizeischüsse, Strafverfolgungs-Todesfälle, demografische Muster, geografische Verteilungen, zeitliche Trends und statistische Beziehungen. Das Projekt verwendet mehrere Datensätze von Washington Post und anderen Quellen, um Einblicke in Polizei-Bürger-Interaktionen, psychische Gesundheitsfaktoren, rassische Disparitäten und Strafverfolgungs-Agentur-Beteiligung zu bieten. Es umfasst statistische Hypothesentests (t-Tests, ANOVA, Chi-Quadrat), lineare Regression für zeitliche Trends, geografische Visualisierung auf USA-Karten und umfassende Kreuz-Analyse mehrerer Variablen.

Data Science Python-Entwicklung Statistische Analyse Datenvisualisierung Geografische Analyse Sozialwissenschaft Öffentliche Politik

Übersicht

Dieses Projekt ist eine umfassende Datenanalyse-Studie tödlicher Interaktionen zwischen Strafverfolgung und Bürgern in den USA. Die Analyse umfasst Daten von 2015 bis 2024, untersucht tödliche Polizeischüsse, Strafverfolgungs-Todesfälle, demografische Muster, geografische Verteilungen, zeitliche Trends und statistische Beziehungen. Das Projekt verwendet mehrere Datensätze von Washington Post und anderen Quellen, um Einblicke in Polizei-Bürger-Interaktionen, psychische Gesundheitsfaktoren, rassische Disparitäten und Strafverfolgungs-Agentur-Beteiligung zu bieten. Es umfasst statistische Hypothesentests (t-Tests, ANOVA, Chi-Quadrat), lineare Regression für zeitliche Trends, geografische Visualisierung auf USA-Karten und umfassende Kreuz-Analyse mehrerer Variablen.

Schlüsselfunktionen

Umfassende Analyse tödlicher Polizeischüsse (2015-2024)

Geografische Visualisierung auf USA-Karten mit GeoPandas

Statistische Hypothesentests (t-Tests, ANOVA, Chi-Quadrat)

Lineare Regression für zeitliche Trends

Demografische Analyse (Alter, Geschlecht, Rasse) mit statistischen Tests

Psychische Gesundheitsfaktor-Analyse und Kreuz-Analyse

Strafverfolgungs-Agentur-Analyse und Rankings

Zeitliche Analyse (monatliche Trends, saisonale Muster)

Staatliche und County-Ebene Todesfall-Zähl-Analyse

Vergleichende Analyse von Strafverfolger vs. Zivilisten-Todesfällen

pages.portfolio.projects.fatal_police_shootings_analysis.features.10

Technische Highlights

Analyse mehrerer Datensätze von Washington Post und anderen Quellen

Erstellung geografischer Visualisierungen auf USA-Karten mit Ereignis-Standorten

Durchführung umfassender statistischer Hypothesentests

Identifikation zeitlicher Trends mit linearer Regression

Analyse demografischer Muster mit ordnungsgemäßen statistischen Methoden

Untersuchung psychischer Gesundheitsfaktoren und ihrer Beziehungen

Herausforderungen und Lösungen

Mehrere Datenquellen

Integration von Daten aus mehreren Quellen mit verschiedenen Formaten unter Verwendung standardisierter Lade- und Bereinigungs-Verfahren

Fehlende Daten

Sorgfältige Analyse und Handhabung fehlender Werte in kritischen Spalten wie oricodes und demografischen Daten

Geografische Daten

Konvertierung von Standortdaten in geografische Koordinaten mit GeoPandas und Shapely

Statistische Test-Annahmen

Verifizierung von Annahmen (Normalität, Unabhängigkeit) vor Durchführung statistischer Tests

Große Datensatz-Verarbeitung

Optimierung von Pandas-Operationen und Verwendung von Chunk-Verarbeitung zur effizienten Handhabung großer Datensätze

Zeitliche Analyse

Implementierung von Zeitreihen-Aggregation, linearer Regression und zeitlichen Visualisierungen zur Trend-Analyse

Technologien

Data Processing

Pandas NumPy xlrd

Visualization

Matplotlib Seaborn GeoPandas WordCloud

Statistical Analysis

SciPy Hypothesis Testing Regression Analysis

Geographic

Shapely GeoPandas

Data

Python Jupyter Notebook

Projektinformationen

Status
Completed
Jahr
2024
Architektur
Umfassende Datenanalyse-Pipeline mit statistischen Tests und Visualisierung
Category
Data Science