Python für Datenanalyse — Pandas, NumPy, Datenbereinigung, Transformation, Visualisierung. Plus MS Teams für Daten-Teams.
Geprüft von Admin Kursweg · Stand 25. Mai 2026
Was wird in diesem Kurs vermittelt
Data Wrangling (auch Data Munging) ist die Disziplin, rohe Daten in analysierbare Form zu transformieren — laut Studien verbringen Data Scientists 60-80% ihrer Zeit damit. Dieser Kurs vermittelt Python-Skills für effektives Data Wrangling. Python für Daten (5 Wochen): 1. Python-Foundations für Data — Pandas-fokussierte Python-Inhalte (Sprache, Datentypen, List/Dict/Set Comprehensions, Generators, Functions, OOP-Basics für Custom Classes). Jupyter-Notebooks als Standard-Tool, JupyterLab oder VS Code mit Jupyter-Extension. uv als modernes Package-Management. 2. NumPy (1 Woche) — n-dimensionale Arrays als Grundlage für Pandas, Broadcasting für vektorisierte Operations (10-100x schneller als Python-Loops), Array-Operations (Slicing, Indexing mit Boolean Masks, Fancy Indexing), Linear Algebra mit numpy.linalg, Random Number Generation mit numpy.random Generator (modern API since NumPy 1.17). 3. Pandas Foundations (1 Woche) — Series und DataFrames als zentrale Strukturen, Reading/Writing Files (read_csv mit allen Optionen wie chunksize für große Files, read_excel, read_sql, read_json, read_parquet als modern columnar Format, read_html für Tables on Webpages). Index-Manipulation (set_index, reset_index, MultiIndex für hierarchische Indizes). Selecting Data (.loc Label-based, .iloc Position-based, .at und .iat für skalare Werte, Boolean Indexing mit complex Conditions). 4. Data Cleaning (2 Wochen) — Missing Data Handling (isna/isnull, dropna mit Threshold, fillna mit fixed value oder ffill/bfill/interpolate für Time Series, drop für komplette Spalten/Zeilen), Duplicates (duplicated, drop_duplicates), Data Types Conversion (astype, to_datetime, to_numeric mit errors=coerce für Robustness, Categorical für Memory-Effizienz). String Cleaning (.str-Accessor mit str.strip/upper/lower/replace/extract mit Regex, str.contains für Filter). Outlier Detection (Z-Score, IQR Interquartile Range, Isolation Forest für ML-basiert) und Treatment (Removal vs. Winsorization vs. Imputation). 5. Data Transformation (2 Wochen) — GroupBy mit Aggregations (sum, mean, count, std, custom Funktionen mit agg/apply/transform), Pivot Tables mit pd.pivot_table und df.pivot, Melt für Long-to-Wide-Reverse, Stack/Unstack für MultiIndex-Manipulation. Merging und Joining (merge mit how inner/outer/left/right, on und left_on/right_on, concat für Vertical/Horizontal Stacking, join für Index-based). Apply für Custom-Transformationen pro Row/Column. 6. Time Series (1 Woche) — DatetimeIndex, Resampling mit resample (Downsampling mean/sum/last, Upsampling mit Interpolation), Rolling Windows (rolling für Moving Averages, expanding für cumulative), Lag-Features mit shift, Time-Zone-Handling. 7. Visualisierung — Matplotlib als Foundation (Figure/Axes-Objektmodell), Seaborn als High-Level-Wrapper (pairplot, heatmap, boxplot, violinplot für Statistical Plots), Plotly für interaktive Charts (Hover, Zoom, Export). 8. Workflow-Optimierung — Profiling mit pandas-profiling oder ydata-profiling für Quick Data Exploration, Polars als High-Performance-Alternative zu Pandas (Rust-basiert, mehrfach schneller, Lazy Evaluation), DuckDB als Embedded OLAP für SQL-auf-Files (CSV/Parquet direkt querybar). MS Teams für Daten-Teams (1 Tag): Code-Sharing mit Code Snippets in Channels, Jupyter-Notebook-Sharing, Loop für gemeinsame Analyse-Ergebnisse.
Marktdaten zu Verdienst, offenen Stellen und Zukunftsaussicht im Bereich IT & Informatik
Einstieg
38.000–48.000 €
0–2 Jahre Erfahrung
Mittel
52.000–68.000 €
3–7 Jahre Erfahrung
Senior
70.000–95.000 €
8+ Jahre / Lead-Rolle
124.000+
IT-Berufe sind seit fünf Jahren der größte Fachkräfteengpass am deutschen Arbeitsmarkt. Der Bestand offener IT-Stellen ist 2024 auf einen Rekordstand gestiegen; AI- und Cloud-Skills werden in den nächsten Jahren weiter überdurchschnittlich nachgefragt.
Bei AZAV-zertifizierten Trägern ist die Kursgebühr regelmäßig zu 100 % förderbar.
Pandas Standard (riesige Community, viele Tutorials). Polars Performance-King (5-10x schneller, modern Syntax). Im Kurs Pandas primär, Polars als Outlook.
Data Wrangling als Pre-ML-Step. Vertiefung in ML in „Python for Data Analytics and Machine Learning" Aufbaukurs.
Public Datasets (Kaggle, UCI, Government Open Data, eigene Beispiele aus typischen Geschäftsdaten).
Ja, als zertifizierte Weiterbildung mit Bildungsgutschein in der Regel zu 100% förderfähig.
Einstieg in Python: Syntax, Datentypen, Kontrollstrukturen, Funktionen und Fehlerbehandlung. Grundlage für Datenanalyse, Web-Entwicklung, Scripting und Automation. Keine Programmier-Vorkenntnisse nötig.
Sprachenübergreifender Einstiegskurs für Software-Entwicklung: Grundlagen-Konzepte, Programmiersprachen-Vergleich (Python, Java, C#, JavaScript), UML-Modellierung und SQL. Brücke aus dem Quereinstieg in einen spezialisierten Entwickler-Kurs.
Vertiefung nach dem Python-Grundkurs: objektorientierte Programmierung, Vererbung, GUI-Entwicklung, Datei- und Datenbank-Zugriff. Voraussetzung für Junior-Python-Entwickler-Positionen.
Von gestaltendem Webdesign zur echten Web-Entwicklung: JavaScript, jQuery, PHP und Ajax. Eigene Plugins anpassen, Slideshows steuern, dynamische Inhalte einbinden. Brücke für Designer mit Code-Ambition.
Sag uns einmal Region, Format (online/präsenz), Zeit-Modell und Förderstatus — wir vergleichen für dich und melden uns mit 1–3 passenden Trägern. Kostenlos, unverbindlich.
Typischer Verlauf nach dem Kurs
Quellen: Bundesagentur für Arbeit · Engpassanalyse 2024/25 · StepStone Gehaltsreport 2025 · Bitkom Studie Fachkräftemangel 2024. Brutto-Jahresgehälter aus Erhebungen 2024/25, abweichend nach Region und Tarifgebundenheit.