Python-Datenanalyse + Predictive Modelling: Daten bereinigen, visualisieren, statistische Modelle bauen — mit Pandas, NumPy, Matplotlib, scikit-learn.
Geprüft von Admin Kursweg · Stand 25. Mai 2026
Was wird in diesem Kurs vermittelt
Wer Python kennt und in Data Analytics einsteigt, braucht zwei Skill-Sets: explorative Datenanalyse (EDA) für das Verstehen von Daten und Predictive Modelling für die Vorhersage aus Daten. Dieser Kurs vermittelt beides praxisnah. Block Python-Setup für Data Science: Jupyter Notebook und JupyterLab, Anaconda-Distribution als All-in-One-Paket, virtuelle Umgebungen (conda env, venv), wichtige Pakete (NumPy, Pandas, scikit-learn, Matplotlib, Seaborn, SciPy). Block Daten laden und inspizieren: CSV, Excel, JSON, Parquet, SQL-Abfragen, Web-Scraping mit Beautiful Soup, API-Calls mit requests. Pandas-Inspektion (head, tail, info, describe, sample, shape, dtypes, isna, value_counts, unique, nunique). Block Daten-Cleaning: Missing Values (fillna mit Mittelwert/Median/Mode oder vorhergehender/folgender Wert, dropna für Komplett-Löschung), Duplikate erkennen und entfernen (duplicated, drop_duplicates), Outlier-Erkennung (IQR-Methode, Z-Score, Visual via Boxplots), Data-Type-Konvertierung (astype, pd.to_datetime, pd.to_numeric), String-Cleaning (strip, lower/upper, replace, regex). Block Feature Engineering: Aggregationen (groupby + agg), Pivot-Tabellen, Time-Based Features (Tag, Wochentag, Monat aus Datum extrahieren), Categorical Encoding (One-Hot mit pd.get_dummies, Label Encoding mit sklearn.preprocessing.LabelEncoder, Target Encoding), Numerical Scaling (StandardScaler für Mean=0/Std=1, MinMaxScaler für [0,1]), Binning kontinuierlicher Variablen. Block Explorative Datenanalyse (EDA): Univariate Analyse (Verteilungen via Histogram, Boxplot, KDE), Bivariate Analyse (Scatter-Plots, Korrelation, Crosstab für kategorische), Multivariate (Pair Plots, Heatmaps der Korrelations-Matrix), Visualisierung mit Matplotlib (low-level Kontrolle) und Seaborn (statistische Hochpegel-Plots). Block Predictive Modelling — Klassifikation: Train/Test/Validation-Split mit train_test_split, Klassifikations-Algorithmen (Logistic Regression, Decision Tree, Random Forest, Gradient Boosting mit XGBoost/LightGBM, K-Nearest Neighbors, Support Vector Machines), Metriken (Accuracy, Precision, Recall, F1, ROC-AUC, Confusion Matrix). Block Predictive Modelling — Regression: Lineare Regression (Simple, Multiple, mit Regularisierung wie Ridge/Lasso), Decision Tree Regression, Random Forest Regression, Gradient Boosting Regression, Metriken (MAE, MSE, RMSE, R²). Block Modell-Validierung und -Tuning: K-Fold Cross-Validation (cross_val_score, StratifiedKFold), Hyperparameter-Tuning mit GridSearchCV und RandomizedSearchCV, Lernkurven für Bias/Variance-Diagnose, Feature Importance.
Marktdaten zu Verdienst, offenen Stellen und Zukunftsaussicht im Bereich IT & Informatik
Einstieg
38.000–48.000 €
0–2 Jahre Erfahrung
Mittel
52.000–68.000 €
3–7 Jahre Erfahrung
Senior
70.000–95.000 €
8+ Jahre / Lead-Rolle
124.000+
IT-Berufe sind seit fünf Jahren der größte Fachkräfteengpass am deutschen Arbeitsmarkt. Der Bestand offener IT-Stellen ist 2024 auf einen Rekordstand gestiegen; AI- und Cloud-Skills werden in den nächsten Jahren weiter überdurchschnittlich nachgefragt.
Bei AZAV-zertifizierten Trägern ist die Kursgebühr regelmäßig zu 100 % förderbar.
Ja, Grundlagen sollten sitzen. Wer Python noch nie geschrieben hat, sollte erst einen Python-Vollkurs (z. B. „Python for Beginners") machen.
Pandas ist Industrie-Standard, sehr verbreitete Doku, große Community. Polars ist moderner (Rust-basiert, sehr schnell), aber kleinere Community. Wer beides können möchte: erst Pandas, später Polars als Performance-Upgrade.
Für Junior-Rollen ja. Senior-Rollen brauchen zusätzlich Deep Learning, Statistik-Tiefe, Domain-Wissen.
Ja, AZAV-Anbieter akzeptieren Bildungsgutschein, QCG.
Einstieg in Python: Syntax, Datentypen, Kontrollstrukturen, Funktionen und Fehlerbehandlung. Grundlage für Datenanalyse, Web-Entwicklung, Scripting und Automation. Keine Programmier-Vorkenntnisse nötig.
Sprachenübergreifender Einstiegskurs für Software-Entwicklung: Grundlagen-Konzepte, Programmiersprachen-Vergleich (Python, Java, C#, JavaScript), UML-Modellierung und SQL. Brücke aus dem Quereinstieg in einen spezialisierten Entwickler-Kurs.
Vertiefung nach dem Python-Grundkurs: objektorientierte Programmierung, Vererbung, GUI-Entwicklung, Datei- und Datenbank-Zugriff. Voraussetzung für Junior-Python-Entwickler-Positionen.
Von gestaltendem Webdesign zur echten Web-Entwicklung: JavaScript, jQuery, PHP und Ajax. Eigene Plugins anpassen, Slideshows steuern, dynamische Inhalte einbinden. Brücke für Designer mit Code-Ambition.
Sag uns einmal Region, Format (online/präsenz), Zeit-Modell und Förderstatus — wir vergleichen für dich und melden uns mit 1–3 passenden Trägern. Kostenlos, unverbindlich.
Typischer Verlauf nach dem Kurs
Quellen: Bundesagentur für Arbeit · Engpassanalyse 2024/25 · StepStone Gehaltsreport 2025 · Bitkom Studie Fachkräftemangel 2024. Brutto-Jahresgehälter aus Erhebungen 2024/25, abweichend nach Region und Tarifgebundenheit.