Webinare: GRUNDLAGEN Machine Learning mit Python
IHR SCHNELLER EINSTIEG!
Termine: 15. bis 18. April 2024; 10. bis 13. Juni 2024 und 07. bis 10. Oktober 2024
Webinar 1: Python Grundlagen; Datenaufbereitung mit NumPy und pandas
Python hat sich mittlerweile zum Standard im Bereich Machine Learning entwickelt. Aber nicht Python alleine: vielmehr sind es die Pakete NumPy, pandas, scikit-learn und matplotlib, die das erst ermöglicht haben.
NumPy stellt Arrays zum Umgang mit im Machine Learning typischen Datenstrukturen zur Verfügung. Viele im Machine Learning eingesetzte Pakete setzen NumPy-Objekte voraus. Sollen stärker heterogene Datenstrukturen genutzt werden (meint: vergleichbar zu relationalen Tabellen in Datenbanken) dann stellt pandas den de-facto-Standard da. Das Seminar starten mit einem Überblick in Python. Programmierkenntnisse in einer Programmiersprache werden vorausgesetzt.
Inhalte:
-
Python Basics, Built-in Types, Data Structures, Sequences, Control Flow, Functions
- NumPy Basics: Arrays and Vectorized Computation (Indexing, Slicing)
-
pandas Data Structures: Series, DataFrame, Index Objects inkl. Loading, Storage and File Formats
Webinar 2: Datenaufbereitung mit pandas, Visualisierungen mit matplotlib.
Das Seminar knüpft an das erste Webinar (PythonGrundlagen; Datenaufbereitung mit NumPy und pandas) an. Mit pandas lassen sich auch heterogene Datenstrukturen (meint: vergleichbar zu relationalen Tabellen in Datenbanken) transformieren. Mit dem Paket matplotlib lassen sich die Daten dann auch schnell visuell darstellen. Eine Besonderheit stellt noch das Paket seaborn da: das Paket nutzt sowohl pandas als auch matplotlib um Grafiken schnell erstellen zu können.
Inhalte:
-
Data Clearning and Preparation with pandas
-
Merging multiple data sets: Join and Combine
-
Data Aggregations and Group Operations with pandas: Reshape, Aggregations, Grouping
-
matplotlib API Primer, Figures and Subplots
-
Colors, Markers, Line Styles, Ticks, Labels, Legends, Annotations and Drawings, Saving Plots to a File
-
Plotting with pndas and seaborn: Line Plots, Bar Plots, Histograms and Density Plots, Scatter or Point Plots
Webinar 3: Grundlagen Überwachtes Lernen mit scikit-learn
Beim Überwachten Lernen wird ein Modell trainiert, dass eine Zielvariable (z.B. Kauf/Nicht-Kauf, Kundenabwanderung (ja/nein), Wert des Einkaufs) basierend auf geeigneten Inputvariablen (Features) vorhersagen soll. Je nach Zielvariable wird von Regression (Wert des Einkaufs) oder Classification (Kauf/Nicht-Kauf) gesprochen. Diese Modelle können bequem mit dem Paket scikit-learn trainiert werden. Das Modelltraining sollte dabei auf Overfitting kontrolliert werden: so kann ein Algorithmus die Trainingsdaten nutzen, um perfekt die Zielvariable vorherzusagen, kommen aber neue Daten ins Spiel, so klappt es oft weniger gut. Diesen Trade-Off gilt es zu kontrollieren, um Modelle auch auf neue Daten anwenden zu können.
Inhalte:
-
Grundlagen scikit-learn
-
pandas und numpy-Daten zum Modelltraining nutzen
-
Typische Schritte in scikit-learn (Regression): Import der notwendigen Submodule, Erstellen eines Objekts, Fit der Daten, Ergebniskontrolle (Overfitting) mit geeigneten Fitmaßen, Vorhersagen mit dem trainierten Modell durchführen;
-
Klassifikation: Unterschiede zur Regression, Fit-Maße, Ergebniskontrolle;
-
Speichern und Deployment der trainierten Modelle;
Webinar 4: Deep Learning mit keras und TensorFlow inkl. Hinweise zum Reinforcement Learning
Unter Deep Learning werden tiefgestaftelte Neuronale Netzwerke verstanden, oder einfacher gesprochen: es handelt sich um komplexe Modelle, die die Verarbeitung von Informationen von Lebewesen nachzuahmen versuchen. Mit Deep Learning Modellen können auch Regressions- und Classification-Modelle (wie in Modul 3 beschrieben) trainiert werden. Dabei haben Deep Learning Modelle den Vorteil, dass zum einen die Datenmengen größer und auch komplexer sein können: das verarbeiten von Bildern in Form von 3-D-Arrays (z.B. NumPy ndarrays) ist ohne weitere möglich. Etabliert haben sich hier u.a. keras und TensorFlow.
Inhalte:
-
Grundlagen Deep Learning Modelle inkl. Netzwerktopologie und verschiedene Modellarten;
-
Regression mit keras und TensorFlow
-
Classification von Bildern mit keras und TensorFlow
-
Reinforcement Learning