Seminar Data Science mit Python
Präsenzveranstaltungen in Wiesbaden oder Online-Seminar an 2 Tagen: 1.190,- € pro Person (netto)
Wenn Sie schnell und effizient in die Data Science mit Python einsteigen möchten, ist dieses Seminar das Richtige für Sie!
Termine Offene Schulungen: 28./29.10.2024, 27./28.03.2025
LERNZIELE UND AGENDA
Hinweis: Mittlerweile liegt der Schwerpunkt auf Data Preparation, AutoML und MLflow
Lernziele:
-
Es werden die vier wichtigen Data Science Pakete: NumPy, Scikit learn, pandas, Matplotlib.
-
Data Preparation: Relevante Methoden der Datenaufbereitung: Behandlung fehlender Werte, Standardisierung, Ausreißer, unplausible Fälle. Transformationen von Variablen. Umgang mit Dummy-Variablen. Behandeln von Text und vieles mehr.
- Übersicht über die relevanten Machine Learning-Verfahren. Es wird ein Klassifikations- oder Regressions-Case im Seminar gerechnet.
- Modellevaluation und Hinweise zur Kontrolle des Overfittings.
- Automatisieren des Modellierens mit AutoML. Hyperparameter-Tuning mit AutoML. Feature Selection.
- Den kompletten Prozess mittels Pipeline abbilden: MLflow in der Praxis.
- Nutzen der beiden relevanten Deep Learning Frameworks: pyTorch und TensorFlow. Hier wird ein Modell gerechnet.
INHOUSE-SEMINAR
Seminardurchführung am Standort des Kunden
€1.390,00
pro Tag bis 4 Teilnehmer zzgl. gesetzlicher USt
Alle Inhalte der Inhouse-Seminare werden individuell zugeschnitten und zielgruppenspezifisch vermittelt.
Intensive Nachbetreuung ermöglicht den Teilnehmern ihre Kenntnisse in kürzester Zeit umzusetzen.
Empfohlene Seminardauer: 2 Tage
Leihgebühren Schulungsnotebook (auf Wunsch): 60,- Euro (pro Tag, pro Schulungsrechner)
WORKSHOP
Sie nennen uns Ihre Themen!
Preis auf Anfrage
zzgl. gesetzlicher USt und ggf. Reisekoste
Alle Inhalte des Workshops werden individuell zugeschnitten und zielgruppenspezifisch vermittelt.
Gerne führen wir den Workshop bei Ihnen vor Ort, in Wiesbaden oder online durch.
Leihgebühren Schulungsnotebook (auf Wunsch): 60,- Euro (pro Tag, pro Schulungsrechner)
Tag 1
-
Grundlagen Python für Data Science, Hilfe, Übersicht über wesentliche Ressourcen
-
Interaktives Arbeiten in Data Science Projekten mit Jupyter-Notebooks
-
Importieren von Daten mittels pandas aus Datenquellen wie SQL, MS Excel etc.
-
Analysieren der Daten mittels pandas und matplotlib sowie weiterer Pakete. Dabei liegt Fokus auf unplausiblen oder fehlenden Werten, Ausreißern, Verteilungen, Deskriptive Statistiken und Grafiken, Korrelationen/Heatmaps etc.
-
Aufbereiten der Daten für Analysezwecke auf Basis der gewonnenen Erkenntnisse: Ersetzen fehlender Werte, Verteilungstransformationen, Standardisierungen, Gewinnen von Subdatensätzen, Aufteilen in Test- und Trainingsdatensätze etc.
Tag 2
-
Modellierungsalgorithmen Teil 1: Grundlegende Verfahren für das supervised learning: Logistische Regressionsanalyse und einfache Bäume für kategoriale Zielvariablen sowie Multiple Lineare Regressionsmodelle für metrisch skalierte Zielvariablen (ggf. bereits am ersten Tag, je nach Fortschritt in der Gruppe)
-
Modell-Evaluation: Typische Outcome-Parameter nach Messniveau der Zielvariablen (MAE, MAPE, R-Quadrat), Accuracy, Confusion Matrix, AUC/ROC-Kurven, Übersicht weitere Parameter)
-
Modellierungsalgorithmen Teil 2: Fortgeschrittene (Black Box) Verfahren: Random Forests, Gradient Boosting, etc.
-
Ensemble-Verfahren: Ensemble-Verfahren, Bagging (Bootstrap Aggregation)
-
Hyperparameter-Tuning: Strategien, Grid-Search, Random-Search, Wahl eines Modells
-
Deep Learning mit TensorFlow und PyTorch: Grundlagen und einfache Modelle.
INHALT
Dieser zweitägige Kompaktkurs vermittelt die wesentlichen Fähigkeiten, um mit Python Machine Learning Fragestellungen bearbeiten zu können.
Warum Python? TIOBE hat Python insbesondere wegen der Nutzung im Machine Learning zur Programmiersprache des Jahres 2020 gewählt. Durch zahlreiche Zusatzpakete - numpy, pandas, scikit-learn, matplotlib, plotly etc. - lässt sich Python ideal für die Analyse und Aufbereitung von Daten, die Anwendung von Machine Learning Modellen, wie auch für das Deployment der erstellten Modelle nutzen.
Interaktives Arbeiten: Anders als in der klassischen Programmierung ist die Entwicklung von Machine Learning Modellen ein interaktiver Prozess: Zu Beginn eines Projekts ist selten klar, was die Daten hergeben, was an Datenaufbereitungen notwendig ist und wie aufwendig das Trainieren einer Vielzahl von Machine Leanrning Modellen ist. Dieser interaktive Prozess wird durch die Nutzung von Jupyter-Notebooks optimal unterstützt, da diese neben Python-Code auch das Einfügen von Texten mittels Markdown erlauben. Deshaln führen wir alle Übungen in Juypter-Notebooks durch.
Seminaraufbau: Der Seminaraufbau folgt dem CRISP-DM-Modell, dessen erste Schritte (Business Understanding, Data Understanding) einen erheblichen Mehrwert für die erfolgreiche Durchführung in Data Science-Projekten bieten. Die weiteren Schritte - Data Preparation und Modeling - werden heute oft stark agil umgesetzt. Die verbleibenden beide Schritte: Evaluation (in Hinblick auf das Erreichen der Business-Objectives) und Deployment sollen noch einmal verdeutlichen, dass Data Science Projekte nicht im luftleeren Raum entwickelt werden, sondern z.B. einen positiven RoI liefern oder andere Business Objectives erfüllen sollen.
Seminarinhalte: Die Seminarinhalte sind von Data Science-Expertinnen entwickelt worden, addressieren also Ihre Bedürfnisse in der betrieblichen Praxis. Einen detaillierten Überblick über die Seminarinhalte finden Sie in der Agenda. Alle Themen werden immer praktisch in den o.g. Jupyter-Notebooks umgesetzt. Die Geschwindigkeit richtet sich dabei nach dem Fortschritt in der Gruppe. Durch die sehr kleinen Gruppengrößen (Präsenzveranstaltungen in Wiesbaden werden mit maximal 4 Teilnehmer:innen durchgeführt) kann auch auf individuelle Fragen eingegangen werden.
Angebotsgarantie: Unser Service für Sie: Die Präsenzseminare in Wiesbaden werden bereits ab einer Anmeldung durchgeführt!