Kompaktkurs Data Science mit Python®

Wenn Sie schnell und effizient in die Data Science mit Python® einsteigen möchten, ist das hier das richtige Seminar für Sie!

Termine Offene Schulungen


10.12. - 11.12.2020 (Webinar); 10.01.- 11.01.2021 (Webinar)  

Nächstes Seminar: 10. und 11. Dezember 2020

Lernziele und Agenda

Ziele:
  • Übersicht über wichtige Data Science Pakete
  • Vorstellung von Anaconda® und Jupyter-Notebooks®
  • Umgang mit Daten in Python® (z.B. pandas) erlernen 
  • Erstellen von Grafiken erlernen 
  • Umgang mit statistischen Funktionen erlernen 
  • Komplexere Machine Learning Methoden einsetzen
Agenda:
  • Grundlagen Python® für Data Science 
  • Das Framework Anaconda® und Jupyter-Notebooks®
  • Importieren von Daten in Python aus Datenquellen wie SQL, MS Excel® etc.
  • Data Handling und Datentypen in Python und die Nutzung des Pakets pandas 
  • Eingabe, Speicherung, Import und Export von Daten / Datensätzen Abfrage von Daten und das Verwalten von Unterdatensätzen – Subskripte, Subsets etc.
  • Transformation und Manipulationen (Rekodierungen, Fehlende Werte, Merging) 
  • Zusammenfassungen 
  • Umgang mit fehlenden Werten 
  • Statistische Analysen in Python®
  • Grundlegende statistische Befehle: Lage- und Streuparameter, Parameter höherer Ordnung 
  • Einfache statistische Funktionen 
  • Zentrale statistische Tests 
  • Supervised Learning mit dem scikit-learn-Paket 
  • Unsupervised Learning in Python®
  • Grundlagen der Visualisierung in Python®
  • Fallstudie

Inhalt

Dieser zweitägige Kompaktkurs richtet sich an Nicht-InformatikerInnen, die die wesentlichen Fähigkeiten erwerben möchten, um mit Python® eigene Analysen an Datensätzen durchführen zu können.

Neben anderen hat sich Python® in den letzten Jahren zu einer der etabliertesten Programmiersprachen entwickelt. Im Januar 2020 belegte es Platz 2 im RedMonk Ranking der wichtigsten Programmiersprachen.

Gerade in der Data Science ist Python® sehr beliebt. Erleben Sie in diesem Seminar selbst, dass Python® diese Beliebtheit wirklich verdient!

Einleitend wird das Framework Anaconda® vorgestellt. Dieses erleichtert die Administration (nicht nur von Python®) ungemein und ist gerade für Einsteiger durchaus zu empfehlen. Als Programmierumgebung (IDE) verwenden wie im Seminar die beliebten und branchenübergreifend verbreiteten Jupyter-Notebooks®. Diese ermöglichen auch, den Code mittels Markdown-Textelementen umfangreich zu erläutern und in Abschnitte zu gliedern.

Data handling, also das Importieren, Aneinanderfügen und Trennen von Daten und hierfür sinnvolle Pakete (z.B. pandas) werden demonstriert und zur Vertiefung im Seminar immer wieder geübt.

Besonderes Augenmerk richtet das Seminar auf der Transformation von Daten. Dies umfasst die grundsätzliche Aufbereitung der Daten, sodass diese statistisch analysiert werden können, aber auch die Analyse von fehlenden Werten und den Umgang damit.
Diese Inhalte werden ebenfalls immer wieder geübt, da es Arbeitsschritte sind, die auch im Alltag immer wieder und nicht nur in einzelnen Projektabschnitten anfallen.

Nach der Aufbereitung der Daten werden die grundlegenden statistischen Verfahren und Lageparameter vorgestellt. Dies ist notwendig, um die nachfolgenden Tests verstehen und beurteilen zu können. Diese univariaten (auf ein Merkmal bezogenen) Verfahren dienen auch dazu, sich mit den Daten vertraut zu machen und ein Gefühl für mögliche Ergebnisse zu bekommen (oder vielmehr: schnell zu merken, wenn etwas ganz sicher so nicht korrekt sein kann - zum Beispiel weil durch einen Filter die Fallzahlen nicht stimmen).

Den Übergang zum Maschinenlernen, stellen die statistischen Funktionen und Tests dar. Regelmäßig wird hier ein kurzer Überblick gegeben, denn dieses Data Science mit Python® Seminar kann und will keinen Statistik Kurs ersetzen.

Einen eigenen Block nehmen die Verfahren des machine learnings ein. Hier werden die beiden Verfahren des supervised und unsupervised learnings, also des überwachten und nicht-überwachten Lernens, besprochen. Die Unterschiede und mögliche Anwendungsgebiete beider Verfahren werden besonders praxisnah dargelegt und runden das Seminar inhaltlich ab.

Zusätzlich zu diesen klassischen "Basics" der Data Science mit Python® gibt das Seminar noch einen Überblick über die wichtigsten Möglichkeiten der Visualisierung in Python®. 

Konkret angewendet werden soll das Erlernte am Ende des Seminars in einer kleinen Fallstudie.

INHOUSE-SEMINAR

LEIDER KÖNNEN WIR MOMENTAN KEINE OFFENEN SCHULUNGEN IN WIESBADEN DURCHFÜHREN. NUTZEN SIE UNSER WEBINAR-ANGEBOT!

1.290,00
pro Tag bis 4 Teilnehmer zzgl. 19% MwSt

  • Alle Inhalte der Inhouse-Seminare werden individuell zugeschnitten und zielgruppenspezifisch vermittelt.
    Intensive Nachbetreuung ermöglicht den Teilnehmern ihre Kenntnisse in kürzester Zeit umzusetzen
    .
  • Empfohlene Seminardauer: 2 Tage
  • Leihgebühren Schulungsnotebook (auf Wunsch): 35,- Euro (pro Tag, pro Schulungsrechner)
  • Telefon: +49 611 531 500 91
  • E-Mail: training@masem.de

firmen webinar

Ideal für das Home-Office oder dezentrale Arbeitsgruppen

€990,00
pro Tag bis 4 Teilnehmer zzgl. 19% MwSt

  • Bei Seminaren in unserem virtuellen Klassenzimmer genießen Sie alle Vorteile der Inhouse-Seminare. Dabei nutzen Sie Ihre eigenen Rechner und erhalten von uns den gleichen Service in der gleichen hohen Qualität bei weniger Aufwand!
  • Kursdauer: Nach Absprache!
  • Telefon: +49 611 531 500 91
  • E-Mail: training@masem.de