Machine Learning in R

Das Seminar richtet sich an R-NutzerInnen, die Machine Learning Algorithmen in R einsetzen wollen.

Lernziele und Agenda

Lernziele
  • Überblick über die verschiedenen Machine Learning Verfahren
  • Supervised vs. Unsupervised Learning
  • Möglichkeiten der OVerfitting-Kontrolle
  • Nicht-Black-Box-Verfahren (ALM, GLM, Rekursive Partitionierung etc.)
  • Black-Box-Verfahren (Neuronale Netzwerke, Boosting and Bagging, Random Forests, SVMs etc.)
  • Deep Learning in R: Hinweise zu Tensorflow und Einsatz von mxnet
  • Spezifikation von Hyperparametern (u.A. mit Grid Search, Random Grid Search)
  • Kennenlernen des mlr3-Framework(auf Nachfrage caret/tidymodels)
  • Fallstudie

Agenda

Tag 1:

  • Übersicht Algorithmen im Machine Learning
  • Supervised Learning: Überblick
  • Nicht-Black-Box-Verfahren I: OLS-Verfahren + Erweiterungen (ALM, GLM etc.), Recursive Partitioning (Bäume), Regularisierte Verfahren (Lasso, Ridge-Regression etc).
  • Black-Box-Verfahren: Neuronale Netzwerke, Random Forests, Boosting and Bagging, Support-Vector-Machines
  • Deep Learning
  • Overfitting-Kontrolle
  • Hyperparameter-Tuning (Grid Search, Random Grid Search)
  • Modellbeurteilung: Parameter zur Modellbeurteilung, Confusion Matrix, ROC-Kurve etc.
  • Hyperparameter-Tuning: Grid Search und Random Search
  • Machine Learning Frameworks in R: Das mlr3-Framework (auf Nachfrage: caret/tidymodels
  • Auf Nachfrage: Cox-Regression: Modelle zur Modellierung der Kundenabwanderung (churn prediction)
Fallstudie: Supervised Learning: Identifikation der Parametrisierung geeigneter Maschine Learning Algorithmen

Inhalt

Dieser Kurs richtet sich an alle, die Machine Learning einsetzen wollen, um optimierte Modelle für eine Problemstellung identifizieren und einsetzen zu können.

Dieser Kurs beschäftigt sich speziell mit der Modellierungsphase im CRISP-DM-Prozess, in welcher die aufbereiteten Daten dann tatsächlich modelliert werden.

Aufgrund des nicht geringen Angebots unterschiedlicher Modellierungsverfahren, bei die meisten noch über Hyperparameter spezifiziert werden können, ist dieser Schritt keineswegs trivial! Im Zentrum der Modellierungsphase steht daher die Auswahl geeigneter Modellierungsverfahren und das Finden der besten Hyperparameterwerte.

Erschwert wird diese Suchphase durch die je nach Methode unterschiedlich langen Modellierungszeiten und dem Problem des Overfittings. Strategien werden vermittelt, um Overfitting zu kontrollieren zu können.

Das Seminar Machine Learning Algorithem in R erleichtert den Einstieg, denn of ist im Vorfeld nicht klar, welche Verfahren geeignet sind und wie deren Hyperparameter einzustellen sind. Um den Einsatz vieler verschiedener Modellierungsmethoden und die Variation der Hyperparameter zu ermöglichen, werden Sie mit Grid Search und Random Grid Search, sowie der Entwicklung eigener Verfahren, Techniken kennenlernen, die Ihnen dies erleichtern.

Die praktische Umsetzung wird mittlerweile durch zwei Data Science Frameworks in R unterstützt: das mlr3-Framework und das caret/tidymodels-Framework. Beide Frameworks erlauben das einfache Ansteuern zahlreicher Algorithmen und deren Hyperparameter-Tuning. Die Ergebnisse können dann einfach verglichen und das beste Modell basierend auf typischen Fit-Maßen (Accuracy, AUC etc.) ausgewählt werden. Neben diesen beiden Frameworks wird zudem gezeigt, wie ein Modell-Tuning mit eigenen Verfahren durchgeführt werden kann.

Umsetzung: Neben dem Überblick über die einschlägigen Modellierungstechniken und typischen Anwendungsszenarien wird die praktische Umsetzung an einer Fallstudie (Supervised Learning) in R erprobt.

INHOUSE-SEMINAR

LEIDER KÖNNEN WIR MOMENTAN KEINE OFFENEN SCHULUNGEN IN WIESBADEN DURCHFÜHREN. NUTZEN SIE UNSER WEBINAR-ANGEBOT!

1.290,00
pro Tag bis 4 Teilnehmer zzgl. gesetzlicher Umsatzsteuer

  • Alle Inhalte der Inhouse-Seminare werden individuell zugeschnitten und zielgruppenspezifisch vermittelt.
    Intensive Nachbetreuung ermöglicht den Teilnehmern ihre Kenntnisse in kürzester Zeit umzusetzen
    .
  • Empfohlene Seminardauer: 1 Tag
  • Leihgebühren Schulungsnotebook (auf Wunsch): 35,- Euro (pro Tag, pro Schulungsrechner)
  • Telefon: +49 611 531 500 91
  • E-Mail: training@masem-training.de

firmen webinar

Ideal für das Home-Office oder dezentrale Arbeitsgruppen

€990,00
pro Tag bis 4 Teilnehmer zzgl. gesetzlicher USt - befristetes Angebot bis zum 31.12.2020, danach €1.290,00 netto

  • Bei Seminaren in unserem virtuellen Klassenzimmer genießen Sie alle Vorteile der Inhouse-Seminare. Dabei nutzen Sie Ihre eigenen Rechner und erhalten von uns den gleichen Service in der gleichen hohen Qualität bei weniger Aufwand!
  • Kursdauer: Nach Absprache!
  • Telefon: +49 611 531 500 91
  • E-Mail: training@masem-training.de

Hintergrundinformationen zu R

Sie wollen, ehe Sie ein R Seminar buchen, etwas mehr erfahren, was R ist und kann? R ist eine Programmiersprache, die unter der GNU-Lizenz veröffentlich wurde. Hauptaugenmerk der Sprache liegt auf der Umsetzung statistischer Analysen und der effizienten Erstellung von Grafiken. Historisch ist R aus der (proprietären) Programmiersprache S entstanden, weswegen die beiden in weiten Teilen sehr ähnlich sind. Nachdem R über Jahre vorwiegend im Hochschulbereich eingesetzt wurde, wird seine Leistungsfähigkeit vor allem im Bereich der Data Science sehr geschätzt. Durch über 600 Zusatzpakete (Stand Ende 2019) sind nahezu alle bekannten statistischen Verfahren und Darstellungsmethoden verfügbar. R kann problemlos auf allen gängigen Plattformen (MS Windows Vista/7/8/Server 2008/10, Mac OS X, Linux Redhat/Debian/sus/ubuntu) installiert werden. Mit der Installation von R wird zugleich auch eine Programmierumgebung installiert. Die meisten Anwenderinnen und Anwender verwenden jedoch RStudio® um R möglichst komfortabel zu nutzen. Auch RStudio® ist für fast alle gängigen Betriebssysteme verfügbar und steht in zwei verschiedenen Varianten zur Verfügung. Neben den freien Desktop und Server-Installationen stehen noch kostenpflichtige Angebote zur Verfügung, die darüber hinaus besseren Service und Dashboards und Systeme zur Projektorganisation bereitstellen. Hier finden Sie eine Übersicht über die Unterschiede der einzelnen Systeme. Für die R Seminare die masem training anbietet wird im Regelfall auf die freie Desktop-Installation von RStudio® zurückgegriffen. Shiny® von RStudio® ermöglicht es zudem komfortabel R-basierte Applikationen zu entwickeln, die eine interaktive Datenanalyse für die Betrachter ermöglichen. So können interaktive Grafiken Ihre Daten schnell und aussagekräftig visualisieren oder mit Widgets Tabellen so konstruiert werden, wie sie für die aktuelle Aufgabe benötigt werden.