OFFENE SCHULUNG
oder Online-Seminar
- Präsenzveranstaltungen finden in Wiesbaden statt und werden ab zwei Anmeldung durchgeführt (Angebotsgarantie)
- Telefon: +49 611 531 500 91
- E-Mail: training@masem-training.de
Seminar für alle die Data Science mit R erlernen und einsetzen wollen!
Angebotsgarantie! Seminar wird ab einer Anmeldung durchgeführt!
Präsenzveranstaltungen in Wiesbaden an 2 Tagen: 990,- € pro Person (netto)
Termine: 05./06.10.2023
Präsenzveranstaltungen in Wiesbaden: aktuelle Information hier
Agenda
Tag 1:
Tag 2:
Nach Bedarf:
Dieser Kurs vermittelt an zwei Tagen die Umsetzung von Data Science Projekten in R. TeilnehmerInnen sollten ein Grundwissen der Programmierung (gerne in R oder Python) und der Statistik / Machine Learning mitbringen, um optimal von diesem Seminar zu profitieren.
In R stehen zwei grundlegende Machine Learning-Frameworks zur Verfügung: caret/Tidymodels sowie mlr/mlr3. Da mlr3 näher an der Umsetzung mittels scikat-learn in Python ist, wird dieses im Seminar genutzt. Im Vorfeld können wir uns aber auch gerne auf caret/TidyModels einigen.
Die einzelnen Schritte werden anhand des CRISP-DM-Standards praxisorientiert besprochen, der sich aus den Schritten Business Understanding, Data Understanding, Data Preparation, Modeling, Evaluation und Deployment zusammensetzt. Alle Themen werden auf Basis realer Fragestellung in R und RStudio® intensiv eingeübt.
Um auch größere Datensätze effektiv verarbeiten zu können, wird zum einen auf data.table zurückgegriffen als auch auf Datenbanken. Das mlr3-Paket (alternativ caret/tidymodels) bietet ein komplettes Framework zur Umsetzung an. Um hier einen strukturierten Zugang zu finden, werden zentrale Machine Learning-Algorithmen (inkl. Deep Learning) vorgestellt und praktisch eingesetzt. Die Modellevaluation hilt dabei, das optimale Modell für die jeweilige Fragestellung zu identifizieren. Dazu können die Modelle mittels Hyperparameter-Tuning oder Random Grid Search optimiert werden.
Automatisierung wird durch Pipelines in Data Science Projekten erreicht. Hierzu bietet mlr3 eine Umsetzungsmöglichkeit, das drake-Paket arbeitet besonders effizient und passt nur Modellteile an, deren Datengrundlage sich geändert hat.
Es wird gezeigt, wie alle Schritte mittels Markdown in RStudio dokumentiert werden können. Eine weitere Automatisierung wird durch das Schreiben eigener Data Science spezifischer Funktionen erreicht.
Im gesamten Seminars werden immer Übungen entlang einer Case Study durchgeführt. Hier wird sehr viel wert auf eine möglichst effiziente Umsetzung der CRISP-DM-Prozessschritte gelegt.
Ein direkter Einsatz der erlernten Techniken ist nach dem Seminar in Data Science Projekten ohne weiteres möglich!
oder Online-Seminar
Hintergrundinformationen zu R
Sie wollen, ehe Sie ein R Seminar buchen, etwas mehr erfahren, was R ist und kann?
R ist eine Programmiersprache, die unter der GNU-Lizenz veröffentlich wurde. Hauptaugenmerk der Sprache liegt auf der Umsetzung statistischer Analysen und
der effizienten Erstellung von Grafiken. Historisch ist R aus der (proprietären) Programmiersprache S
entstanden, weswegen die beiden in weiten Teilen sehr ähnlich sind. Nachdem R über Jahre
vorwiegend im Hochschulbereich eingesetzt wurde, wird seine Leistungsfähigkeit vor allem im Bereich
der Data Science sehr geschätzt. Durch über 600 Zusatzpakete (Stand Ende 2019) sind nahezu alle bekannten statistischen
Verfahren und Darstellungsmethoden verfügbar.
R kann problemlos auf allen gängigen Plattformen (MS Windows Vista/7/8/Server 2008/10, Mac OS X,
Linux Redhat/Debian/sus/ubuntu) installiert werden. Mit der Installation von R wird zugleich auch
eine Programmierumgebung installiert. Die meisten Anwenderinnen und Anwender verwenden jedoch
RStudio® um R möglichst komfortabel zu nutzen. Auch RStudio® ist für fast alle gängigen
Betriebssysteme verfügbar und steht in zwei verschiedenen Varianten zur Verfügung.
Neben den freien Desktop und Server-Installationen stehen noch kostenpflichtige Angebote zur
Verfügung, die darüber hinaus besseren Service und Dashboards und Systeme zur Projektorganisation
bereitstellen. Hier finden Sie eine Übersicht über die
Unterschiede der einzelnen Systeme.
Für die R Seminare die masem training anbietet wird im Regelfall auf die freie Desktop-Installation von
RStudio® zurückgegriffen.
Shiny® von RStudio® ermöglicht es zudem komfortabel R-basierte
Applikationen zu entwickeln, die eine interaktive Datenanalyse für die Betrachter ermöglichen. So
können interaktive Grafiken Ihre Daten schnell und aussagekräftig visualisieren oder mit Widgets
Tabellen so konstruiert werden, wie sie für die aktuelle Aufgabe benötigt werden.