OFFENE SCHULUNG
- Präsenzveranstaltungen finden an unserem Standort in Wiesbaden statt und werden ab einer Anmeldung durchgeführt (Angebotsgarantie)
-
- Telefon: +49 611 531 500 91
- E-Mail: training@masem-training.de
Für Data Scientists, die mit R große Datenmengen effizient analysieren wollen
02.10.2020
Eine Schwachstelle von R stellt der Umgang mit größeren Datensätzen dar. In R importierte Datensätze werden immer komplett in den Arbeitsspeicher geladen. Auch wird die Performance beim Umgang mit großen Datensätzen schlecht.
Hier bietet das Paket data.table Lösungsmöglichkeiten. Statt eines data.frame-Objekts kann das data.table-Objekt verwendet werden. Mittels geeigneter Funktionen können so Daten schneller eingelesen und auch ausgeschrieben werden. Weiter existieren zahlreiche Datenmanipulationsmöglichkeiten, die weit über das hinausgehen, was mit data.frame-Objekten möglich ist. Hinzu kommt noch ein erheblicher Performance-Gewinn.
In diesem eintägigen Seminar werden alle notwendigen Schritte und Funktionen des data.table-Pakets vermittelt. Alle Schritte werden direkt in R (RStudio) umgesetzt, so dass ein nahtloses weiterarbeiten nach Beendigung des Seminars ohne weiteres gelingen sollte.
Hintergrundinformationen zu R
Sie wollen, ehe Sie ein R Seminar buchen, etwas mehr erfahren, was R ist und kann?
R ist eine Programmiersprache, die unter der GNU-Lizenz veröffentlich wurde. Hauptaugenmerk der Sprache liegt auf der Umsetzung statistischer Analysen und
der effizienten Erstellung von Grafiken. Historisch ist R aus der (proprietären) Programmiersprache S
entstanden, weswegen die beiden in weiten Teilen sehr ähnlich sind. Nachdem R über Jahre
vorwiegend im Hochschulbereich eingesetzt wurde, wird seine Leistungsfähigkeit vor allem im Bereich
der Data Science sehr geschätzt. Durch über 600 Zusatzpakete (Stand Ende 2019) sind nahezu alle bekannten statistischen
Verfahren und Darstellungsmethoden verfügbar.
R kann problemlos auf allen gängigen Plattformen (MS Windows Vista/7/8/Server 2008/10, Mac OS X,
Linux Redhat/Debian/sus/ubuntu) installiert werden. Mit der Installation von R wird zugleich auch
eine Programmierumgebung installiert. Die meisten Anwenderinnen und Anwender verwenden jedoch
RStudio® um R möglichst komfortabel zu nutzen. Auch RStudio® ist für fast alle gängigen
Betriebssysteme verfügbar und steht in zwei verschiedenen Varianten zur Verfügung.
Neben den freien Desktop und Server-Installationen stehen noch kostenpflichtige Angebote zur
Verfügung, die darüber hinaus besseren Service und Dashboards und Systeme zur Projektorganisation
bereitstellen. Hier finden Sie eine Übersicht über die
Unterschiede der einzelnen Systeme.
Für die R Seminare die masem training anbietet wird im Regelfall auf die freie Desktop-Installation von
RStudio® zurückgegriffen.
Shiny® von RStudio® ermöglicht es zudem komfortabel R-basierte
Applikationen zu entwickeln, die eine interaktive Datenanalyse für die Betrachter ermöglichen. So
können interaktive Grafiken Ihre Daten schnell und aussagekräftig visualisieren oder mit Widgets
Tabellen so konstruiert werden, wie sie für die aktuelle Aufgabe benötigt werden.