Natural Language Processing (NLP) in R

Dieses zweitägige R Seminar soll die Fähigkeiten vermitteln, mit R unstrukturierte Daten mittels Natural Language Processing (NLP) zu bearbeiten und zu analysieren.

Termine Offene Schulungen


26./27. November 2020 (Webinar); 21./22. Januar 2021 (Webinar); 

Aufgrund der CoViD-19-Pandemie finden aktuell keine Präsenzveranstaltungen in Wiesbaden statt!

Lernziele und Agenda

Lernziele
  • Überblick der Methoden des Natural Language Processing 
  • Tokenization, Lemmantization, POS-Tagging 
  • Named Entity Tagging 
  • Data extraction 
  • Sentiment-Analysen 
  • Word- und Dokument- Frequenzen (tf-idf) 
  • Korrelationen in Texten (n-Gramme) 
  • Topic Modelling rNNs
  • Optional: Übertragung der Inhalte auf Ihr Projekt
Agenda
Teil 1:
  • Überblick der Methoden des Natural Language Processing 
  • Data preparation in NLP-Aufgaben (Tokenization, Tagging, Lemma) 
  • Data extraction mittels Pattern Recognition 
  • Sentiment-Analysen
Teil 2:
  • Muster in Texten erkennen (tf-idf, Korrelationen) 
  • Topic Modelling 
  • Texte klassifizieren mit rNNs (Deep Learning)
Übungen entlang einer Fallstudie 

Inhalt

Der Kurs richtet sich an alle, die Texte analysieren wollen, um Themen, Gemütslagen (Sentiments) oder Cluster zu analysieren. Dieser Kurs ist auf zwei Tage verteilt. Am ersten Tag werden vor allem die vorbereitenden Schritte der NLP-Analysen vorgestellt. 

Der zweite Tag analysiert die vorbereiteten Texte. Es werden Muster und Themen extrahiert, wie auch Texte klassifiziert

Das Seminar NLP in R erleichtert den Einstieg in die automatisierte Textanalyse und -Klassifikation, denn of ist im Vorfeld nicht klar, welche Verfahren geeignet sind und wie die Daten vorzubereiten sind. Es gibt viele verschiedene R-Pakete im NLP-Bereich. Im Rahmen des Seminars werden die poplären Pakete tm, quanteda und udpipe vorgestellt.

Die Umsetzung erfolgt immer praktisch, gerne anhand einer Fallstudie (wird im Vorfeld des Seminars besprochen) in R und in der IDE RStudio. Wenn Sie ein Firmenseminar buchen, können Sie jede beliebige IDE nutzen oder gerne auch direkt in R arbeiten. 

Buchen Sie ein Firmenseminar, so schneiden wir die Inhalte natürlich gerne auf ihre Bedürfnisse zu und schulen auch an ihren Daten. Sprechen Sie uns einfach an!

INHOUSE-SEMINAR

LEIDER KÖNNEN WIR MOMENTAN KEINE OFFENEN SCHULUNGEN IN WIESBADEN DURCHFÜHREN. NUTZEN SIE UNSER WEBINAR-ANGEBOT!

1.290,00
pro Tag bis 4 Teilnehmer zzgl. gesetzlicher USt

  • Alle Inhalte der Inhouse-Seminare werden individuell zugeschnitten und zielgruppenspezifisch vermittelt.
    Intensive Nachbetreuung ermöglicht den Teilnehmern ihre Kenntnisse in kürzester Zeit umzusetzen
    .
  • Empfohlene Seminardauer: 2 Tage
  • Leihgebühren Schulungsnotebook (auf Wunsch): 35,- Euro (pro Tag, pro Schulungsrechner)
  • Telefon: +49 611 531 500 91
  • E-Mail: training@masem-training.de

firmen webinar

Ideal für das Home-Office oder dezentrale Arbeitsgruppen

€990,00
pro Tag bis 4 Teilnehmer zzgl. gesetzlicher USt - befristetes Angebot bis zum 31.12.2020, danach €1.290,00 netto 

  • Bei Seminaren in unserem virtuellen Klassenzimmer genießen Sie alle Vorteile der Inhouse-Seminare. Dabei nutzen Sie Ihre eigenen Rechner und erhalten von uns den gleichen Service in der gleichen hohen Qualität bei weniger Aufwand!
  • Kursdauer: Nach Absprache!
  • Telefon: +49 611 531 500 91
  • E-Mail: training@masem-training.de

Hintergrundinformationen zu R

Sie wollen, ehe Sie ein R Seminar buchen, etwas mehr erfahren, was R ist und kann? R ist eine Programmiersprache, die unter der GNU-Lizenz veröffentlich wurde. Hauptaugenmerk der Sprache liegt auf der Umsetzung statistischer Analysen und der effizienten Erstellung von Grafiken. Historisch ist R aus der (proprietären) Programmiersprache S entstanden, weswegen die beiden in weiten Teilen sehr ähnlich sind. Nachdem R über Jahre vorwiegend im Hochschulbereich eingesetzt wurde, wird seine Leistungsfähigkeit vor allem im Data-Science Bereich sehr geschätzt. Durch über 16.000 Zusatzpakete (Stand September 2020) alleine auf dem CRAN sind nahezu alle bekannten statistischen Verfahren und Darstellungsmethoden verfügbar. R kann problemlos auf allen gängigen Plattformen (MS Windows Vista/7/8/Server 2008/10, Mac OS X, Linux Redhat/Debian/SuSe/ubuntu) installiert werden. Mit der Installation von R wird zugleich auch eine Programmierumgebung installiert. Die meisten Anwenderinnen und Anwender verwenden jedoch RStudio® um R möglichst komfortabel zu nutzen. Auch RStudio® ist für fast alle gängigen Betriebssysteme verfügbar und steht in zwei verschiedenen Varianten zur Verfügung. Neben den freien Desktop und Server-Installationen stehen noch kostenpflichtige Angebote zur Verfügung, die darüber hinaus besseren Service und Dashboards und Systeme zur Projektorganisation bereitstellen. Hier finden Sie eine Übersicht über die Unterschiede der einzelnen Systeme. Für die R Seminare die masem training anbietet wird im Regelfall auf die freie Desktop-Installation von RStudio® zurückgegriffen. Shiny® von RStudio® ermöglicht es zudem komfortabel R-basierte Applikationen zu entwickeln, die eine interaktive Datenanalyse für die Betrachter ermöglichen. So können interaktive Grafiken Ihre Daten schnell und aussagekräftig visualisieren oder mit Widgets Tabellen so konstruiert werden, wie sie für die aktuelle Aufgabe benötigt werden.