Kompaktkurs Auswertungen in der Medizin mit R

Für alle Fachkräfte aus dem Bereich der Kliniken sowie medizinischer Forschung, die einen kompetenten Umgang mit Statistik mit Hilfe von R und geeigneten Zusatzpaketen anstreben bzw. ihre Kenntnisse auffrischen möchten.

Lernziele und Agenda

Lernziele
  • R, RStudio® und relevante Zusatzpakete, Ressourcen 
  • Kompetenter Umgang mit R® im Medizin-Bereich 
  • Unterschiedliche Techniken zur Datenaufbereitung in Abhängigkeit von der Fragestellung 
  • Grundlagen der medizinischen Statistik erlernen und in R umsetzen Ergebnisinterpretation

Tag 1:
  • Grundlagen R und RStudio®
  • Datenimport in R: Textdateien, Datenbanken, weitere Quellen
  • Visualisierungen und Deskriptive Analyse der Daten
  • Datenaufbereitung in R
  • Hypothesentests in R: Parametrische und Nichtparametrische Tests 
  • Kontingenzanalysen und RIsikoparameter, insbes. Risk Ratio und Odds Ratio
Tag 2:
  • Power-Analyse in R
  • Übersicht Multivariate Statistik in R
    • Vertiefend: Hinweise zur Varianzanalyse
  • Medizinische Statistik/Survival Analysis in R
    • Korrelationsanalyse
    • Logistische Regression
    • Sterbetafeln
    • Kaplan-Meier-Schätzer und Charts
    • Cox-Regression
  • Optional: Metaanalysen in R

Inhalt

Der Kurs richtet sich an alle, die Interesse an Medizinischer Statistik haben. Vermitelt werden Auswertungstechniken für medizinischen Daten, Analyse- und Schätzverfahren sowie Datenvisualisierung. Alle Analysen werden gemeinsam in R/RStudio umgesetzt. Das Seminar bietet viel Raum für das eigene Erproben in R gemeinsam mit dem Dozenten.

In diesem Seminar steht die praktische Umsetzung typischer statistischer Methoden aus der Medizinischen Statistik in der Statistiksoftware R im Vordergrund. Dabei diskutieren wir auch die Verwendung von R in Bezug auf Anforderungen der Regulierungsbehörden, insbesondere FDA, an.

Wir starten mit den Grundlagen von R und der RStudio IDE. Das Hilfesystem, das R Ökosystem (R Projektseite und CRAN, Bioconductor etc.) werden vorgestellt, spezielle Task Views für die Medizinische Statistik gezeigt. Geeignete Literatur wird vorgestellt.

Ohne Daten geht es meistens nicht in der Statistik, deshalb wird im nächsten Abschnitt der Import von Datensätzen in R behandelt. Neben Textdateien wird der Import aus Datenbank-Tabellen behandelt. Auch das Exportieren von Datensätzen und Ergebnissen in strukturierter Form wird gezeigt. Auf andere typische Datenquellen gehen wir ein (andere Statistiksoftware, MS Excel, ...).

Nachdem die Daten importiert worden sind, sind Visualisierungen und univariate Analysen notwendig, um ein besseres Verständnis über die Daten zu bekommen: Sind die Werte einer Variablen plausibel? Sind Ausreißer erkennbar? Liegen fehlende Werte vor und wenn ja, wie viele? Wie sieht die Verteilung der Daten aus? Dies sind typische Fragen, die wir in diesem Abschnitt mit R analysieren wollen. Neben der plot()-Funktion werden wir auch das ggplot2-Paket zur Visualisierung einsetzen.

Nach der Diagnose der Datenbeschaffenheit erfolgt die Aufbereitung der Daten: Schiefe Verteilungen können - natürlich je nachdem welche statistische Verfahren eingesetzt werden sollen - transformiert werden. Fehlende Werte können imuptiert werden, hier können auch Verfahren der multiplen Imputation genutzt werden. Unplausible Werte können gelöscht oder durch geeignete Werte ersetzt werden. Sollen Kategoriale Variablen in der Varianzanalyse (ALM oder GLM) genutzt werden, so können diese in Dummy-Variablen transformiert werden und so weiter.

Sind die Daten aufbereitet, so können Hypothesentests durchgeführt werden (natürlich sind die Hypothesen ganz zu Beginn der Analysen in einem Studienprotokoll festgehalten worden). Diese Hypothesen werden nun überprüft. Dazu stehen parametrische Verfahren, wie der klassische t-Test, F-Tests etc. zur Verfügung, aber auch nichtparametrische Äquivalente, z.B. der Mann-Whitney-U-Test etc. Wir besprechen Voraussetzungen, wie die Daten in R aufzubereiten sind für die Tests, führen die Tests durch (den t-Test z.B. mit der t.test()-Funktion) und Interpretieren natürlich das Ergebnis.

Die Kontingenzanalyse, insbesondere die Analyse von zweidimensionalen Kreuztabellen, nimmt eine besondere Rolle in der Medizin ein. So kann die 2 x 2 Felder-Tabelle (Zeilen: Medikament vs. Placebo oder zwei Medikamente gegeneinander, Spalten: Outcome (Behandlungserfolg oder kein Behandlungserfolg)) als Grundlage zur Berechnung der typischen Risikoparameter in der Medizin genutzt werden: Risk Ratio und  Odds Ratio. Hier werden neben der Berechnung der Parameter (auch die log-transformierten Parameter) auch die Konfidenzintervalle und p-Werte berechnet.

Kurstag 2 beginnt mit den in der Medizinischen Statistik so wichtigen Poweranalysen zur Fallzahlabschätzung. Die Poweranalyse dient dazu, die Fallzahl für ein Experiment bestimmen zu können in Hinblick auf die Alternativhypothese, die oft (aber nicht immer!) im Fokus des Interesses steht. Hier lernen wir wie die Logik funktioniert bevor in R umgesetzt wird.

Die Multivariate Statistik ist mittlerweile ein sehr weites Feld mit vielen Verfahren und speziellen Varianten. Deshalb ist ein Überblick notwendig, um die Verfahren einordnen und ggf. geeignete Verfahren einordnen zu können. Was ist in der R-Standardinstallation möglich? Welche Zusatzpakete sind hier hilfreich? Welche Rolle spielen Messniveaus der abhängigen und unabhängigen Variablen, die Fehlerverteilung und die Linkfunktion?

In der Medizinischen Statistik gibt es einige Verfahren, die sowohl die Dauer bis zum Eintritt eines Events nutzen, aber auch berücksichtigen, dass es bis zum Studienende nicht zum Eintritt gekommen ist. Diese werden gerne unter Survivalanalyse zusammengefasst. Hier sind die Sterbetafeln, die Kaplan-Meier-Schätzer und Charts zu nennen, aber auch die Cox-Regression, die die Kontrolle von zeitunabhängigen Kovariaten erlaubt. Hier wird die Hazard Ratio genutzt. Die Umsetzung erfolgt in R zuerst mit den Paketen der Standardinstallation.

Weitere Kursinhalte sowie Schwerpunkte können auch gerne auf Anfrage frei gewählt werden! Die totale Freiheit bzgl. der Inhalte haben Sie natürlich, wenn Sie ein Inhouse-Seminar buchen! Dann schneiden wir alle Inhalte auf Ihre Wünsche zu.

INHOUSE-SEMINAR

Seminardurchführung am Standort des Kunden

1.290,00
pro Tag bis 4 Teilnehmer zzgl. gesetzlicher USt

  • Alle Inhalte der Inhouse-Seminare werden individuell zugeschnitten und zielgruppenspezifisch vermittelt.
    Intensive Nachbetreuung ermöglicht den Teilnehmern ihre Kenntnisse in kürzester Zeit umzusetzen
    .
  • Empfohlene Seminardauer: 2 Tage
  • Leihgebühren Schulungsnotebook (auf Wunsch): 35,- Euro (pro Tag, pro Schulungsrechner)
  • Telefon: +49 611 531 500 91
  • E-Mail: training@masem-training.de

firmen webinar

Ideal für das Home-Office oder dezentrale Arbeitsgruppen

€1.290,00
pro Tag bis 4 Teilnehmer zzgl. gesetzlicher USt 

  • Bei Seminaren in unserem virtuellen Klassenzimmer genießen Sie alle Vorteile der Inhouse-Seminare. Dabei nutzen Sie Ihre eigenen Rechner und erhalten von uns den gleichen Service in der gleichen hohen Qualität bei weniger Aufwand!
  • Kursdauer: Nach Absprache!
  • Telefon: +49 611 531 500 91
  • E-Mail: training@masem-training.de

Hintergrundinformationen zu R

Sie wollen, ehe Sie ein R Seminar buchen, etwas mehr erfahren, was R ist und kann? R ist eine Programmiersprache, die unter der GNU-Lizenz veröffentlich wurde. Hauptaugenmerk der Sprache liegt auf der Umsetzung statistischer Analysen und der effizienten Erstellung von Grafiken. Historisch ist R aus der (proprietären) Programmiersprache S entstanden, weswegen die beiden in weiten Teilen sehr ähnlich sind. Nachdem R über Jahre vorwiegend im Hochschulbereich eingesetzt wurde, wird seine Leistungsfähigkeit vor allem im Bereich der Data Science sehr geschätzt. Durch über 600 Zusatzpakete (Stand Ende 2019) sind nahezu alle bekannten statistischen Verfahren und Darstellungsmethoden verfügbar. R kann problemlos auf allen gängigen Plattformen (MS Windows Vista/7/8/Server 2008/10, Mac OS X, Linux Redhat/Debian/sus/ubuntu) installiert werden. Mit der Installation von R wird zugleich auch eine Programmierumgebung installiert. Die meisten Anwenderinnen und Anwender verwenden jedoch RStudio® um R möglichst komfortabel zu nutzen. Auch RStudio® ist für fast alle gängigen Betriebssysteme verfügbar und steht in zwei verschiedenen Varianten zur Verfügung. Neben den freien Desktop und Server-Installationen stehen noch kostenpflichtige Angebote zur Verfügung, die darüber hinaus besseren Service und Dashboards und Systeme zur Projektorganisation bereitstellen. Hier finden Sie eine Übersicht über die Unterschiede der einzelnen Systeme. Für die R Seminare die masem training anbietet wird im Regelfall auf die freie Desktop-Installation von RStudio® zurückgegriffen. Shiny® von RStudio® ermöglicht es zudem komfortabel R-basierte Applikationen zu entwickeln, die eine interaktive Datenanalyse für die Betrachter ermöglichen. So können interaktive Grafiken Ihre Daten schnell und aussagekräftig visualisieren oder mit Widgets Tabellen so konstruiert werden, wie sie für die aktuelle Aufgabe benötigt werden.

Wir verwenden Cookies
Cookie-Einstellungen
Unten finden Sie Informationen über die Zwecke, für welche wir und unsere Partner Cookies verwenden und Daten verarbeiten. Sie können Ihre Einstellungen der Datenverarbeitung ändern und/oder detaillierte Informationen dazu auf der Website unserer Partner finden.
Analytische Cookies Alle deaktivieren
Funktionelle Cookies
Andere Cookies
Wir verwenden Cookies, um die Inhalte und Werbung zu personalisieren, Funktionen sozialer Medien anzubieten und unseren Traffic zu analysieren. Mehr über unsere Cookie-Verwendung
Einstellungen ändern Alle akzeptieren
Cookies