Advanced Data Modeling and Analysis with R / Python
Name Advanced Data Modeling and Analysis with R / Python
SWS 4
ECTS 5
Sprache(n) Deutsch (Standard)
Englisch
Lehrform SU mit Übung
Angebot in jedem Wintersemester
Aufwand

40 Präsenzstunden Vorlesung, 20 Präsenzstunden Übung, 35 Stunden Vor-/Nachbereitung der Übungen, 55 Stunden Nachbereitung der Vorlesung und Prüfungsvorbereitung

Voraussetzungen

Fundierte Kenntnisse in Wahrscheinlichkeitstheorie und Statistik auf Bachelor-Niveau und grundlegende Kenntnisse in Maschinellem Lernen auf Bachelor-Niveau

Ziele

Lernziele:

Die Studierenden ...

  • können fortgeschrittene Aufgabenstellungen (wie z.B. durch Abhängigkeiten zwischen den Beobachtungen) aus der Datenanalyse unter Verwendung geeigneter Software (vorzugsweise R oder Python) lösen und die Ergebnisse adäquat interpretieren und kommunizieren.  
  • führen mindestens ein Datenanalyseprojekt praktisch durch.

Fach- und Methodenkompetenzen:

Die Studierenden ...

  • planen mindestens ein Datenanalyse-Projekt und führen es mithilfe von geeigneten Analysemethoden durch,
  • führen die Datenaufbereitung durch,
  • analysieren Daten mittels deskriptiver und explorativer Verfahren,
  • können konkrete Projekt-Anforderungen und -Fragestellungen identifizieren,
  • können für eine gegebene Problemstellung ein oder mehrere passende Analyseverfahren und Software-Lösungen auswählen,
  • vergleichen und bewerten inwiefern Analysemethoden für ein konkretes Projekt geeignet sind,
  • prüfen die Modellvoraussetzungen für die vorliegenden Daten und validieren das Modell,
  • bewerten, interpretieren und diskutieren die Ergebnisse adäquat und
  • setzen die Analyse in geeigneter Software (z.B. R oder Python) um.

Überfachliche Kompetenzen:

Die Studierenden ...

  • können Datenanalysen in Software umsetzten (R / Python),
  • können die verwendeten Methoden, sowie die erhaltenen Ergebnisse verständlich gegenüber Dritten kommunizieren und kritisch diskutieren,
  • können ethische und rechtliche Fragestellungen beim Einsatz von Analysemethoden in der Praxis erläutern (z.B. Social Scoring, Recommender Systems, Datenschutz).
Inhalt

Ausgewählte und teilweise speziellere Kapitel der Datenanalyse mit Fokus auf die Durchführung solcher Analysen in R / Python. Zu solchen zählen beispielsweise

  • Multivariate Regressionsanalyse
  • Generalisierte Additive Modelle
  • Mixed Effects Models
  • Analyse von Time-to-Event Daten
  • Strukturgleichungsmodellierung
  • Latent Variable Analysis
  • Discrete Choice Analysis
  • Speziellere Themen der Multivariaten Datenanalyse wie Korrespondenzanalyse, Kanonische Korrelationen, Multidimensionale Skalierung

Inklusive Modellwahl und Modellvalidierung.

Medien und Methoden

Tafel / Whiteboard, Beamer, Programmiersprache (R oder Python); Software zur Versionskontrolle (z.B. git), Selbstgesteuertes Lernen in Kleingruppen, Repositories mit Versionsverwaltung (z.B. git), Peer-to-Peer Feedback

Literatur

Literatur in Abhängigkeit von den jeweils behandelten Themengebieten wird zu Beginn des Semesters bekannt gegeben.

Beispiel-Literatur:

  • Backhaus, Erichson, Plinke, Weiber, Weiber: Multivariate Analysemethoden: Eine anwendungsorientierte Einführung, 2021
  • Backhaus, Erichson, Weiber: Fortgeschrittene Multivariate Analysemethoden: Eine anwendungsorientierte Einführung, 2021
  • Burkhardt, Titz, Sedlmeier: Datenanalyse mir R: fortgeschrittene Verfahren, 2022
  • James, Witten, Hastie, Tibshirani: An Introduction to Statistical Learning with Applications in R, 2021
  • James, Witten, Hastie, Tibshirani, Taylor: An Introduction to Statistical Learning with Applications in Python, 2023
  • McKinney: Python for Data Analysis, 2022
  • Fahrmeir, Kneib, Lang: Regression: Modelle, Methoden und Anwendungen, 2009
  • Wickham, Cetinkaya-Rundel, Grolemund: R for Data Science, 2023
Zuordnungen Curricula
SPO Fachgruppe Code ab Semester Prüfungsleistungen
DA Version 2023 DA: Anwendungen IF-DA-M-A07 1 Modularbeit