Data Warehousing/Mining

Data Warehousing/Mining

SWS 4
ECTS 5
Sprache(n) Deutsch (Standard)
Englisch
Lehrform SU mit Praktikum
Angebot in jedem Sommersemester
Aufwand

30 Präsenzstunden Vorlesung, 30 Präsenzstunden Praktikum, 45 Stunden Vor-/Nachbereitung des Praktikums, 45 Stunden Nachbereitung der Vorlesung und Prüfungsvorbereitung

Voraussetzungen
  • Grundlagen Datenaufbereitung (Laden, Transformieren, Bereinigen) - wie beispielsweise aus Datenaufbereitung und Visualisierung
  • Grundlagen Datenbanksysteme (Relational, NoSQL, verteilte Systeme, Graph-Datenbanken), Grundkenntnisse SQL, Grundkenntnisse in Python oder R - wie beispielsweise aus Datenhaltung
Ziele

Lernziele:

Die Studierenden lernen grundlegende Konzepte und Komponenten des Data Warehouse Idee und des Data Mining als Basis für entscheidungsunterstützende Anwendungen kennen und umzusetzen, um sie in ihrer späteren beruflichen Tätigkeit z.B. im Bereich der Business Intelligence sinnvoll einsetzen zu können.

Fach- & Methodenkompetenz:

Die Studierenden sind in der Lage

  • die grundlegenden Konzepte hinter dem Data Warehouse und Data Mining zu erläutern,
  • der jeweiligen Problemstellung angepasste Methoden zum Data Mining auszuwählen und prototypisch umzusetzen,
  • aktuelle Data Warehouse Systeme zu bedienen, eigene Analyse-Pipleines umzusetzen und in den Data Mining bzw. Data Science Prozess einzubinden.

Überfachliche Kompetenz:

  • Teamarbeit: Die Studierenden bearbeiten Problemstellungen in Kleingruppen und stellen sich gegenseitig ihre Ergebnisse vor
  • Präsentationstechniken: Die Studierenden sind in der Lage, ihre Ergebnisse sowohl in der Fachsprache, als auch der Domäne bzw. ggü. Anwender:innen oder Projektpartner:innen angepasst zu präsentieren
Inhalt
  • Data Warehousing: Abgrenzung und Einordnung
  • Referenzarchitektur und Phasen des Data Warehousing
  • Datenmodellierung, Metadaten und Schemata
  • ETL und Optimierung (z.B. Indizierung, Partitionierung, Views)
  • Grundlagen des Data Mining
  • Klassifikation
  • Clustering und Warenkorbanalyse
  • Zeitreihenanalyse

Im Praktikum werden anhand von Aufgaben und Beispielen Verständnis und praktische Anwendung geübt. Die Studierenden verwenden dazu auch eine entsprechende Programmiersprache (z.B. Python oder R) und lernen nützliche Pakete bzw. APIs kennen.

Medien und Methoden

Tafel, Beamer, Jupyter-Notebooks bzw. R-Markdown, Livecoding, Git.

Literatur

Literaturliste wird zu Beginn der Veranstaltung bekannt gegeben.

Beispiel-Literatur:

  • Data Warehouse: Köppen, et al. (2014): Data Warehouse Technologien, Verlagsgruppe Hüthig Jehle Rehm.
  • Grundlagen Datenbanksysteme: Alfons Kemper und André Eickler (2015): Datenbanksysteme - Eine Einführung. Vol. 10. Oldenbourg Verlag.
  • Data Mining Verfahren: James et.al. (2021): An Introduction to Statistical Learning with Applications in R, 2nd. Edition, Springer.
  • Zeitreihenanalyse: Hyndman, Athanasopoulos (2018): Forecasting: principles and practice, 2nd edition, OTexts.
Zuordnungen Curricula
SPO Fachgruppe Code ab Semester Prüfungsleistungen

DC Version 2020

Pflicht

DC-PF-06-001

6

benotete schriftliche Prüfung 90 Minuten

DC Version 2023

Pflicht

DC-PF-06-001

6

benotete schriftliche Prüfung 90 Minuten