SWS |
4 |
ECTS |
5 |
Sprache(n) |
Deutsch
(Standard)
Englisch
|
Lehrform |
SU mit Praktikum |
Angebot |
in jedem Sommersemester |
Aufwand |
30 Präsenzstunden Vorlesung, 30 Präsenzstunden Praktikum, 45 Stunden Vor-/Nachbereitung des Praktikums, 45 Stunden Nachbereitung der Vorlesung und Prüfungsvorbereitung |
Voraussetzungen |
- Grundlagen Datenaufbereitung (Laden, Transformieren, Bereinigen) - wie beispielsweise aus Datenaufbereitung und Visualisierung
- Grundlagen Datenbanksysteme (Relational, NoSQL, verteilte Systeme, Graph-Datenbanken), Grundkenntnisse SQL, Grundkenntnisse in Python oder R - wie beispielsweise aus Datenhaltung
|
Ziele |
Lernziele:
Die Studierenden lernen grundlegende Konzepte und Komponenten des Data Warehouse Idee und des Data Mining als Basis für entscheidungsunterstützende Anwendungen kennen und umzusetzen, um sie in ihrer späteren beruflichen Tätigkeit z.B. im Bereich der Business Intelligence sinnvoll einsetzen zu können.
Fach- & Methodenkompetenz:
Die Studierenden sind in der Lage
- die grundlegenden Konzepte hinter dem Data Warehouse und Data Mining zu erläutern,
- der jeweiligen Problemstellung angepasste Methoden zum Data Mining auszuwählen und prototypisch umzusetzen,
- aktuelle Data Warehouse Systeme zu bedienen, eigene Analyse-Pipleines umzusetzen und in den Data Mining bzw. Data Science Prozess einzubinden.
Überfachliche Kompetenz:
- Teamarbeit: Die Studierenden bearbeiten Problemstellungen in Kleingruppen und stellen sich gegenseitig ihre Ergebnisse vor
- Präsentationstechniken: Die Studierenden sind in der Lage, ihre Ergebnisse sowohl in der Fachsprache, als auch der Domäne bzw. ggü. Anwender:innen oder Projektpartner:innen angepasst zu präsentieren
|
Inhalt |
- Data Warehousing: Abgrenzung und Einordnung
- Referenzarchitektur und Phasen des Data Warehousing
- Datenmodellierung, Metadaten und Schemata
- ETL und Optimierung (z.B. Indizierung, Partitionierung, Views)
- Grundlagen des Data Mining
- Klassifikation
- Clustering und Warenkorbanalyse
- Zeitreihenanalyse
Im Praktikum werden anhand von Aufgaben und Beispielen Verständnis und praktische Anwendung geübt. Die Studierenden verwenden dazu auch eine entsprechende Programmiersprache (z.B. Python oder R) und lernen nützliche Pakete bzw. APIs kennen. |
Medien und Methoden |
Tafel, Beamer, Jupyter-Notebooks bzw. R-Markdown, Livecoding, Git. |
Literatur |
Literaturliste wird zu Beginn der Veranstaltung bekannt gegeben.
Beispiel-Literatur:
- Data Warehouse: Köppen, et al. (2014): Data Warehouse Technologien, Verlagsgruppe Hüthig Jehle Rehm.
- Grundlagen Datenbanksysteme: Alfons Kemper und André Eickler (2015): Datenbanksysteme - Eine Einführung. Vol. 10. Oldenbourg Verlag.
- Data Mining Verfahren: James et.al. (2021): An Introduction to Statistical Learning with Applications in R, 2nd. Edition, Springer.
- Zeitreihenanalyse: Hyndman, Athanasopoulos (2018): Forecasting: principles and practice, 2nd edition, OTexts.
|
Zuordnungen Curricula |
SPO |
Fachgruppe |
Code |
ab Semester |
Prüfungsleistungen |
DC Version 2020 |
Pflicht |
DC-PF-06-001 |
6 |
benotete schriftliche Prüfung 90 Minuten
|
DC Version 2023 |
Pflicht |
DC-PF-06-001 |
6 |
benotete schriftliche Prüfung 90 Minuten
|
|