SWS |
4 |
ECTS |
5 |
Sprache(n) |
Deutsch
(Standard)
Englisch
|
Lehrform |
SU mit Praktikum |
Angebot |
in jedem Sommersemester |
Aufwand |
30 Präsenzstunden Vorlesung, 30 Präsenzstunden Praktikum, 45 Stunden Vor-/Nachbereitung des Praktikums, 45 Stunden Nachbereitung der Vorlesung und Prüfungsvorbereitung |
Voraussetzungen |
Grundlegende Programmierkenntnisse wie beispielsweise aus Computational Thinking |
Ziele |
Lernziele:
Die Studierenden lernen die Aufbereitung von Daten aus verschiedensten Quellen und explorative Visualisierungsmöglichkeiten im Rahmen der ersten Schritte des Data Science Workflows kennen und anwenden, um sie in ihrer späteren beruflichen Tätigkeit bei der Analyse von Daten hinsichtlich Erkenntnisgewinn und Vorhersage sinnvoll einsetzen zu können.
Fach- & Methodenkompetenz:
Die Studierenden sind in der Lage
- die Konzepte der Datenaufbereitung und der Visualisierung zu erläutern,
- Daten aus verschiedensten Quellen in ein Analyseframework zu laden und dort in geeigneter Form verfügbar zu machen,
- Datenmerkmale zu visualisieren und darauf aufbauend erste Hypothesen bzgl. Zusammensetzung und Zusammenhängen zu formulieren
- grundlegende Forschungsfragen korrekt zu formulieren und mit Hilfe der wissenschaftlichen Methodik zu verfolgen
Überfachliche Kompetenz:
- Teamarbeit: Die Studierenden entwickeln Datenanalysen und Visualisierungen in Kleingruppen
- Präsentationstechniken: Die Studierenden sind in der Lage, ihre Ergebnisse sowohl in der Fachsprache, als auch der Domäne angepasst zu präsentieren
|
Inhalt |
- Kennenlernen grundlegender Datenformate (JSON, XML, Text) und Datenquellen (Dateien, Streams, Datenbanken, Big Data Technologien)
- Parsen von Merkmalen und Transformation in passende Formate
- Berechnung statistischer Kenngrößen (Median, Quantile, ...)
- Erkennung von Ausreißern und Handhabung von unvollständigen Datensätze
- Feature-Extraction
- Einführung in die explorative Statistik
- Erstellung und Interpretation von Plots (Histogramme, Zeitreihen, Box-Plots, Scatter-Plots, Graphen, ...)
- Interaktive Diagramme mit geeigneten Technologien (z.B. plotly, D3)
Im Praktikum werden anhand von Aufgaben und Beispielen Verständnis und praktische Anwendung geübt. Die Studierenden verwenden dazu auch eine entsprechende Programmiersprache (z.B. R oder Python) und lernen nützliche Pakete kennen. |
Medien und Methoden |
Tafel, Beamer, Jupyter-Notebooks bzw. R-Markdown, Livecoding |
Literatur |
- Alice Zheng, Feature Engineering for Machine Learning Models: Principles and Techniques for Data Scientists, O'Reilly, 2018.
- Andy Kirk, Data Visualisation: A Handbook for Data Driven Design, SAGE Publications Ltd. 2019.
- Scott Murray, Interactive Data Visualization for the Web: An Introduction to Designing with D3, O'Reilly, 2017.
|
Zuordnungen Curricula |
SPO |
Fachgruppe |
Code |
ab Semester |
Prüfungsleistungen |
DC Version 2020 |
Pflicht |
DC-PF-02-003 |
2 |
Eine der Folgenden, Festlegung siehe Studienplan:
benotete Modularbeit (100%)
praktische Prüfung
|
DC Version 2023 |
Pflicht |
DC-PF-02-003 |
2 |
Eine der Folgenden, Festlegung siehe Studienplan:
benotete Modularbeit (100%)
praktische Prüfung
|
ID Version 2021 |
ID: Wahlpflichtfach |
07-DC-PF-02-003 |
6 |
Eine der Folgenden, Festlegung siehe Studienplan:
benotete Modularbeit (100%)
praktische Prüfung
|
DE Version WS22 |
DE: Wahlpflichtfach |
|
6 |
Eine der Folgenden, Festlegung siehe Studienplan:
benotete Modularbeit (100%)
praktische Prüfung
|
GS Version WS22 |
GS: Wahlpflichtfach |
|
6 |
Eine der Folgenden, Festlegung siehe Studienplan:
benotete Modularbeit (100%)
praktische Prüfung
|
|