Datenaufbereitung und Visualisierung

Datenaufbereitung und Visualisierung

SWS 4
ECTS 5
Sprache(n) Deutsch (Standard)
Englisch
Lehrform SU mit Praktikum
Angebot in jedem Sommersemester
Aufwand

30 Präsenzstunden Vorlesung, 30 Präsenzstunden Praktikum, 45 Stunden Vor-/Nachbereitung des Praktikums, 45 Stunden Nachbereitung der Vorlesung und Prüfungsvorbereitung

Voraussetzungen

Grundlegende Programmierkenntnisse wie beispielsweise aus Computational Thinking

Ziele

Lernziele:

Die Studierenden lernen die Aufbereitung von Daten aus verschiedensten Quellen und explorative Visualisierungsmöglichkeiten im Rahmen der ersten Schritte des Data Science Workflows kennen und anwenden, um sie in ihrer späteren beruflichen Tätigkeit bei der Analyse von Daten hinsichtlich Erkenntnisgewinn und Vorhersage sinnvoll einsetzen zu können.

Fach- & Methodenkompetenz:

Die Studierenden sind in der Lage

  • die Konzepte der Datenaufbereitung und der Visualisierung zu erläutern,
  • Daten aus verschiedensten Quellen in ein Analyseframework zu laden und dort in geeigneter Form verfügbar zu machen,
  • Datenmerkmale zu visualisieren und darauf aufbauend erste Hypothesen bzgl. Zusammensetzung und Zusammenhängen zu formulieren
  • grundlegende Forschungsfragen korrekt zu formulieren und mit Hilfe der wissenschaftlichen Methodik zu verfolgen

Überfachliche Kompetenz:

  • Teamarbeit: Die Studierenden entwickeln Datenanalysen und Visualisierungen in Kleingruppen
  • Präsentationstechniken: Die Studierenden sind in der Lage, ihre Ergebnisse sowohl in der Fachsprache, als auch der Domäne angepasst zu präsentieren
Inhalt
  • Kennenlernen grundlegender Datenformate (JSON, XML, Text) und Datenquellen (Dateien, Streams, Datenbanken, Big Data Technologien)
  • Parsen von Merkmalen und Transformation in passende Formate
  • Berechnung statistischer Kenngrößen (Median, Quantile, ...)
  • Erkennung von Ausreißern und Handhabung von unvollständigen Datensätze
  • Feature-Extraction
  • Einführung in die explorative Statistik
  • Erstellung und Interpretation von Plots (Histogramme, Zeitreihen, Box-Plots, Scatter-Plots, Graphen, ...)
  • Interaktive Diagramme mit geeigneten Technologien (z.B. plotly, D3)

Im Praktikum werden anhand von Aufgaben und Beispielen Verständnis und praktische Anwendung geübt. Die Studierenden verwenden dazu auch eine entsprechende Programmiersprache (z.B. R oder Python) und lernen nützliche Pakete kennen.

Medien und Methoden

Tafel, Beamer, Jupyter-Notebooks bzw. R-Markdown, Livecoding

Literatur
  • Alice Zheng, Feature Engineering for Machine Learning Models: Principles and Techniques for Data Scientists, O'Reilly, 2018.
  • Andy Kirk, Data Visualisation: A Handbook for Data Driven Design, SAGE Publications Ltd. 2019.
  • Scott Murray, Interactive Data Visualization for the Web: An Introduction to Designing with D3, O'Reilly, 2017.
Zuordnungen Curricula
SPO Fachgruppe Code ab Semester Prüfungsleistungen

DC Version 2020

Pflicht

DC-PF-02-003

2

Eine der Folgenden, Festlegung siehe Studienplan:
benotete Modularbeit (100%)
praktische Prüfung

DC Version 2023

Pflicht

DC-PF-02-003

2

Eine der Folgenden, Festlegung siehe Studienplan:
benotete Modularbeit (100%)
praktische Prüfung

ID Version 2021

ID: Wahlpflichtfach

07-DC-PF-02-003

6

Eine der Folgenden, Festlegung siehe Studienplan:
benotete Modularbeit (100%)
praktische Prüfung

DE Version WS22

DE: Wahlpflichtfach

6

Eine der Folgenden, Festlegung siehe Studienplan:
benotete Modularbeit (100%)
praktische Prüfung

GS Version WS22

GS: Wahlpflichtfach

6

Eine der Folgenden, Festlegung siehe Studienplan:
benotete Modularbeit (100%)
praktische Prüfung