Datenaufbereitung und Visualisierung
Fakultät für Informatik und Mathematik ©
Name Datenaufbereitung und Visualisierung
Verantwortlich Prof. Dr. David Spieler
SWS 4
ECTS 5
Sprache(n) Deutsch
Englisch
Lehrform SU mit Praktikum
Angebot in jedem Sommersemester
Aufwand

Präsenzstudium ca. 60 Std., Eigenstudium ca. 90 Std.

Voraussetzungen
Ziele

Lernziele:

Die Studierenden lernen die Aufbereitung von Daten aus verschiedensten Quellen und explorative Visualisierungsmöglichkeiten im Rahmen der ersten Schritte des Data Science Workflows kennen und anwenden, um sie in ihrer späteren beruflichen Tätigkeit bei der Analyse von Daten hinsichtlich Erkenntnisgewinn und Vorhersage sinnvoll einsetzen zu können.

Fach- & Methodenkompetenz:

Die Studierenden sind in der Lage

  • die Konzepte der Datenaufbereitung und der Visualisierung zu erläutern,
  • Daten aus verschiedensten Quellen in ein Analyseframework zu laden und dort in geeigneter Form verfügbar zu machen,
  • Datenmerkmale zu visualisieren und darauf aufbauend erste Hypothesen bzgl. Zusammensetzung und Zusammenhängen zu formulieren

Überfachliche Kompetenz:

  • Teamarbeit: Die Studierenden entwickeln Datenanalysen und Visualisierungen in Kleingruppen
  • Präsentationstechniken: Die Studierenden sind in der Lage, ihre Ergebnisse sowohl in der Fachsprache als auch der Domäne angepasst zu präsentieren
Inhalt
  • Kennenlernen grundlegender Datenformate (JSON, XML, Text) und Datenquellen (Dateien, Streams, Datenbanken, Big Data Technologien)
  • Parsen von Merkmalen und Transformation in passende Formate
  • Berechnung statistischer Kenngrößen (Median, Quantile, ...)
  • Erkennung von Ausreißern und Handhabung von unvollständigen Datensätze
  • Feature-Extraction
  • Einführung in die explorative Statistik
  • Erstellung und Interpretation von Plots (Histogramme, Zeitreihen, Box-Plots, Scatter-Plots, Graphen, ...)
  • Interaktive Diagramme mit geeigneten Technologien
Medien und Methoden

Tafel, Beamer, Jupyter-Notebooks, Livecoding, GitHub

Literatur
  • Alice Zheng, Feature Engineering for Machine Learning Models: Principles and Techniques for Data Scientists, O'Reilly, 2018.
  • Andy Kirk, Data Visualisation: A Handbook for Data Driven Design, SAGE Publications Ltd. 2019.
  • Scott Murray, Interactive Data Visualization for the Web: An Introduction to Designing with D3, O'Reilly, 2017.
Zuordnungen Curricula
SPO Fachgruppe Code ab Semester Prüfungsleistungen
IC Version 2020 Pflicht 2 Modularbeit
praktische Prüfung