Deep Learning in Visual Computing

SWS

ECTS

Sprache(n)

Deutsch (Standard)
Englisch

Lehrform

SU mit Praktikum

Angebot

nach Ankündigung

Aufwand

60 Präsenzstunden, 90 Stunden Eigenarbeit zur Vor-/Nachbereitung, Arbeit am Projekt und zur Vorbereitung der Präsentation

Voraussetzungen

Praktische Programmiererfahrung in Python
Lineare Algebra
Grundlagen des Maschinellen Lernens

Ziele

Fachliche Lernziele:

Für einen spezifischen Anwendungsfall passende Repräsentationen von 2D- und 3D-Daten vergleichen, bewerten und auswählen können.
Wichtige Problemstellungen aus den Bereichen 2D- und 3D-Computer Vision aufzählen, beschreiben und deren Charakteristika erklären können.
Klassische Verfahren und zur Lösung geeignete Modelltypen im Detail erklären und anwendungsspezifisch auswählen können.
Existierende Werkzeuge und Frameworks zur Verarbeitung von 2D- und 3D-Daten in Neuronalen Netzen auf praktischen Problemstellungen anwenden können.

Überfachliche Lernziele

Selbstständiges Aufarbeiten und Präsentieren von Wissenschaftlichen Publikationen.
Praktische Problemstellungen in Kleingruppen lösen können.
Existierenden Quellcode in Vorproduktreife verstehen, nutzen und erweitern können.

Inhalt

Studierende lernen moderne Deep Learning Modelltypen für den Umgang mit zwei- und dreidimensionalen Daten kennen. Dazu werden verschiedene Problemstellungen aus der 2D- und 3D-Computer Vision zusammen mit den geeigneten Netzarchitekturen und Trainingsmethoden vorgestellt. Praktisch werden diese Inhalte im Rahmen eines Teamprojekts anhand eines aktuellen Anwendungsfalls eingeübt.

Zu den konkreten Problemstellungen gehören:

Visualisierung und Interpretation von Deep Learning Modellen
2D/3D-Objektdetektion-, erkennung und -segmentierung
Bilderzeugung auf Basis von generativen Modellen
3D-Rekonstruktion auf Basis von Bildern

Dabei werden u.a. folgende Modelltypen behandelt:

Convolutional NNs zur Verarbeitung von Bilddaten
U-Nets zur Segmentierung von Bildern
Variational Autoencoders (VAEs), Generative Adversarial Networks (GANs) als generative Modelle
Graph Neural Networks (GNNs)

Darüber hinaus werden notwendige Grundlagen zu den Bereichen Deep Learning, Bildsynthese/ -analyse und Repräsentationen dreidimensionaler Daten erarbeitet.

Medien und Methoden

Medien:

Folien
Tutorials zu technischen Werkzeugen

Methoden:

Projektarbeit
Paper-Präsentationen

Literatur

Aurélien Géron, Hands-On Machine Learning with Scikit-Learn, Keras, and TensorFlow, 2. Ausgabe, O'Reilly Media (2019)
Goodfellow, I., Bengio, Y., & Courville, A, Deep learning. MIT press (2016).
Richard Szeliski, Computer Vision: Algorithms and Applications, 2. Ausgabe, Springer (2022)

Zuordnungen Curricula

SPO	Fachgruppe	Code	ab Semester	Prüfungsleistungen
IG Version 2019	EC: Fachliche u. persönliche Profilbildung		1	benotete Modularbeit (60%) benotete Präsentation (40%)
IG Version 2019	SWE: Fachliche u. persönliche Profilbildung		1	benotete Modularbeit (60%) benotete Präsentation (40%)
IG Version 2019	VCML: Schwerpunkt		1	benotete Modularbeit (60%) benotete Präsentation (40%)
IG Version 2024	EC: Fachliche u. persönliche Profilbildung		1	benotete Modularbeit (60%) benotete Präsentation (40%)
IG Version 2024	SWE: Fachliche u. persönliche Profilbildung		1	benotete Modularbeit (60%) benotete Präsentation (40%)
IG Version 2024	VCML: Schwerpunkt		1	benotete Modularbeit (60%) benotete Präsentation (40%)
IG Version 2024	ITSEC: Fachliche u. persönliche Profilbildung		1