SWS |
4 |
ECTS |
5 |
Sprache(n) |
Deutsch
(Standard)
Englisch
|
Lehrform |
SU mit Übung |
Angebot |
nach Ankündigung |
Aufwand |
30 Präsenzstunden Vorlesung, 30 Präsenzstunden Praktikum, 45 Stunden Vor-/Nachbereitung des Praktikums, 45 Stunden Nachbereitung der Vorlesung und Prüfungsvorbereitung |
Voraussetzungen |
Grundlegende Programmierkenntnisse (am Besten in Python), grundlegende Kenntnisse der Wahrscheinlichkeitsrechnung auf Bachelor Niveau;vorteilhaft sind grundlegende Kenntnisse aus dem Bereich stochastischer Prozesse (Markovketten, Markov-Entscheidungsprozesse) und Deep Learning |
Ziele |
Lernziele
- Die Studierenden werden in die Lage versetzt, Modelle und Methoden aus dem Bereich des Reinforcement Learnings als Lösungsstrategie in verschiedensten Anwendungsszenarien methodisch korrekt und sicher einsetzen zu können. Der Fokus liegt auf der Grundlagenausbildung.
- Zudem werden die Studierenden befähigt, sich schnell in neue und aktuelle Reinforcement Learning Modelle, Algorithmen und Methoden einzuarbeiten.
Fach- & Methodenkompetenzen
Die Studierenden
- können die theoretischen Grundlagen des Reinforcement Learnings erklären. Dazu gehört auch, dass sie die verschiedenen Methoden, Modelle und Methoden beschreiben und voneinander abgrenzen können. Zudem können sie deren jeweilige Vor- und Nachteile erklären.
- analysieren, welche Methoden, Modelle und Algorithmen in welchen Anwendungsszenarien sinnvoll verwendet werden können.
- erklären in eigenen Worten die Bedeutung von Reinforcement Learning in ihrem fachlichen Kontext.
- setzen die Methoden, Modelle und Algorithmen in Python (eine der führenden Programmiersprachen im Bereich des maschinellen Lernens) größtenteils mit Hilfe von Softwarebibliotheken um.
- sind zudem in der Lage, einfachere Modelle per Hand (mit Hilfe des Taschenrechners) zu rechnen und „from scratch“ zu implementieren.
- analysieren das Verhalten ihrer Reinforcement Learning Agenten und bewerten ihre Implementierungen hinsichtlich relevanter kontextspezifischer Anwendungskriterien und Leistungsmetriken.
Überfachliche Kompetenzen
Die Studierenden
- können erfolgreich mit anderen zusammenzuarbeiten und gemeinsame Ziele erreichen.
- erarbeiten in Kleingruppen Vorlesungsinhalte und setzen eigenständig praktische Aufgabenstellungen um.
- erwerben die Fähigkeit komplexe Zusammenhänge nachvollziehbar und überprüfbar aufzubereiten und darzustellen.
|
Inhalt |
Reinforcement Learning ist neben dem Supervised und Unsupervised Learning die dritte Säule des Machine Learnings. Im Gegensatz zu den anderen beiden Teilgebieten wird hier nicht anhand eines vorher gesammelten Datensatzes gelernt sondern meist online in Form eines virtuellen Agenten, der
sich in einer Umgebung beweisen muss. Die Anwendungsgebiete sind zahlreich und umfassen u.a. autonomes Fahren, praktische Optimierungs- und Steuerungsprobleme, Spiele und auch fachliche Spezialdomänen, wie die Proteinfaltung in der Bioinformatik.
In diesem Kurs werden zunächst die theoretischen Grundlagen, wie Markovketten, Markovsche Entscheidungsprozesse und Planen mit Hilfe von Dynamic Programming geklärt. Es folgen Temporal-Difference Learning, Policy Gradient Methoden und eine Einführung in die Verwendung von Funktionsapproximatoren. Zudem wird auf das Zusammenspiel zwischen Lernen und Planen eingegangen als auch auf das Dilemma zwischen Exploration und Exploitation. |
Medien und Methoden |
Beamer, Tafel, Jupyter Notebooks, Moodle |
Literatur |
Literaturliste wird zu Beginn der Veranstaltung bekannt gegeben.
Beispiel-Literatur:
- Sutton, Richard S. & Barto, Andrew G. (2020). Reinforcement Learning. The MIT Press.
- Goodfellow, I., Bengio, Y., & Courville, A. (2016). Deep learning. The MIT Press.
- Lapan, M. (2020). Deep Reinforcement Learning. Mitp Verlag.
- Foster, D. (2019). Generative Deep Learning [Kapitel 8]. O'Reilly
|
Zuordnungen Curricula |
SPO |
Fachgruppe |
Code |
ab Semester |
Prüfungsleistungen |
IG Version 2019 |
EC: Fachliche u. persönliche Profilbildung |
|
1 |
Modularbeit
schriftliche Prüfung
|
IG Version 2019 |
SWE: Fachliche u. persönliche Profilbildung |
|
1 |
Modularbeit
schriftliche Prüfung
|
IS Version 2017 |
WPF Informatik und Wirtschaft |
IF-S-M-I13 |
1 |
Modularbeit
schriftliche Prüfung
|
IG Version 2019 |
VCML: Schwerpunkt |
|
1 |
Modularbeit
schriftliche Prüfung
|
DA Version 2023 |
DA: Anwendungen |
IF-DA-M-A11 |
1 |
Modularbeit
schriftliche Prüfung
|
IG Version 2024 |
EC: Fachliche u. persönliche Profilbildung |
|
1 |
Modularbeit
schriftliche Prüfung
|
IG Version 2024 |
SWE: Fachliche u. persönliche Profilbildung |
|
1 |
Modularbeit
schriftliche Prüfung
|
IG Version 2024 |
VCML: Schwerpunkt |
|
1 |
Modularbeit
schriftliche Prüfung
|
IG Version 2024 |
ITSEC: Fachliche u. persönliche Profilbildung |
|
1 |
Modularbeit
schriftliche Prüfung
|
|