Reinforcement Learning
Name Reinforcement Learning
SWS 4
ECTS 5
Sprache(n) Deutsch (Standard)
Englisch
Lehrform SU mit Übung
Angebot nach Ankündigung
Aufwand

30 Präsenzstunden Vorlesung, 30 Präsenzstunden Praktikum, 45 Stunden Vor-/Nachbereitung des Praktikums, 45 Stunden Nachbereitung der Vorlesung und Prüfungsvorbereitung

Voraussetzungen

Grundlegende Programmierkenntnisse (am Besten in Python), grundlegende Kenntnisse der Wahrscheinlichkeitsrechnung auf Bachelor Niveau;vorteilhaft sind grundlegende Kenntnisse aus dem Bereich stochastischer Prozesse (Markovketten, Markov-Entscheidungsprozesse) und Deep Learning

Ziele

Lernziele

  • Die Studierenden werden in die Lage versetzt, Modelle und Methoden aus dem Bereich des Reinforcement Learnings als Lösungsstrategie in verschiedensten Anwendungsszenarien methodisch korrekt und sicher einsetzen zu können. Der Fokus liegt auf der Grundlagenausbildung.
  • Zudem werden die Studierenden befähigt, sich schnell in neue und aktuelle Reinforcement Learning Modelle, Algorithmen und Methoden einzuarbeiten.

Fach- & Methodenkompetenzen

Die Studierenden

  • können die theoretischen Grundlagen des Reinforcement Learnings erklären. Dazu gehört auch, dass sie die verschiedenen Methoden, Modelle und Methoden beschreiben und voneinander abgrenzen können. Zudem können sie deren jeweilige Vor- und Nachteile erklären.
  • analysieren, welche Methoden, Modelle und Algorithmen in welchen Anwendungsszenarien sinnvoll verwendet werden können.
  • erklären in eigenen Worten die Bedeutung von Reinforcement Learning in ihrem fachlichen Kontext.
  • setzen die Methoden, Modelle und Algorithmen in Python (eine der führenden Programmiersprachen im Bereich des maschinellen Lernens) größtenteils mit Hilfe von Softwarebibliotheken um.
  • sind zudem in der Lage, einfachere Modelle per Hand (mit Hilfe des Taschenrechners) zu rechnen und „from scratch“ zu implementieren.
  • analysieren das Verhalten ihrer Reinforcement Learning Agenten und bewerten ihre Implementierungen hinsichtlich relevanter kontextspezifischer Anwendungskriterien und Leistungsmetriken.

Überfachliche Kompetenzen

Die Studierenden

  • können erfolgreich mit anderen zusammenzuarbeiten und gemeinsame Ziele erreichen.
  • erarbeiten in Kleingruppen Vorlesungsinhalte und setzen eigenständig praktische Aufgabenstellungen um.
  • erwerben die Fähigkeit komplexe Zusammenhänge nachvollziehbar und überprüfbar aufzubereiten und darzustellen.
Inhalt

Reinforcement Learning ist neben dem Supervised und Unsupervised Learning die dritte Säule des Machine Learnings. Im Gegensatz zu den anderen beiden Teilgebieten wird hier nicht anhand eines vorher gesammelten Datensatzes gelernt sondern meist online in Form eines virtuellen Agenten, der sich in einer Umgebung beweisen muss. Die Anwendungsgebiete sind zahlreich und umfassen u.a. autonomes Fahren, praktische Optimierungs- und Steuerungsprobleme, Spiele und auch fachliche Spezialdomänen, wie die Proteinfaltung in der Bioinformatik.

In diesem Kurs werden zunächst die theoretischen Grundlagen, wie Markovketten, Markovsche Entscheidungsprozesse und Planen mit Hilfe von Dynamic Programming geklärt. Es folgen Temporal-Difference Learning, Policy Gradient Methoden und eine Einführung in die Verwendung von Funktionsapproximatoren. Zudem wird auf das Zusammenspiel zwischen Lernen und Planen eingegangen als auch auf das Dilemma zwischen Exploration und Exploitation.

Medien und Methoden

Beamer, Tafel, Jupyter Notebooks, Moodle

Literatur

Literaturliste wird zu Beginn der Veranstaltung bekannt gegeben. Beispiel-Literatur:

  • Sutton, Richard S. & Barto, Andrew G. (2020). Reinforcement Learning. The MIT Press.
  • Goodfellow, I., Bengio, Y., & Courville, A. (2016). Deep learning. The MIT Press.
  • Lapan, M. (2020). Deep Reinforcement Learning. Mitp Verlag.
  • Foster, D. (2019). Generative Deep Learning [Kapitel 8]. O'Reilly
Zuordnungen Curricula
SPO Fachgruppe Code ab Semester Prüfungsleistungen
IG Version 2019 EC: Fachliche u. persönliche Profilbildung 1 Modularbeit
schriftliche Prüfung
IG Version 2019 SWE: Fachliche u. persönliche Profilbildung 1 Modularbeit
schriftliche Prüfung
IS Version 2017 WPF Informatik und Wirtschaft IF-S-M-I13 1 Modularbeit
schriftliche Prüfung
IG Version 2019 VCML: Schwerpunkt 1 Modularbeit
schriftliche Prüfung
DA Version 2023 DA: Anwendungen IF-DA-M-A11 1 Modularbeit
schriftliche Prüfung
IG Version 2024 EC: Fachliche u. persönliche Profilbildung 1 Modularbeit
schriftliche Prüfung
IG Version 2024 SWE: Fachliche u. persönliche Profilbildung 1 Modularbeit
schriftliche Prüfung
IG Version 2024 VCML: Schwerpunkt 1 Modularbeit
schriftliche Prüfung
IG Version 2024 ITSEC: Fachliche u. persönliche Profilbildung 1