Audio- und Sprachverarbeitung
Name Audio- und Sprachverarbeitung
SWS 4
ECTS 5
Sprache(n) Deutsch (Standard)
Englisch
Lehrform SU mit Praktikum
Angebot nach Ankündigung
Aufwand

60 Präsenzstunden, 90 Stunden Eigenarbeit zur Vor-/Nachbereitung, Arbeit an der Modularbeit und zur Vorbereitung der Präsentation

Voraussetzungen

Grundkenntnisse maschinelles Lernen mit neuronalen Netzen, Python. Grundkenntnisse in der Signalverarbeitung sind hilfreich.

Ziele

Die Studierenden sind in der Lage...

  • Die in Audio- und Sprachdaten verfügbaren Informationen zu erkennen
  • Methoden zur Verarbeitung und Analyse von Audiodaten zu implementieren und zu beurteilen
  • Techniken aus der Signalverarbeitung und dem maschinellen Lernen auf Audiodaten anzuwenden
  • Konzeptionelle und praktische Lösungen für audiobasierte Probleme in der realen Welt zu entwerfen
Inhalt
  • Grundlagen der Signalverarbeitung
  • Audio-Features
  • Maschinelles Lernen für Audio
  • Verarbeitung von Umwelt- und Industriegeräuschen
  • Music Information Retrieval
  • Sprach- und Sprechererkennung (z.B. HMMs, neuronale Netze)
  • Audiogenerierung
  • Sprachsynthese und Dialogsysteme
  • Aktuelle Anwendungen (z.B. Denoising, Voice Imitation)
Medien und Methoden
  • Vortrag mit Folien und Beispielen
  • Programmieraufgaben in Python mit Jupyter-Notebooks
  • eigene Vorträge der Studierenden sowie Modularbeit
Literatur
  • Rabiner, L. R., & Schafer, R. W. Digital processing of speech signals.
  • Gold, B., & Morgan, N. Speech and Audio Signal Processing. Wiley.
  • Müller, M. Fundamentals of Music Processing.
  • Virtanen, T., Plumbley, M., & Ellis, D. Computational Analysis of Sound Scenes and Events. Springer.
  • Jurafsky, D., & Martin, J.H. Speech and Language Processing.
Zuordnungen Curricula
SPO Fachgruppe Code ab Semester Prüfungsleistungen
IF Version 2019 FWP 4 benotete Modularbeit (60%)
benotete Präsentation (40%)
IF Version 2023 FWP 4 benotete Modularbeit (60%)
benotete Präsentation (40%)
DC Version 2020 WPF Anwendungen des maschinellen Lernens 4 benotete Modularbeit (60%)
benotete Präsentation (60%)
DC Version 2023 WPF Anwendungen des maschinellen Lernens DC-WPF-ML-05-011 4 benotete Modularbeit (60%)
benotete Präsentation (40%)