Audio- und Sprachverarbeitung

Audio- und Sprachverarbeitung

SWS 4
ECTS 5
Sprache(n) Deutsch (Standard)
Englisch
Lehrform SU mit Praktikum
Angebot nach Ankündigung
Aufwand

60 Präsenzstunden, 90 Stunden Eigenarbeit zur Vor-/Nachbereitung, Arbeit an der Modularbeit und zur Vorbereitung der Präsentation

Voraussetzungen

Grundkenntnisse maschinelles Lernen mit neuronalen Netzen, Python. Grundkenntnisse in der Signalverarbeitung sind hilfreich.

Ziele

Die Studierenden sind in der Lage...

  • Die in Audio- und Sprachdaten verfügbaren Informationen zu erkennen
  • Methoden zur Verarbeitung und Analyse von Audiodaten zu implementieren und zu beurteilen
  • Techniken aus der Signalverarbeitung und dem maschinellen Lernen auf Audiodaten anzuwenden
  • Konzeptionelle und praktische Lösungen für audiobasierte Probleme in der realen Welt zu entwerfen
Inhalt
  • Grundlagen der Signalverarbeitung
  • Audio-Features
  • Maschinelles Lernen für Audio
  • Verarbeitung von Umwelt- und Industriegeräuschen
  • Music Information Retrieval
  • Sprach- und Sprechererkennung (z.B. HMMs, neuronale Netze)
  • Audiogenerierung
  • Sprachsynthese und Dialogsysteme
  • Aktuelle Anwendungen (z.B. Denoising, Voice Imitation)
Medien und Methoden
  • Vortrag mit Folien und Beispielen
  • Programmieraufgaben in Python mit Jupyter-Notebooks
  • eigene Vorträge der Studierenden sowie Modularbeit
Literatur
  • Rabiner, L. R., & Schafer, R. W. Digital processing of speech signals.
  • Gold, B., & Morgan, N. Speech and Audio Signal Processing. Wiley.
  • Müller, M. Fundamentals of Music Processing.
  • Virtanen, T., Plumbley, M., & Ellis, D. Computational Analysis of Sound Scenes and Events. Springer.
  • Jurafsky, D., & Martin, J.H. Speech and Language Processing.
Zuordnungen Curricula
SPO Fachgruppe Code ab Semester Prüfungsleistungen

IF Version 2019

FWP

4

benotete Modularbeit (60%)
benotete Präsentation (40%)

IF Version 2023

FWP

4

benotete Modularbeit (60%)
benotete Präsentation (40%)

DC Version 2020

WPF Anwendungen des maschinellen Lernens

4

benotete Modularbeit (60%)
benotete Präsentation (40%)

DC Version 2023

WPF Anwendungen des maschinellen Lernens

DC-WPF-ML-05-011

4

benotete Modularbeit (60%)
benotete Präsentation (40%)

ID Version 2021

ID: Wahlpflichtfach

07-DC-WPF-ML-05-011

6

benotete Modularbeit (60%)
benotete Präsentation (40%)

DE Version WS22

DE: Wahlpflichtfach

6

benotete Modularbeit (60%)
benotete Projektarbeit (40%)

GS Version WS22

GS: Wahlpflichtfach

6

benotete Modularbeit (60%)
benotete Präsentation (40%)