ESSV Konferenz Elektronische Sprachsignalverarbeitung

Title: Transkription von Schlagzeugaufnahmen unter Verwendung des UASR-Systems

Authors: Stephan Hübler, Johannes Völkner, Rüdiger Hoffmann

Abstract:

Die Transkription von Musiksignalen, daher die Überführung von Audiomaterial in eine symbolische Repräsentation, stellt eine Herausforderung im Forschungsbereich Music Information Retrieval dar. Der vorliegende Beitrag beschreibt die automatische Transkription unterschiedlicher Trommeln und Becken in Schlagzeugaufnahmen. Die Aufgabe der Transkription ist es folgende Frage zu beantworten: Was wird wann gespielt? Es werden zwei verschiedene Ansätze zur Beantwortung dieser Fragen präsentiert. Der Ansatz Segmentierung und Klassifizierung teilt das Audiosignal in bedeutungsvolle Einheiten, welche anschließend klassifiziert werden, womit zunächst das wann und anschließend das was beantwortet wird. Der zweite Ansatz verwendet ein Erkennungsnetzwerk mit Hidden MarkovModellen, womit die Frage nach dem wann und was simultan beantwortet wird. Für die Evaluierung werden zwei Datenbanken verwendet: eine MIDI-Datenbank mit synthetisch erzeugten Schlagzeugsignalen und die frei verfügbare Datenbank ENST-Datenbank mit realen Schlagzeugaufnahmen. Für das Training, die Erkennung und die Evaluierung wird das Open Source UASR-System (Unified Approach for Signal Analysis and Recognition) verwendet, womit dessen Einsatzmöglichkeit für musikalische Signale gezeigt werden kann.


Year: 2014
In session: Erfassung und Beurteilung von Sprach- und Musiksignalen
Pages: 256 to 263