ESSV Konferenz Elektronische Sprachsignalverarbeitung

Title: Vergleich statistischer Klassifikatoren zur Ermittlung musikalischer Aspekte

Authors: Stephan Hübler, Matthias Wolff, Matthias Eichner

Abstract:

Menschen beschreiben Musik mit einfachen, signalfernen, bedeutungsvollen Aspekten. Deren automatische Gewinnung aus dem Musiksignal bildet die Grundlage für eine Annotation von Musiktiteln und damit einer Vielzahl von weiteren Anwendungen unter anderem Musikempfehlungssysteme, Navigieren durch Musiksammlungen sowie deren Visualisierung und das Bilden von Kaufempfehlungen. Gegenstand der Untersuchung sind sechs Aspekte (Instrument Density, Music Color, Percussiveness, Sing Detection, Style, Tempo) mit jeweils zwei bis zehn Ausprägungen. Aus statistischer Sicht werden Merkmalvektoren, hinter denen sich Ausprägungen eines Aspektes verbergen, beobachtet. Dabei handelt es sich um verschiedene Low- und Midlevel-Merkmale. Da Musiksignale Informationen in ihrer zeitlichen Struktur tragen, wird insbesondere der zeitliche Verlauf in die Untersuchung mit einbezogen. Zunächst wird eine Klassifikationsentscheidung pro Merkmalvektor eines Musiktitels getroffen, welche dann zu einer Gesamtentscheidung bezüglich der Auspräung eines Aspektes für den Song führt. Es werden die Ergebnisse für die Klassifikation von perzeptuellen musikalischen Aspekten eines Musikstückes mittels statistischer GMM und HMM basierender Klassifikatoren präsentiert.


Year: 2009
In session: Anwendungen auf Musiksignale
Pages: 338 to 345