Wiedererkennung von Audiosignalen - Verfahren und Anwendungen

Abstract:

Der vorliegende Beitrag beschäftigt sich mit Verfahren und Anwendungsmöglichkeiten der Wiedererkennung von Audiosignalen. Charakteristisch ist dabei, dass dabei nur geringe Abweichungen zwischen dem zu identifizierenden Muster und den Referenzdaten zugelassen werden. Dadurch gestaltet sich die eigentliche Erkennung relativ einfach. Andererseits werden aber hohe Anforderungen an die Effizienz und Zuverlässigkeit dieser Verfahren gestellt, die entsprechende Signalverarbeitungsmethoden benötigen. So erfordert ein Teil der Anwendungen Echtzeit-Lösungen, andere Anwendungen sind wiederum durch sehr große Datenbasen charakterisiert. Verfahren der beschriebenen Art kommen bereits in vielfältigen Applikationen zum Einsatz, insbesondere bei der Überwachung von Copyrights und Werbeverträgen, zur Identifikation von Musiktiteln, in der Marktforschung oder der Ausblendung bestimmter Abschnitte in Rundfunk- und Fernsehprogrammen. Neben einer kurzen Betrachtung grundlegender Ansätze wird ein im Einsatz befindliches System in seinen Hauptkomponenten vorgestellt. Dieses System ermöglicht es, vom Anwender vorgegebene Soundmuster begrenzter Länge - z.B. Musik, Sprache, Geräusche, Filmausschnitte, Werbeeinblendungen, Jingles etc. im laufenden Audiosignal von Rundfunk- und Fernsehprogrammen in Echtzeit zu identifizieren. Die Lösung besteht aus einer Programmkomponente, die die Generierung von spezifischen Datenbanken ermöglicht, in denen die Referenzdaten in komprimierter Form gespeichert werden, sowie einer Detektorkomponente, die in Echtzeit läuft und die von einer Videokarte gelieferten Soundsignale verarbeitet.


Year: 2004
In session: Spracherkennung
Pages: 133 to 139