ESSV Konferenz Elektronische Sprachsignalverarbeitung

Title: Ein echtzeitfähiges Verfahren zur Erkennung von Babyschreien

Authors: Renán Véliz, Stefan Feldes

Abstract:

Es wird ein aufwandsgünstiges Verfahren vorgestellt, welches das Schreien eines Babys in Abgrenzung zu anderen akustischen Signalen detektiert. Der betrachtete Anwendungskontext ist die Situation eines im Schlaf beunruhigten Babys, das zu weinen oder zu schreien beginnt. Die erfolgreiche Detektion kann zur Wiedergabe von beruhigender Musik oder zum Benachrichtigen der Eltern genutzt werden. Der entwickelte Algorithmus basiert auf den Merkmalen Energieverlauf, Stimmhaftigkeit und Stimmgrundfrequenz. Zur Ermittlung der Merkmale wurden verschiedene gängige Verfahren wie LPC-, cepstrale sowie spektrale Korrelationsanalyse auf ihre Eignung in diesem Kontext untersucht. Die Klassifikation erfolgt mit einem speziellen Fensterungsverfahren, das abschnittsübergreifend auf Basis eines Gedächtnisses mit Hysterese und variablen Schwellen arbeitet. So kann mit einstellbarer Verzögerung eine Entscheidung über das Vorliegen eines Babyweinens bzw. Babyschreis getroffen werden. Erste Experimente zur Ermittlung der erzielbaren Erkennungsraten zeigten für LPC- und cepstrales Verfahren vergleichbare Raten (91-92%). Zur Echtzeitimplementierung wurde das LPC-Verfahren wegen geringerem Aufwand gewählt.


Year: 2009
In session: Erkennung
Pages: 56 to 63