Beethoven oder BeeGees - Klassifizierung von Sprach- und Audiosignalen

18.03.2010 - Meike Klinck

nagathil Wie das Ohr eines Musikkenners sollen mobile Endgeräte wie MP3-Spieler oder Smartphone in Zukunft einzelne Musikstile identifizieren können. Anil Nagathil vom Institut für Kommunikationsakustik der Ruhr-Universität entwickelte in seiner Diplomarbeit eine Methode, um Sprach- und Audiosignale zu klassifizieren. Die Deutsche Gesellschaft für Akustik, kurz DEGA, würdigte seine Arbeit am 16. März 2010 mit ihrem Studienpreis.

weiterlesen

In seiner Diplomarbeit unter dem Titel „Development and Analysis of Robust Features for the Classification of Audio Signals“ widmet sich Anil Nagathil den Signalen von Sprache, Musik und Geräuschen. Dabei entwickelt er spezifische Merkmale für weibliche und männliche Stimmen sowie die Genres Klassik, Elektronische Musik, Pop, Rhythm&Blues und Rock. Anhand dieser Charakteristika können beispielsweise alle Daten einer elektronischen Musiksammlung automatisch identifiziert, klassifiziert und anschließend strukturiert werden.

Zum Untersuchungsdesign: Die von Anil Nagathil entwickelten Merkmale beruhen auf dem Modulationsspektrum cepstraler Koeffizienten. Dieses wird durch Kurzzeit-Fouriertransformation aus den linearen cepstralen Koeffizienten gewonnen. Neuartige Regressionskoeffizienten, die auf dem Modulationsspektrum der cepstralen Koeffizienten berechnet werden, ermöglichen neben der Klassifikation von Sprache, Musik und Geräusch auch die Unterscheidung in weibliche und männliche Stimmen. In einem zweiten Schritt entwickelt Anil Nagathil neue Merkmale für die Genreklassifikation, die auf einem hoch aufgelösten Modulationsspektrum der Cepstralkoeffizienten beruhen.

Diese Signaldarstellung ermöglicht die Auswertung der Modulationen der Energie, der spektralen Einhüllenden, der durch hohe Grundfrequenzen dominierten Komponenten und der durch niedrige Grundfrequenzen dominierten Komponenten. Anil Nagathil kann in seiner Untersuchung zeigen, dass für die Genreklassifikation eine hohe Auflösung im Modulationsfrequenzbereich sehr hilfreich ist. In der Simulation vergleicht Anil Nagathil das neue Verfahren mit einem aus der Literatur bekannten Standardverfahren und kann eine deutliche Verbesserung nachweisen.

Tags: Anil NAgathil, DEGA, kommunikationsakustik, Studienpreis