Wie man Stimmen aus dem Chaos hört: Die Kunst des Stimmen-Extrahierens

Stell dir vor, du könntest die Stimme deines Freundes aus einem lauten Raum heraushören. Forschende haben eine Methode entwickelt, die genau das kann.

Hast du schon mal versucht, in einem lauten Raum nur die Stimme einer bestimmten Person herauszuhören? Das kann ganz schön schwierig sein. Stell dir vor, du bist in einer großen Halle und viele Menschen reden gleichzeitig. Es gibt eine Methode, die es möglich macht, die Stimme einer bestimmten Person aus diesem Durcheinander herauszuhören.

Was die Forschenden herausgefunden haben

Die Forschenden haben eine Methode namens „Listen to Extract“ (LExt) entwickelt. Diese Methode kann die Stimme einer bestimmten Person aus einem Gemisch von Stimmen herausfiltern. Sie haben gezeigt, dass LExt sehr gut funktioniert und die Stimme der gewünschten Person klar heraushören kann.

Wie haben sie das gemacht?

Um das zu erreichen, haben die Forschenden eine spezielle Technik verwendet. Sie nehmen eine kurze Aufnahme der Stimme der Person, die sie heraushören wollen, und fügen diese Aufnahme an den Anfang des Gemischs aus vielen Stimmen. Dann trainieren sie ein spezielles Computerprogramm, das diese Aufnahme erkennt und die Stimme der gewünschten Person aus dem Gemisch herausfiltert. Das Programm lernt, die Stimme der gewünschten Person anhand der kurzen Aufnahme zu erkennen und zu extrahieren.

Warum ist das wichtig?

Diese Methode ist sehr nützlich, weil sie in vielen Bereichen angewendet werden kann. Zum Beispiel in der Medizin, um die Stimme eines Patienten aus einem lauten Krankenhauszimmer herauszuhören, oder in der Sicherheitstechnik, um die Stimme einer bestimmten Person aus einem Überwachungsvideo zu extrahieren.

Du willst mehr über die Studie wissen?

Die Forschenden, die diese Methode entwickelt haben, heißen Pengjie Shen, Kangrui Chen, Shulin He, Pengru Chen, Shuqi Yuan, He Kong, Xueliang Zhang und Zhong-Qiu Wang. Sie haben ihre Ergebnisse in einem wissenschaftlichen Artikel veröffentlicht.

Zum Original-Paper auf ArXiv