Forscher aus den USA haben ein neues KI-System entwickelt, dass es Trägern von Kopfhörern erlaubt, Geräusche selektiv auszublenden. Übrig bleibt nur die Stimme eines Gesprächsteilnehmers. Wir erklären dir, wie die neuartigen KI-Kopfhörer funktionieren.
Ein Blick genügt und schon hört man nur die Person, die man anschaut: So soll eine neue Kopfhörer-Technologie funktionieren. Dafür hat ein Forschungsteam der University of Washington ein KI-System entwickelt. „In belebten Umgebungen kann sich das menschliche Gehirn auf die Sprache eines Zielsprechers konzentrieren, wenn es vorher weiß, wie dieser klingt“, erklären die Wissenschaftler:innen. Nun soll das auch eine Künstliche Intelligenz können.
So filtern die KI-Kopfhörer einzelne Stimmen
Das neue KI-System wurde in handelsübliche Kopfhörer integriert. Sie blenden akustische Störungen aus und verbessern so das Audio-Erlebnis. Doch bestimmte Geräusche zu filtern, stellte Entwickler:innen bisher vor eine Herausforderung. Das sogenannte Target Speech Hearing aus Washington ist allerdings schon einen Schritt weiter.
Neue Stellenangebote
Mitarbeiter*in (m/w/d) für Social Media, Öffentlichkeitsarbeit und Städtepartnerschaft (m/w/d) meinestadt.de in Sachsenheim |
||
Content Creator / Social Media / Marketing (m/w/d) Halloren Schokoladenfabrik AG in Delitzsch |
||
Social Media Manager:in und Digital Content Creator:in (m/w/d) Körpergut Akademie GmbH in bundesweit, Home-Office |
„Mit unseren Geräten kann man nun einen einzelnen Sprecher klar und deutlich hören, auch wenn man sich in einer lauten Umgebung befindet, in der viele andere Menschen sprechen“, erklärt der Hauptautor der Studie Shyam Gollakota, Professor an der Paul G. Allen School of Computer Science & Engineering.
Um das System zu nutzen, muss man an den Kopfhörer tippen und per Knopfdruck die außen angebrachte Mikrofone aktivieren. Der Kopf sollte außerdem für drei bis fünf Sekunden der sprechenden Person zugewandt sein.
Die Schallwellen der Sprecherstimme sollten daraufhin die Mikrofone erreichen. Der KI-Kopfhörer sendet das Signal dann an einen integrierten Computer, auf dem die maschinelle Lernsoftware das Stimmmuster des Sprechenden lernt.
KI-System sammelt Trainingsdaten, um sich zu verbessern
Das System merkt sich die Stimme und gibt sie anschließend wieder. Auf diese Weise bleibt inmitten von Umgebungsgeräuschen nur die Sprecherstimme übrig – auch, nachdem sich der Zuhörende bewegt oder den Blickkontakt verliert. Je länger das KI-System zuhört, desto mehr Trainingsdaten kann es sammeln. So verbessert sich mit dem laufenden Gespräch auch die Fähigkeit, sich auf die Sprecherstimme zu konzentrieren.
Bisher testete das Team die Technologie an 21 Menschen. Sie schätzten die Klarheit der Sprecherstimme im Durchschnitt fast doppelt so hoch ein wie die ungefilterten Audiodaten. Die Ergebnisse bauen auf früheren Arbeiten zum semantischen Hören auf. Dabei konnten User bestimmte Geräuschklassen wie Vögel oder Stimmen auswählen und andere Geräusche in der Umgebung ausblenden.
Momentan können die KI-Kopfhörer nur einen Sprechenden registrieren, wenn keine andere laute Stimme aus der gleichen Richtung kommt. Allerdings arbeitet das Forschungsteam daran, das System auch auf Ohrstöpsel und Hörgeräte auszuweiten. Denn hörgeschädigte Personen könnten ihre Hörfähigkeit in lauten Umgebungen künftig mithilfe der Technologie verbessern.
Auch interessant: