Die automatische Verschriftung von Gesprächssituationen, wie zum Beispiel bei Arbeitsgruppentreffen, kann das manuelle Protokollieren ersetzen und zu einer Arbeitserleichterung führen. Foto: Universität Paderborn, Informationen zu Creative Commons (CC) Lizenzen, für Pressemeldungen ist der Herausgeber verantwortlich, die Quelle ist der Herausgeber
Universität Paderborn: Neue Methode erzielt Bestmarken für das automatische Verschriften von Gesprächen
Paderborn, 12. Februar 2025
Gespräche in geselliger Runde oder wichtige Besprechungen im Büro: Die automatische Transkription, also die Verschriftung, von Gesprächssituationen ist eine Herausforderung, die bisher nur unzureichend gelöst war. Zwar ermöglichen moderne Systeme das Verschriften gesprochener Sprache, doch die Erkennungsleistungen liegen noch deutlich unter denen eines Menschen. Wissenschaftler der Fachgruppe »Nachrichtentechnik« am Heinz Nixdorf Institut der Universität Paderborn haben sich dieser Problematik angenommen. Mit innovativen Ansätzen, die auf der Nutzung von Raummikrofonen basieren, haben sie im gemeinsamen Projekt »Automatische Transkription von Gesprächssituationen« mit der Arbeitsgruppe »Machine Learning and Human Language Technology« des Lehrstuhl Informatik 6 der #RWTH #Aachen Methoden entwickelt, um maschinenlesbare Transkriptionen nicht nur präziser, sondern auch kontextsensitiver zu gestalten. So konnten die Forscher Verfahren zur gleichzeitigen Signalverbesserung und Annotation – das heißt, zur Kennzeichnung beziehungsweise Markierung, wer wann gesprochen hat – entwickeln. Diese Methoden erzielten im weltweiten Vergleich, basierend auf einem etablierten Datensatz zur Transkription von Gesprächssituationen, neue Bestwerte. Die Deutsche Forschungsgemeinschaft (DFG) hat das Projekt über drei Jahre mit rund 300.000 Euro gefördert.
Herausforderungen der automatischen #Verschriftung von #Gesprächen
Eine ausgereifte Software zur automatischen Verschriftung von Gesprächen, wie etwa Meetings von Geschäftspartnern oder Arbeitsgruppentreffen, kann das manuelle Protokollieren ersetzen und zu einer Arbeitserleichterung führen. Bisher war die Spracherkennung allerdings besonders in diesem Bereich schwierig. »Umgebungseinflüsse, wie beispielweise Raumhall, haben negativen Einfluss auf die Signalqualität. Zudem kommt es in Gesprächssituationen häufiger vor, dass sich Personen gegenseitig ins Wort fallen oder parallel verlaufende Gespräche unter Teilnehmern entstehen. So überlappen sich dann die Signale mehrerer Sprecher. Doch wir haben es geschafft, Verfahren zu entwickeln, bei denen vorab nicht bekannt sein muss, wie viele Menschen gleichzeitig sprechen oder wie oft sich das ändert«, erklärt Prof. Dr. Reinhold Häb Umbach vom Institut für Elektrotechnik und Informationstechnik sowie Leiter des Fachgebiets »Nachrichtentechnik« am Heinz Nixdorf Institut. »Außerdem war uns wichtig, eine sogenannte ›Ende zu Ende‹ Erkennung zu realisieren, um ungenaue Zwischenergebnisse zu vermeiden. Unsere neuen Methoden haben wir daraufhin überprüft, wie genau sie Sprache erkennen, aber auch bezüglich der Interpretierbarkeit der Teilkomponenten und der Handhabbarkeit bewertet«, ergänzt PD Dr. Ralf Schlüter von der RWTH Aachen.
Wichtiger Fortschritt für automatische #Transkriptionssysteme
Ein #Transkriptionssystem sollte mit beliebig langen Aufnahmen arbeiten und Gesprächssituationen mit einer oder mehreren sprechenden Personen korrekt behandeln können. Dabei muss es in der Lage sein, die Verschriftung der Äußerungen unterschiedlicher Sprecher klar zuzuordnen. Aktuelle Lösungen bestehen aus verschiedenen Bausteinen, die unabhängig voneinander arbeiten: Sie teilen die Daten in gleichartige Abschnitte auf, unterscheiden zwischen verschiedenen Sprechern und erkennen anschließend das Gesprochene. »Unsere Vision war es, diese Ergebnisse deutlich zu verbessern, indem diese Schritte nicht einzeln, sondern als ein zusammenhängender Prozess optimiert werden. Dementsprechend war es unser Ziel, eine kohärente Herangehensweise zu entwickeln, um die Grenzen aktueller Transkriptionssysteme zu überwinden – und das ist uns gelungen«, sagt Häb Umbach. Mehr …
Veranstaltungen
nicht nur in Gütersloh und Umgebung
Februar 2027 | ||||||
---|---|---|---|---|---|---|
So | Mo | Di | Mi | Do | Fr | Sa |
1 | 2 | 3 | 4 | 5 | 6 | |
7 | 8 | 9 | 10 | 11 | 12 | 13 |
14 | 15 | 16 | 17 | 18 | 19 | 20 |
21 | 22 | 23 | 24 | 25 | 26 | 27 |
28 |