Für die Suche nach Inhalten geben Sie »Content:« vor den Suchbegriffen ein, für die Suche nach Orten geben Sie »Orte:« oder »Ort:« vor den Suchbegriffen ein. Wenn Sie nichts eingeben, wird in beiden Bereichen gesucht.

 

 

Universität Paderborn: Neue Methode erzielt Bestmarken für das automatische Verschriften von GesprächenZoom Button

Die automatische Verschriftung von Gesprächssituationen, wie zum Beispiel bei Arbeitsgruppentreffen, kann das manuelle Protokollieren ersetzen und zu einer Arbeitserleichterung führen. Foto: Universität Paderborn, Informationen zu Creative Commons (CC) Lizenzen, für Pressemeldungen ist der Herausgeber verantwortlich, die Quelle ist der Herausgeber

Universität Paderborn: Neue Methode erzielt Bestmarken für das automatische Verschriften von Gesprächen

Universität Paderborn: Neue Methode erzielt Bestmarken für das automatische Verschriften von Gesprächen

Paderborn, 12. Februar 2025

Gespräche in geselliger Runde oder wichtige Besprechungen im Büro: Die automatische Transkription, also die Verschriftung, von Gesprächssituationen ist eine Herausforderung, die bisher nur unzureichend gelöst war. Zwar ermöglichen moderne Systeme das Verschriften gesprochener Sprache, doch die Erkennungsleistungen liegen noch deutlich unter denen eines Menschen. Wissenschaftler der Fachgruppe »Nachrichtentechnik« am Heinz Nixdorf Institut der Universität Paderborn haben sich dieser Problematik angenommen. Mit innovativen Ansätzen, die auf der Nutzung von Raummikrofonen basieren, haben sie im gemeinsamen Projekt »Automatische Transkription von Gesprächssituationen« mit der Arbeitsgruppe »Machine Learning and Human Language Technology« des Lehrstuhl Informatik 6 der #RWTH #Aachen Methoden entwickelt, um maschinenlesbare Transkriptionen nicht nur präziser, sondern auch kontextsensitiver zu gestalten. So konnten die Forscher Verfahren zur gleichzeitigen Signalverbesserung und Annotation – das heißt, zur Kennzeichnung beziehungsweise Markierung, wer wann gesprochen hat – entwickeln. Diese Methoden erzielten im weltweiten Vergleich, basierend auf einem etablierten Datensatz zur Transkription von Gesprächssituationen, neue Bestwerte. Die Deutsche Forschungsgemeinschaft (DFG) hat das Projekt über drei Jahre mit rund 300.000 Euro gefördert.

Herausforderungen der automatischen #Verschriftung von #Gesprächen

Eine ausgereifte Software zur automatischen Verschriftung von Gesprächen, wie etwa Meetings von Geschäftspartnern oder Arbeitsgruppentreffen, kann das manuelle Protokollieren ersetzen und zu einer Arbeitserleichterung führen. Bisher war die Spracherkennung allerdings besonders in diesem Bereich schwierig. »Umgebungseinflüsse, wie beispielweise Raumhall, haben negativen Einfluss auf die Signalqualität. Zudem kommt es in Gesprächssituationen häufiger vor, dass sich Personen gegenseitig ins Wort fallen oder parallel verlaufende Gespräche unter Teilnehmern entstehen. So überlappen sich dann die Signale mehrerer Sprecher. Doch wir haben es geschafft, Verfahren zu entwickeln, bei denen vorab nicht bekannt sein muss, wie viele Menschen gleichzeitig sprechen oder wie oft sich das ändert«, erklärt Prof. Dr. Reinhold Häb Umbach vom Institut für Elektrotechnik und Informationstechnik sowie Leiter des Fachgebiets »Nachrichtentechnik« am Heinz Nixdorf Institut. »Außerdem war uns wichtig, eine sogenannte ›Ende zu Ende‹ Erkennung zu realisieren, um ungenaue Zwischenergebnisse zu vermeiden. Unsere neuen Methoden haben wir daraufhin überprüft, wie genau sie Sprache erkennen, aber auch bezüglich der Interpretierbarkeit der Teilkomponenten und der Handhabbarkeit bewertet«, ergänzt PD Dr. Ralf Schlüter von der RWTH Aachen.

Wichtiger Fortschritt für automatische #Transkriptionssysteme

Ein #Transkriptionssystem sollte mit beliebig langen Aufnahmen arbeiten und Gesprächssituationen mit einer oder mehreren sprechenden Personen korrekt behandeln können. Dabei muss es in der Lage sein, die Verschriftung der Äußerungen unterschiedlicher Sprecher klar zuzuordnen. Aktuelle Lösungen bestehen aus verschiedenen Bausteinen, die unabhängig voneinander arbeiten: Sie teilen die Daten in gleichartige Abschnitte auf, unterscheiden zwischen verschiedenen Sprechern und erkennen anschließend das Gesprochene. »Unsere Vision war es, diese Ergebnisse deutlich zu verbessern, indem diese Schritte nicht einzeln, sondern als ein zusammenhängender Prozess optimiert werden. Dementsprechend war es unser Ziel, eine kohärente Herangehensweise zu entwickeln, um die Grenzen aktueller Transkriptionssysteme zu überwinden – und das ist uns gelungen«, sagt Häb Umbach. Mehr …

Content bei Gütsel Online …

 
Gütsel
Termine und Events

Veranstaltungen
nicht nur in Gütersloh und Umgebung

September 2025
So Mo Di Mi Do Fr Sa
123456
78910111213
14151617181920
21222324252627
282930
November 2025
So Mo Di Mi Do Fr Sa
1
2345678
9101112131415
16171819202122
23242526272829
30
Dezember 2025
So Mo Di Mi Do Fr Sa
123456
78910111213
14151617181920
21222324252627
28293031
Februar 2026
So Mo Di Mi Do Fr Sa
1234567
891011121314
15161718192021
22232425262728
September 2026
So Mo Di Mi Do Fr Sa
12345
6789101112
13141516171819
20212223242526
27282930
November 2026
So Mo Di Mi Do Fr Sa
1234567
891011121314
15161718192021
22232425262728
2930
Dezember 2026
So Mo Di Mi Do Fr Sa
12345
6789101112
13141516171819
20212223242526
2728293031
Februar 2027
So Mo Di Mi Do Fr Sa
123456
78910111213
14151617181920
21222324252627
28
November 2042
So Mo Di Mi Do Fr Sa
1
2345678
9101112131415
16171819202122
23242526272829
30