Künstliche Intelligenz
26.10.2020
Lecture Translator

KI übertrifft Mensch bei Spracherkennung

Autor:
KIT
Ein alltägliches Gespräch zu verfolgen und genau wiederzugeben ist eine der größten Herausforderungen in der Forschung an Künstlicher Intelligenz (KI).
Forschern des Karlsruher Instituts für Technologie (KIT) ist es nun erstmals gelungen, mit einem Computersystem die Erkennungsgenauigkeit des Menschen beim Erkennen solcher spontan gesprochener Sprache zu übertreffen – und dies mit nur minimaler Verzögerung zum Sprechen. Ein Team aus KIT-Wissenschaftlern und Mitarbeitern der Firma KITES, einer Ausgründung aus dem KIT, hat nun weltweit erstmals ein Computersystem programmiert, das diese Aufgabe besser erledigt als Menschen und schneller als andere Systeme.
Alex Waibel, Professor für Informatik am KIT, hat bereits einen automatischen Live-Übersetzer entwickelt, der Universitätsvorlesungen aus dem Deutschen oder Englischen schritthaltend mit der Vorlesung in die Sprachen ausländischer Studierender überträgt. Der Lecture Translator ist seit 2012 in den Hörsälen des KIT im Einsatz. »Die Erkennung spontaner Sprache ist die wichtigste Komponente in diesem System«, erläutert Waibel, »da
Fehler und Verzögerungen bei der Erkennung die Übersetzung unverständlich machen. Die menschliche Fehlerrate liegt hier bei um die 5,5 Prozent. Unser System erreicht nun 5,0 Prozent.« Allerdings sei nicht nur die Genauigkeit ausschlaggebend, sondern auch, wie rasch das System das Ergebnis ausgibt, damit Studierende der Vorlesung live folgen können. Diese Verzögerung konnten die Forscher erstmalig auf eine Sekunde reduzieren. Das sei der niedrigste Wert in der sogenannten Latenz, den je ein Spracherkennungssystem dieser Qualität erreicht habe, betont Waibel.
Gemessen werden Fehlerrate und Verzögerung mit dem standardisierten und wissenschaftlich international anerkannten Switchboard-Benchmark-Test.

mehr zum Thema