Mozilla startet freie Spracherkennung

A Aleksii / Shutterstock.com

Mozilla arbeitet an einer freien Spracherkennung: Die Open-Source-Lösung trägt den Namen Common Voice und soll Entwicklern den Zugriff zu Spracherkennungs-Technologie erweitern.

Mozilla sammelt für seine freie Spracherkennung derzeit Sprechproben von freiwilligen Teilnehmern.

Mozilla arbeitet an einer freien Spracherkennungs-Software, um Entwicklern den Zugang zu dieser Art von Technologie zu erleichtern. Wie der Firefox-Entwickler auf der Webseite des Projekts "Common Voice" mitteilt, seien die verfügbaren Spracherkennungs-Technologien derzeit in der Hand von wenigen großen Unternehmen. Dies erschwere vielen Entwicklern das Arbeiten mit der Technologie, da schlichtweg die Datenbasis nicht erreichbar ist. Innovative Lösungen wie Echtzeit-Übersetzer oder alternative Sprachassistenten blieben dadurch auf der Strecke.

Für das Projekt ist Mozilla nun auf die Unterstützung der Community angewiesen. Bis zum Ende des Jahres sollen 10.000 Stunden Sprachmaterial von freiwilligen Teilnehmern gesammelt werden. Diese freie Datenbank soll dann als Grundlage für die Spracherkennungs-Software dienen.

Über die Projekt-Webseite können Unterstützer Sprachproben für Common Voice beisteuern. Hierzu müssen verschiedene vorgegebene Sätze vorgelesen werden. Für die Aufzeichnung muss dem Web-Browser lediglich die Zugriffsberechtigung für das angeschlossene beziehungsweise verbaute Mikrofon erteilt werden. Nach einem Klick auf den Aufnahme-Button kann dann Satz für Satz aufgezeichnet werden. Die eigenen Aufnahmen lassen sich zudem über demographische Daten ergänzen. Hierbei werden Angaben zu Akzent, Alter und Geschlecht abgefragt. Teilnehmer können außerdem die bereits aufgezeichneten Sätze von anderen Unterstützern des Projekts probehören und verifizieren. Aktuell beschränkt sich das Projekt auf die englische Sprache.

Praxisnahe Speech-to-Text-Engine

Um die Audio-Qualität der Aufnahmen müssen sich die Teilnehmer indessen keine Sorge machen. Mozilla möchte möglichst praxisnahe Daten sammeln. Daher spielen auch Hintergrundgeräusche wie Verkehrslärm und dergleichen keine Rolle. Dies erlaube der Speech-to-Text-Engine auch in schwierigen Situationen fehlerfrei zu arbeiten.

Mozilla stellt darüber hinaus in Aussicht, dass die Technologie auch in künftige Versionen des Firefox-Browsers integriert werden könne - das Potenzial hierzu solle die Lösung allemal bieten.

mehr zum Thema

Künstliche Intelligenz

Mozilla startet freie Spracherkennung

Praxisnahe Speech-to-Text-Engine

mehr zum Thema

Memary - Langzeitgedächtnis für autonome Agenten

Oracle mit neuen KI-Funktionen für Sales, Marketing und Kundenservice

Neuer Vorschlag für Signals in JavaScript

Hessen, OXG und Vodafone schließen Partnerschaft für Glasfaser