25.07.2017
Common Voice
Mozilla startet freie Spracherkennung
Autor: Stefan Bordel
A Aleksii / Shutterstock.com
Mozilla arbeitet an einer freien Spracherkennung: Die Open-Source-Lösung trägt den Namen Common Voice und soll Entwicklern den Zugriff zu Spracherkennungs-Technologie erweitern.
Mozilla arbeitet an einer freien Spracherkennungs-Software, um Entwicklern den Zugang zu dieser Art von Technologie zu erleichtern. Wie der Firefox-Entwickler auf der Webseite des Projekts "Common Voice" mitteilt, seien die verfügbaren Spracherkennungs-Technologien derzeit in der Hand von wenigen großen Unternehmen. Dies erschwere vielen Entwicklern das Arbeiten mit der Technologie, da schlichtweg die Datenbasis nicht erreichbar ist. Innovative Lösungen wie Echtzeit-Übersetzer oder alternative Sprachassistenten blieben dadurch auf der Strecke.
Für das Projekt ist Mozilla nun auf die Unterstützung der Community angewiesen. Bis zum Ende des Jahres sollen 10.000 Stunden Sprachmaterial von freiwilligen Teilnehmern gesammelt werden. Diese freie Datenbank soll dann als Grundlage für die Spracherkennungs-Software dienen.
Über die Projekt-Webseite können Unterstützer Sprachproben für Common Voice beisteuern. Hierzu müssen verschiedene vorgegebene Sätze vorgelesen werden. Für die Aufzeichnung muss dem Web-Browser lediglich die Zugriffsberechtigung für das angeschlossene beziehungsweise verbaute Mikrofon erteilt werden. Nach einem Klick auf den Aufnahme-Button kann dann Satz für Satz aufgezeichnet werden. Die eigenen Aufnahmen lassen sich zudem über demographische Daten ergänzen. Hierbei werden Angaben zu Akzent, Alter und Geschlecht abgefragt. Teilnehmer können außerdem die bereits aufgezeichneten Sätze von anderen Unterstützern des Projekts probehören und verifizieren. Aktuell beschränkt sich das Projekt auf die englische Sprache.
Praxisnahe Speech-to-Text-Engine
Um die Audio-Qualität der Aufnahmen müssen sich die Teilnehmer indessen keine Sorge machen. Mozilla möchte möglichst praxisnahe Daten sammeln. Daher spielen auch Hintergrundgeräusche wie Verkehrslärm und dergleichen keine Rolle. Dies erlaube der Speech-to-Text-Engine auch in schwierigen Situationen fehlerfrei zu arbeiten.
Mozilla stellt darüber hinaus in Aussicht, dass die Technologie auch in künftige Versionen des Firefox-Browsers integriert werden könne - das Potenzial hierzu solle die Lösung allemal bieten.
Künstliche Intelligenz
Memary - Langzeitgedächtnis für autonome Agenten
Das Hauptziel ist es, autonomen Agenten die Möglichkeit zu geben, ihr Wissen über einen längeren Zeitraum hinweg zu speichern und abzurufen.
>>
Cloud Infrastructure
Oracle mit neuen KI-Funktionen für Sales, Marketing und Kundenservice
Neue KI-Funktionen in Oracle Cloud CX sollen Marketingspezialisten, Verkäufern und Servicemitarbeitern helfen, die Kundenzufriedenheit zu verbessern, die Produktivität zu steigern und die Geschäftszyklen zu beschleunigen.
>>
Reactive mit Signals
Neuer Vorschlag für Signals in JavaScript
Das für die Standardisierung von JavaScript verantwortliche Komitee macht einen Vorschlag für die Einführung von Signalen in die Programmiersprache. Signals sollen reaktives Programmieren in JavaScript einfacher machen.
>>
Schellerer Ausbau
Hessen, OXG und Vodafone schließen Partnerschaft für Glasfaser
Vodafone und OXG starten gemeinsam mit dem Land Hessen eine umfangreiche Ausbau-Offensive für schnelles Internet. Bis 2030 wollen die Unternehmen Glasfaser-Anschlüsse für bis zu 520.000 Haushalte bauen.
>>