10.11.2014
Spracherkennung
1. Teil: „Dragon Naturally Speaking 13 im Test“
Dragon Naturally Speaking 13 im Test
Autor: Andreas Dumont
Foto: Nuance Communications
Zu faul zum Tippen? Dann bitten Sie doch zum Diktat! Die Qualität der Spracherkennungs-Software Dragon Naturally Speaking 13 ist verblüffend gut.
Nach der Installation, die etwas dauert, landet man direkt im Lerncenter, das in 20 Minuten durch die wichtigsten Funktionen des Programms führt. Die neue Version ist sehr fehlertolerant und versteht auch Dialekte und Nuscheln. Sie erkennt zudem interne Mikrofone von Notebooks, sodass ein Headset nicht zwingend notwendig ist.
Kaum Verständnisprobleme
Im Test wurden dem Programm die Seiten 43, 159 und 249 aus dem Buch „Goldstein“ von Volker Kutscher vorgelesen. Im untrainierten Zustand machte Dragon Naturally Speaking auf jeder Seite mit rund 1750 Zeichen durchschnittlich 10,3 Fehler. Mit Hilfe von Training und Korrekturen lässt sich dieser ohnehin schon gute Wert weiter verbessern. Die Korrekturfunktion erfordert etwas Einarbeitung, geht dann aber leicht von der Hand. Um etwa das Wort „Rad“ durch den Namen „Rath“ ersetzen zu lassen, sagt man „korrigier Rad“ und erhält dann mehrere Alternativen zur Auswahl. Mit „nimm eins“ entscheidet man sich für die erste. Ähnlich erfolgen Formatierungen wie „fett“ oder „kursiv“ und die Auswahl von Schriftart und Schriftgröße.
2. Teil: „Probleme bei Groß- und Kleinschreibung“
Probleme bei Groß- und Kleinschreibung
Typische Probleme sind Groß- und Kleinschreibung, Getrennt- und Zusammenschreibung, Eigennamen und Abkürzungen. Im Test gab es mitunter Schwierigkeiten mit Anführungszeichen, die statt als Zeichen als ausgeschriebene Wörter erschienen. Mit der Zeit lernt das Programm aber die Absichten des Sprechers immer besser. Die Premium-Version versteht neben Deutsch auch Englisch in verschiedenen Formen, etwa amerikanisches Englisch.
Die Funktionsvielfalt ist groß: Mit der Software lassen sich E-Mails diktieren, Browser steuern und Programme starten. Häufig verwendete Textbausteine kann man zu einem Kurzbefehl zusammenfassen.
Für iOS gibt es die beiden Apps Dragon Remote Microphone und Dragon Recorder. Erstere macht das Apple-Gerät zu einem Mikrofon, die andere erzeugt aus Spracheingaben eine Audiodatei, die sich auf den PC übertragen und in Text übersetzen lässt. Ein Regler bestimmt, ob Geschwindigkeit oder Genauigkeit im Vordergrund stehen. Eine vierminütige WAV-Datei wandelte das Programm in einer Minute und 20 Sekunden um. Es gibt auch den umgekehrten Weg, sich Text vorlesen zu lassen.
Künstliche Intelligenz
Memary - Langzeitgedächtnis für autonome Agenten
Das Hauptziel ist es, autonomen Agenten die Möglichkeit zu geben, ihr Wissen über einen längeren Zeitraum hinweg zu speichern und abzurufen.
>>
Cloud Infrastructure
Oracle mit neuen KI-Funktionen für Sales, Marketing und Kundenservice
Neue KI-Funktionen in Oracle Cloud CX sollen Marketingspezialisten, Verkäufern und Servicemitarbeitern helfen, die Kundenzufriedenheit zu verbessern, die Produktivität zu steigern und die Geschäftszyklen zu beschleunigen.
>>
Reactive mit Signals
Neuer Vorschlag für Signals in JavaScript
Das für die Standardisierung von JavaScript verantwortliche Komitee macht einen Vorschlag für die Einführung von Signalen in die Programmiersprache. Signals sollen reaktives Programmieren in JavaScript einfacher machen.
>>
Konferenz
Wird generative KI Software-Ingenieure ersetzen? DWX-Keynote
Auf der Developer Week '24 wird Professor Alexander Pretschner von der TU München eine der Keynotes halten. Er klärt auf, ob Ihr Job in Gefahr ist.
>>