03.02.2016
Fraunhofer-Forschung
Software passt Sprache an Umgebungslautstärke an
Autor: Jens Stark
Shutterstock/Fotos593
Lautsprecherdurchsagen an Bahnhöfen sind wegen des allgemeinen Lärmpegels oftmals unverständlich. Mit einer Software des deutschen Fraunhofer Instituts soll sich das ändern lassen.
Rattert ein Güterzug vorbei, versteht man von einer Durchsage wie "Der Zug nach München fährt heute ausnahmsweise auf Gleis ..." oftmals nur die Hälfte. Das könnte sich künftig ändern. Forscher der Projektgruppe Hör-, Sprach- und Audiotechnologie des Fraunhofer-Instituts für Digitale Medientechnologie IDMT haben eine Software entwickelt, die die Verständlichkeit von Sprache deutlich verbessert – auch bei den Stimmen von Sprechern auf Konferenzen oder Gesprächen über Mobiltelefone.
Mikrofon analysiert Lärmpegel
Zum einen kommt es darauf an, bestimmte Tonhöhen, die Frequenzen, gezielt zu verstärken. Vokale sind relativ tiefe und langgezogene Wortteile, die gut zu verstehen sind. Konsonanten wie "p", "t" und "k" hingegen sind sehr kurz und haben höhere Frequenzen. Sie sind in lauter Umgebung in der Regel weniger gut zu verstehen, für das Sprachverständnis aber sehr wichtig. So hängt zum Beispiel vom Konsonanten ab, ob der Empfänger "Kasse" oder "Tasse" versteht. "Unsere Algorithmen sind in der Lage, bestimmte Frequenzen zu gewichten und zum richtigen Zeitpunkt genau jene zu verstärken, die durch die Umgebungsgeräusche besonders gestört werden", ergänzt Rennies-Hochmuth.
Leise Sprachanteile verstärken
Zum zweiten berücksichtigt die Software auch die unterschiedlich lauten Anteile des Sprachsignals. Da sich gesprochene Sprache aus lauten und leisen Teilen zusammensetzt, sprechen Fachleute von Sprachdynamik. Die Sprachverständlichkeit erhöht sich vor allem dann, wenn laute Anteile gezielt gedämpft, leise Anteile gezielt verstärkt werden. Diese Technik wird Dynamic Range Compression (DRC) genannt. Das ist beispielsweise auch dann von Interesse, wenn man mit einem Mobiltelefon an einer lauten Strasse telefoniert.
Die ADAPT DRC-Software ist bereits bis zur Anwendungsreife entwickelt und steht Industriepartnern zur Verfügung. Da Mobiltelefone oder Anlagen für Konferenzen heute bereits über eingebaute Mikrofone verfügen, bringen die Geräte schon die erforderliche Technik mit, um den Umgebungslärm aufnehmen zu können. Für Lautsprecheranlagen auf Bahnhöfen oder in Flughäfen müssten zunächst zusätzliche Mikrofone installiert werden.
Bad News
Game macht Fake News spielerisch erkennbar
Wissenschaftler der Universität Uppsala haben ihr Online-Spiel "Bad News" erfolgreich an 516 Schülern getestet. Es soll helfen, manipulative Techniken in Social-Media-Posts zu erkennen.
>>
Test-Framework
Testautomatisierung mit C# und Atata
Atata ist ein umfassendes C#-Framework für die Web-Testautomatisierung, das auf Selenium WebDriver basiert. Es verwendet das Fluent Page Object Pattern und verfügt über ein einzigartiges Protokollierungssystem sowie Trigger-Funktionalitäten.
>>
Salzbatterie
Neuer Super-Akku lädt in wenigen Sekunden
Eine neue Batterie des Korea Advanced Institute of Science and Technology (KAIST) lädt binnen Sekunden. Als Basismaterial kommt das auf der Erde in großen Mengen vorkommende Natrium zum Einsatz.
>>
Programmiersprache
Primärkonstruktoren in C# erleichtern den Code-Refactoring-Prozess
Zusammenfassen, was zusammen gehört: Dabei helfen die in C# 12 neu eingeführten Primärkonstruktoren, indem sie Code kürzer und klarer machen.
>>