19.12.2017
Neural Image Assessment
Google arbeitet an neuronaler Bildbewertung NIMA
Autor: Alexandra Lindner
Denis Linine / shutterstock.com
Google arbeitet an einer neuen Technik zur Bildbewertung und -bearbeitung. Das Tool NIMA soll neben technischen beziehungsweise qualitativen Kriterien auch die Ästhetik beurteilen können.
Google arbeitet an einer neuen Technik zur Bildbewertung, genannt NIMA (Neural Image Assessment). Das auf Machine Learning basierende Tool soll Bilder nicht nur in Hinblick auf die messbare Qualität sondern auch anhand ästhetischer Aspekte beurteilen.
Blogpost schreibt.
Für gewöhnlich teilen derlei Technologien Fotos in zwei Klassen. Eine mit hoher sowie eine mit niedriger Qualität. NIMA soll stattdessen vorhersagen können, ob ein Bild von einem Menschen eher als technisch gut oder aber besonders ästhetisch wahrgenommen wird. Dabei setze die Technologie auf hochmoderne Deep-Object-Recognition-Netzwerke, wie Google in seinem entsprechenden Neben der Kategorisierung soll das Tool auch dabei helfen, die Bilder mittels Künstlicher Intelligenz zu bearbeiten. Dazu zählen unter anderem die Optimierung der visuellen Qualität sowie die Minimierung wahrgenommener visueller Fehler wie zum Beispiel Bildrauschen.
Für die Bewertung der Aufnahmen zieht NIMA Referenzbilder heran. Ist für die vorliegende Grafik eine passende Referenz vorhanden, kommen Bildqualitätsmetriken wie PSNR (Peak-Signal-to-Noise-Ratio), SSIM (Structural Similarity) zum Einsatz. Gibt es hingegen kein passendes Referenzbild, werden "blinde" Ansätze, wie Google es nennt, angewendet. Dabei werden statistische Modelle herangezogen, um die Bildqualität vorherzusagen.
Menschliche Wahrnehmung steht im Fokus
Beide Ansätze verfolgen das Ziel, einen Qualitätsfaktor vorherzusagen, der mit der menschlichen Wahrnehmung übereinstimmt. Ähnliche Techniken ziehen meist den Durchschnittswert heran. NIMA aber nutzt für die Bewertung der Bilder eine Skala von eins bis zehn, wobei für jede mögliche Punktzahl eine Wahrscheinlichkeit errechnet. Die Bewertung mit der höchsten Wahrscheinlichkeit wird als Ergebnis dargestellt.
Um die Genauigkeit von NIMA zu bestätigen, hat Google die damit errechneten Ergebnisse mit einigen Bewertungen von realen Menschen verglichen. Als Referenz diente hierfür eine AVA-Datenbank. AVA steht für "Aesthetic Visual Analysis". Jedes der Testbilder wurde von durchschnittlich 200 Personen bewertet.
Im Vergleichstest lagen die so ermittelten Ergebnisse extrem nah an jenen, die NIMA angegeben hatte.
Im Vergleichstest lagen die so ermittelten Ergebnisse extrem nah an jenen, die NIMA angegeben hatte.
In der Praxis könne NIMA künftig etwa Nutzern bei der Auswahl von Bildern behilflich sein. Auch ein Echtzeit-Feedback bei der Aufnahme von Fotos sei denkbar. So dient die Technologie im Wesentlichen als Schnittstelle für den menschlichen Geschmack.
Künstliche Intelligenz
Microsofts Semantic Kernel eine Million Mal heruntergeladen
Der Microsoft Semantic Kernel stellt eine Verbindung zwischen Code und KI her und scheint ein voller Erfolg. Die Entwicklergemeinde hat die damit verbundenen Möglichkeiten akzeptiert.
>>
Studie
KI ist emotionaler als die meisten Menschen
Trotz der vielen nützlichen Möglichkeiten mindert laut einer Studie immer noch Misstrauen die Effektivität von Anwendungen der Künstlichen Intelligenz.
>>
Konferenz
Wird generative KI Software-Ingenieure ersetzen? DWX-Keynote
Auf der Developer Week '24 wird Professor Alexander Pretschner von der TU München eine der Keynotes halten. Er klärt auf, ob Ihr Job in Gefahr ist.
>>
Test-Framework
Testautomatisierung mit C# und Atata
Atata ist ein umfassendes C#-Framework für die Web-Testautomatisierung, das auf Selenium WebDriver basiert. Es verwendet das Fluent Page Object Pattern und verfügt über ein einzigartiges Protokollierungssystem sowie Trigger-Funktionalitäten.
>>