27.05.2024
Künstliche Intelligenz
Neuer Benchmark zeigt, was die Sprachmodelle drauf haben
Autor: Online Redaktion
![](/img/1/7/5/8/4/7/6/NIANGPT4o_w320_h200.jpg)
![](/img/1/7/5/8/4/7/6/NIANGPT4o_w480_h300.jpg)
![](/img/1/7/5/8/4/7/6/NIANGPT4o_w640_h400.jpg)
https://nian.llmonpy.ai/
Der neue Test "Needle in a Needlestack" fühlt Großen Sprachmodellen (Large Language Models) auf den Zahn. Vor allem OpenAIs GPT-4o glänzt darin.
Mit dem Benchmark "Needle in a Haystack" will man herausbekommen, wie gut Large Language Models (LLMs) wie die von OpenAI oder Google auf die Inhalte im Kontextfenster eingehen. Nachdem aber die LLMs immer besser wurden, reichte der Test bald nicht mehr aus, um Unterschiede zu zeigen.
Ein neuer Test musste her, und das ist Needle in a Needlestack (NIAN). Dazu erzeugt der Test zuerst eine Liste von Limericks aus einer Datenbank von Limericks. Anschließend stellt er eine spezifische Frage zu einem Limerick.
Die bisherigen Sprachmodelle wie GPT-4-turbo kommen bei diesem Test nicht gut weg. Anders sieht das beim neuen Modell von OpenAI GPT-4o aus. Das glänzt in dem Test. Unklar ist, wie OpenAI das erreicht hat.
Grüne Energie
"GeoStar 2.0" startet Betrieb
Ein Geothermie-Verteilerschacht des Fraunhofer IEG konnte dank innovativer Schrägbohrtechnik komplettiert werden. Erdwärmesonden erreichen damit Wärmereservoire, um das Audimax der Hochschule Bochum effizient und nachhaltig heizen bzw. kühlen zu können.
>>
Digitale Spionage
Neue Studie zu technologiebezogenen Verschwörungstheorien
Technologien spielen eine wichtige Rolle bei der Verbreitung von Verschwörungstheorien und radikalen Meinungen, das zeigt eine neue Studie von Forschenden der Universitäten Paderborn und Göttingen.
>>
Cloud-Sicherheit
Jedes vierte Unternehmen hat Cloud-Ausfälle
Von Cloud-Problemen betroffene Firmen lernen aus den Vorfällen und etablieren Pläne für einen künftigen Notfall, das ist das Ergebnis einer BITKOM-Umfrage.
>>
Neue LLMs
KI-Modelle größer, schneller
Neue Large Language Models (LLM) zeigen, mit welcher Geschwindigkeit die Entwicklung der Künstlichen Intelligenz auch weiterhin voranschreitet.
>>