18.04.2024
Codeerzeugung per KI
Code ist sich viel ähnlicher als erwartet
Autor: Online Redaktion
dotnetpro/EMGenie
Eine Studie zeigt, dass einzelne Codezeilen zu 98,3 Prozent redundant sind, was darauf hindeutet, dass Programmiersprachen eine einfache Grammatik haben. Die Machbarkeit von KI-erzeugtem Code war also zu erwarten.
Obwohl viele von der Fähigkeit von Sprachmodellen zur Codeerstellung überrascht waren, deutete eine Reihe von Studien aus der Vergangenheit bereits darauf hin, dass dies möglich sein würde. Forscher haben festgestellt, dass Programmcode ähnliche natürliche Eigenschaften wie menschliche Sprache aufweist, was den Einsatz von Sprachmodellen für Aufgaben wie Codevervollständigung nahelegt.
Die Studie "A Study of the Uniqueness of Source Code" zeigte, dass einzelne Codezeilen zu 98,3 Prozent redundant sind, was darauf hindeutet, dass Programmiersprachen eine einfache Grammatik haben. Die Forscher verwendeten N-Gramm-Modelle, um die Wahrscheinlichkeitsverteilung der Sprache zu lernen und dann vorherzusagen, wie überrascht das Modell von Tokens ist. Dies deutet darauf hin, dass Sprachmodelle durchaus in der Lage sein könnten, Code zu generieren.
Die Forschen verwendeten 420 Millionen Zeilen Code, bereinigten den Datensatz von doppelten Dateien, unterschiedlichen Benennungen für Parameter und Parameterreihenfolgen.
Das Ergebnis für Java beispielsweise ist überraschend. Eine Zeile Java-Code von etwa 6 Token (Schlüsselwort, Operator, Variablenname etc.) war zu 98,3 Prozent zu anderen Zeilen ähnlich. 20 Token, etwa drei Zeilen Code, immerhin noch zu 60 Prozent.
Damit war klar, dass große Sprachmodelle (Large Language Models, LLMs) auch auf Code in verschiedenen Programmiersprachen trainiert werden können. Allerdings gibt es derzeit noch keine Mechanismen, die sicherstellen, dass der Output eines LLM korrekt ist, was deren Anwendbarkeit im klinischen Umfeld erheblich einschränkt.
Künstliche Intelligenz
Memary - Langzeitgedächtnis für autonome Agenten
Das Hauptziel ist es, autonomen Agenten die Möglichkeit zu geben, ihr Wissen über einen längeren Zeitraum hinweg zu speichern und abzurufen.
>>
Cloud Infrastructure
Oracle mit neuen KI-Funktionen für Sales, Marketing und Kundenservice
Neue KI-Funktionen in Oracle Cloud CX sollen Marketingspezialisten, Verkäufern und Servicemitarbeitern helfen, die Kundenzufriedenheit zu verbessern, die Produktivität zu steigern und die Geschäftszyklen zu beschleunigen.
>>
Reactive mit Signals
Neuer Vorschlag für Signals in JavaScript
Das für die Standardisierung von JavaScript verantwortliche Komitee macht einen Vorschlag für die Einführung von Signalen in die Programmiersprache. Signals sollen reaktives Programmieren in JavaScript einfacher machen.
>>
Datenverfügbarkeit
Where EDGE Computing meets 5G
Logistik- und Produktionsprozesse sollen flüssig und fehlerfrei laufen. Maschinen und Personal müssen im Takt funktionieren. Zulieferer haben just-in-time anzuliefern. Dies stellt hohe Anforderungen an die lokale Datenübertragung. Welche Technik bietet sich dazu an?
>>