11.04.2024
Künstliche Intelligenz
GPT-4 Turbo with Vision - ein Rückschritt für das Coding
Autor: Online Redaktion
dotnetpro
Laut einem Bericht von Aider, einem führenden Anbieter von KI-gestützten Codiertools, ist die neueste Version von GPT-4 Turbo mit Vision-Funktionalität ein Rückschritt für die Codequalität.
Die Analyse zeigt, dass der neue GPT-4 Turbo mit Vision-Modell im Vergleich zu früheren GPT-4-Modellen deutlich schlechter bei Coding-Benchmarks abschneidet. Insbesondere scheint das Modell anfälliger für "faules Codieren" zu sein, bei dem wichtige Codeabschnitte ausgelassen und stattdessen Kommentare mit Hausaufgaben-ähnlichen Anweisungen hinterlassen werden.
In einem Benchmark, der 133 Exercism-Python-Übungen umfasst, erzielte GPT-4 Turbo mit Vision nur 62 Prozent Erfolgsquote - der niedrigste Wert aller GPT-4-Modelle. Die anderen Modelle erzielten 63 bis 66 Prozent, was laut Aider statistisch gesehen nur eine geringe Verschlechterung darstellt.
Noch deutlicher ist der Unterschied bei Aiders "Faulheits-Benchmark", der 89 Python-Refactoring-Aufgaben umfasst. Hier erreichte das neue GPT-4 Turbo mit Vision-Modell nur 34 Prozent - den schlechtesten Wert aller GPT-4 Turbo-Modelle.
Trotz dieser Ergebnisse bietet Aider weiterhin Unterstützung für das neue GPT-4 Turbo mit Vision-Modell an. Standardmäßig empfiehlt das Unternehmen jedoch weiterhin die Verwendung des GPT-4-1106-Preview-Modells, da es deutlich bessere Coding-Fähigkeiten aufweist.
Aider ist ein Befehlszeilentool, mit dem Sie Programme mit GPT-3.5/GPT-4 koppeln können, um Code zu bearbeiten, der in Ihrem lokalen Git-Repository gespeichert ist. Aider bearbeitet direkt den Code in lokalen Quelldateien und überträgt die Änderungen mit sinnvollen Übergabemeldungen an Git. Sie können ein neues Projekt starten oder mit einem bestehenden Git-Repository arbeiten. Das Besondere an Aider ist, dass Sie Änderungen an bereits existierenden, größeren Codebasen vornehmen können.
Künstliche Intelligenz
Microsofts Semantic Kernel eine Million Mal heruntergeladen
Der Microsoft Semantic Kernel stellt eine Verbindung zwischen Code und KI her und scheint ein voller Erfolg. Die Entwicklergemeinde hat die damit verbundenen Möglichkeiten akzeptiert.
>>
Studie
KI ist emotionaler als die meisten Menschen
Trotz der vielen nützlichen Möglichkeiten mindert laut einer Studie immer noch Misstrauen die Effektivität von Anwendungen der Künstlichen Intelligenz.
>>
Konferenz
Wird generative KI Software-Ingenieure ersetzen? DWX-Keynote
Auf der Developer Week '24 wird Professor Alexander Pretschner von der TU München eine der Keynotes halten. Er klärt auf, ob Ihr Job in Gefahr ist.
>>
Test-Framework
Testautomatisierung mit C# und Atata
Atata ist ein umfassendes C#-Framework für die Web-Testautomatisierung, das auf Selenium WebDriver basiert. Es verwendet das Fluent Page Object Pattern und verfügt über ein einzigartiges Protokollierungssystem sowie Trigger-Funktionalitäten.
>>