OpenAI hat nachgelegt und GPT-4 veröffentlicht. Neben Multimodalität soll das KI-Modell in mehreren Bereichen eine Performance auf „menschlichem Niveau“ liefern. Was steckt hinter dem Update und kann es halten, was es verspricht?

OpenAI hat GPT-4 vorgestellt. (Foto: Shutterstock/Tada Images)

Ohne viel Tamtam hat OpenAI am Dienstagabend sein Sprach-KI-Modell GPT-4 der Öffentlichkeit vorgestellt – und Microsoft hat verraten, dass seine Suchmaschine Bing bereits seit fünf Wochen auf dem neuen Modell basiert. Nutzer:innen könnten also schon Kontakt zu GPT-4 gehabt haben, ohne es zu wissen. Doch wie sieht es mit den sonstigen Verbesserungen aus – und halten sie, was sie versprechen?

Was ist neu bei GPT-4?

OpenAI hat nach eigenen Angaben in den vergangenen zwei Jahren den „gesamten Deep-Learning-Stack überarbeitet“. GPT-3.5 war insofern ein „Testlauf“ – Fehler und Bugs, die dabei aufgetaucht seien, habe man behoben; auch die „theoretischen Grundlagen“ sollen verbessert worden sein. In der Folge soll GPT-4 „überraschend stabil“ laufen.

Die große Neuerung dürfte aber wohl sein, dass Nutzer:innen auch Bilder als Input geben können. GPT-4 beschreibt in der Folge nicht nur, was auf dem Bild zu sehen ist, sondern soll es auch einordnen können.

GPT-4 kann jetzt auch Bilder als Input verarbeiten. (Screenshot: OpenAI/t3n)

Das gilt laut OpenAI nicht nur für Memes oder einfache Fotos, auch Diagramme und sogar ganze wissenschaftliche Aufsätze, die als PDF eingegeben werden, sollen ausgewertet werden können.

Auch soll die Zeichenbegrenzung für das Eingabefeld nach oben verschoben worden sein: Bis zu 25.000 Zeichen können Nutzer:innen hier jetzt eingeben.

Ist GPT-4 besser als der Vorgänger GPT-3.5?

Geht es um einfache Unterhaltungen, soll der Unterschied zwischen GPT-4 und GPT-3.5 kaum spürbar sein. Der große Sprung in der Weiterentwicklung zeige sich, so schreibt OpenAI, wenn die Aufgabe einen „gewissen Schwierigkeitsgrad“ überschreite. Gemeint sind damit vor allem berufliche und akademische Kontexte – hier soll GPT-4 „verlässlicher [und] kreativer“ sein und „nuanciertere Anweisungen“ besser umsetzen können.

Das macht OpenAI nicht zuletzt an den Resultaten fest, die GPT-4 bei diversen standardisierten Examina und Tests für Menschen – darunter solche für Integralrechnung, US-amerikanische Geschichte oder eine Prüfung für Rechtsanwält:innen – erzielt haben soll. Während GPT-3.5 zwar besteht, sich notentechnisch aber eher in den unteren zehn Prozent einreiht, soll GPT-4 der Sprung in die Top-10-Ergebnisse gelingen.

Wie gut kann GPT-4 Vorgaben befolgen?

Auch unter GPT-3.5 und dem „alten“ ChatGPT ist es möglich, der Sprach-KI Vorgaben bezüglich der Tonalität und Stil zu machen – bei GPT-4 können Entwickler:innen über die API jetzt aber generelle Anpassungen vornehmen. So sollen sie die KI speziell an ihre Nutzer:innen anpassen können – „innerhalb von Grenzen“, wie es bei OpenAI heißt.

Das Unternehmen will dabei auch besonders im Blick behalten, dass diese Grenzen ein Ansatzpunkt sein können, um die GPT-Modelle zu „jailbreaken“. Das wurde in der Vergangenheit zu Genüge demonstriert, wenn Nutzer:innen den KI-Chatbot beispielsweise dazu gebracht hatten, Bauanleitungen für Bomben zu liefern.

Gibt es schon spannende Projekte mit GPT-4?

Man kennt es: Kaum veröffentlicht ein Unternehmen ein neues Spielzeug, stürzen sich findige Nutzer:innen darauf und setzen es für alle möglichen (und unmöglichen) Projekte ein. So auch bei GPT-4 beziehungsweise ChatGPT.

Egal, ob Snake oder Pong: Das neue ChatGPT scheint im Handumdrehen einfache Mini-Games coden zu können. Dabei scheinen auch Anpassungen im Code kein unlösbares Problem zu sein. Etwas ernster wird es schon, wenn Nutzer:innen illustrieren, wie ChatGPT Transaktionsdaten – beispielsweise eines Girokontos – auslesen und in JSON aufbereiten kann; gerade für Apps, die dabei helfen sollen, die eigenen Finanzen im Blick zu behalten, sehr praktisch.

Bei den selbsterklärten „Robo-Anwälten“ von Donotpay wird bereits daran gearbeitet, ChatGPT so zu integrieren, dass Menschen sich über „Ein-Klick-Klagen“ gegen Robocalls, also ungewollte automatisierte Werbeanrufe, wehren können.

Ein anderer User zeigt, wie mit ChatGPT aus einer einfachen Skizze schnell eine funktionsfähige Website wird. Und auch in anderen, weniger digitalen Bereichen scheint die KI bereits zu reüssieren: ChatGPT scheint in der Lage, Medikamente und Pharmazeutika zu entwickeln.

Und was kann GPT-4 nicht?

Weiterhin rät OpenAI nach wie vor davon ab, ChatGPT und GPT-4 als Such- beziehungsweise Faktenmaschine zu nutzen. Es sei nach wie vor „nicht komplett verlässlich“ und „halluziniert“ weiterhin Fakten und mache Logikfehler. Allerdings soll es gelungen sein, die Halluzinationen zu verringern.

Zudem kann GPT-4 nun zwischen Antworten, die sich aus Sprichwörtern ergeben, und der realen, korrekten Antwort auf eine Frage unterscheiden.

GPT-4 kann auch von Sprichwörtern vorgegebene, aber faktisch falsche Antworten richtig beantworten. (Screenshot: OpenAI/t3n)

Für Weltwissen und Ereignisse ist der Zeitpunkt, ab dem GPT-4 keinen verlässlichen Input mehr liefern kann, weiterhin September 2021. Wie der Vorgänger GPT-3.5 lernt auch die neue Version nicht aus vorherigen Konversationen.

Welche Risiken ergeben sich aus GPT-4?

Wie die Vorgänger und Konkurrenzmodelle kommt auch OpenAIs GPT-4 mit gewissen Risiken. Neben fehlerhaftem Code – der beim Launch von ChatGPT etwa Stackoverflow dazu brachte, KI-generierten Code ganz zu verbieten – sind das vor allem die bereits genannten Falschinformationen sowie potenziell gefährliche Ratschläge.

Um diese Risiken zu verringern, so OpenAI, habe man den Austausch mit mehr als 50 Expert:innen aus den verschiedensten Bereichen – darunter Cybersicherheit und internationale Sicherheit – gesucht. So sollen zusätzliche Sicherheitsmechanismen implementiert worden sein, um zu verhindern, dass Nutzer:innen sich beispielsweise erklären lassen, wie sie gefährliche Chemikalien herstellen können.

Wie hat OpenAI GPT-4 trainiert?

OpenAI hat GPT-4 hauptsächlich mit allgemein verfügbaren Daten – zum Beispiel aus dem Internet – trainiert. Darin enthalten sind beispielsweise richtige und falsche Lösungen für mathematische Probleme, gute und schlechte Argumente, sich selbst widersprechende und logische Aussagen und eine Vielzahl von Theorien und Ideologien.

Weil sich daraus viele mögliche Antworten ergeben, kann es passieren, dass GPT-4 (und auch GPT-3.5) anders antwortet, als die Nutzer:innen es erwarten. Deshalb setzt OpenAI an dieser Stelle auch auf menschlichen Input in Form von RLHF, das sogenannte Reinforced Learning with Human Feedback.

Speziell für GPT-4 hat OpenAI zudem auf einen Deep-Learning-Stack, der „vorhersehbar skaliert“, gesetzt. Mithilfe der passenden Infrastruktur kann das Unternehmen so in verschiedenen Bereichen das Verhalten von GPT-4 vorhersagen.

Wie funktioniert ChatGPT eigentlich?

Auch wenn das GPT-4-Modell als ChatGPT gerne von sich selbst in der Ich-Form spricht, verbirgt sich hinter dem KI-Chatbot keineswegs ein Wesen mit Bewusstsein oder menschlichen Zügen.

Stattdessen basiert das die künstliche Intelligenz – sehr vereinfacht ausgedrückt – auf einem Wahrscheinlichkeitsmodell, ermittelt also, welches Wort mit welcher Wahrscheinlichkeit auf welches vorhergegangene folgen muss, damit ein Text Sinn ergibt und welche Wortkombinationen besonders häufig auftreten.

Wo kann ich GPT-4 testen?

Neben der bereits erwähnten Bing-Suchmaschine, die GPT-4 schon seit fünf Wochen einsetzt, ist das Modell ab sofort öffentlich verfügbar, auch ChatGPT läuft laut Website seit dem 14. März mit GPT-4. Fragt man den KI-Chatbot, ob er mit dem neuen Modell laufe, antwortet er allerdings „ich weiß derzeit von keinem offiziellen Release von GPT-4“.

Nutzer:innen berichten zudem, dass es ihnen nicht gelinge, Bilder in ChatGPT hochzuladen oder einzufügen. Es ist also gut möglich, dass GPT-4 erst nach und nach implementiert und bereitgestellt wird. Es ist zudem sehr wahrscheinlich, dass diejenige, die für ein ChatGPT-Plus-Abo bezahlen, zuerst in den Genuss der neuen Funktionen kommen werden.

Wer die OpenAI-API mit GPT-4 nutzen möchte, muss sich in eine Warteliste eintragen.

Quelle: https://t3n.de/news/gpt4-chatgpt-openai-1541454/