openai-gpt-5-5-release-agentic-coding-benchmarks
OpenAI veröffentlicht GPT-5.5: Schneller, Intelligenter – Und Teurer
Das neueste Modell von OpenAI erreicht die Geschwindigkeit von GPT-5.4 und übertrifft es in fast allen Benchmarks. Es wird heute für zahlende ChatGPT-Nutzer freigeschaltet.
2026-04-23 Quelle:decrypt.co

Kurz gesagt

  • GPT-5.5 startet heute für Plus-, Pro-, Business- und Enterprise-Nutzer in ChatGPT und Codex, mit bald verfügbarem API-Zugang zu 5 $/M Input-Tokens und 30 $/M Output-Tokens.
  • Das Modell erreicht 82,7 % auf Terminal-Bench 2.0 – einem Benchmark, der komplexe Befehlszeilen-Workflows testet – und übertrifft damit Claude Opus 4.7 mit 69,4 % und Gemini 3.1 Pro mit 68,5 %.
  • GPT-5.5 benötigt deutlich weniger Tokens, um dieselben Codex-Aufgaben wie GPT-5.4 zu erledigen, was es trotz des höheren Preises effizienter macht.

OpenAI hat am Donnerstag GPT-5.5 vorgestellt und es im Wesentlichen als Modell für die agentenbasierte Computernutzung positioniert. Es schreibt und debuggt Code, durchsucht das Web, füllt Tabellen aus und arbeitet sich durch mehrstufige Aufgaben, ohne dass ein Mensch jeden Schritt überwachen muss.

Die Veröffentlichung wird laut OpenAI bereits heute für Plus-, Pro-, Business- und Enterprise-Abonnenten von ChatGPT und Codex ausgerollt.

„Wir veröffentlichen GPT‑5.5, unser bisher intelligentestes und intuitivstes Modell, und den nächsten Schritt hin zu einer neuen Art der Computerarbeit“, sagte OpenAI in einer Ankündigung. „Die Fortschritte sind besonders stark in den Bereichen agentenbasierte Codierung, Computernutzung, Wissensarbeit und frühe wissenschaftliche Forschung – Bereiche, in denen der Fortschritt von kontextübergreifendem Denken und der Ausführung von Aktionen über die Zeit abhängt.

Wir stellen GPT-5.5 vor

Eine neue Klasse von Intelligenz für echte Arbeit und die Unterstützung von Agenten, entwickelt, um komplexe Ziele zu verstehen, Werkzeuge zu nutzen, ihre Arbeit zu überprüfen und mehr Aufgaben bis zum Abschluss zu erledigen. Es markiert eine neue Art der Computerarbeit.

Jetzt in ChatGPT und Codex verfügbar. pic.twitter.com/rPLTk99ZH5

— OpenAI (@OpenAI) April 23, 2026

Die große Schlagzeile von OpenAI: GPT-5.5 ist messbar intelligenter als sein Vorgänger GPT-5.4 – und nicht langsamer. Die Übereinstimmung mit der Pro-Token-Latenz von GPT-5.4 im realen Betrieb, während gleichzeitig höhere Benchmark-Werte erzielt werden, ist die Art von Effizienzverbesserung, die normalerweise nicht vorkommt. Größere Modelle sind tendenziell langsamer, wenn sie auf derselben Hardware laufen.

Auf Terminal-Bench 2.0, das testet, wie gut ein Modell komplexe Befehlszeilen-Workflows handhabt, die Planung und iterative Werkzeugnutzung erfordern, erzielt GPT-5.5 82,7 %. Claude Opus 4.7 liegt bei 69,4 %, während Gemini 3.1 Pro bei 68,5 % liegt. Das ist kein geringer Vorsprung.

Bei GDPval, einem Benchmark, der Wissensarbeit in 44 realen Berufen testet – von Finanzen über Rechtsforschung bis hin zum Produktmanagement – erreicht oder übertrifft GPT-5.5 in 84,9 % der Vergleiche Branchenexperten.

GPT 5.5 benchmarks, compared against other models from OpenAI, Gemini and Claude from Anthropic
Bild: OpenAI

Es ist auch ein ziemlich guter Coder, wie erwartet. Auf Expert-SWE, einem internen Benchmark für langwierige Kodierungsaufgaben mit einer durchschnittlichen geschätzten menschlichen Bearbeitungszeit von 20 Stunden, übertrifft GPT-5.5 seinen Vorgänger GPT-5.4. Auf SWE-Bench Pro, das die Lösung realer GitHub-Probleme bewertet, erreicht es 58,6 %. Claude Opus 4.7 erzielt mit 64,3 % einen höheren Wert, aber OpenAI behauptet, dies könnte daran liegen, dass „Anthropic Anzeichen von Memorierung bei einer Untergruppe von Problemen gemeldet hat“.

Diese Markteinführung erfolgt in einem Markt, der sich seit dem Boom der agentenorientierten KI rasant entwickelt. GPT-5.4 kam nur zwei Tage nach GPT-5.3 auf den Markt, während Xiaomi in etwa fünf Wochen von MiMo-V2-Pro zu MiMo 2.5 Pro – mit vollen multimodalen Funktionen – wechselte. Der Abstand zwischen GPT-5.4 und GPT-5.5 betrug etwa sieben Wochen. Das ist jetzt das Tempo.

Doch wird dieses Modell einen Unterschied für alltägliche Nutzer machen, die nicht ständig das nächste große Ding programmieren? Wenn Sie sich im kostenlosen Tarif befinden, nein: GPT-5.5 wird nicht für kostenlose Nutzer verfügbar sein. Wenn Sie für Plus 20 $ pro Monat bezahlen, wird es heute ausgerollt. Wir haben versucht, es unter unserem Pro-Konto zu testen, aber das Modell war nicht sofort verfügbar.

Das größere Geschäft ist wahrscheinlich das, was GPT-5.5 innerhalb von Codex – OpenAIs agentenbasierter Programmierumgebung – leistet, wo es sich als leistungsfähiger erwiesen hat. „Es fühlt sich wirklich an, als würde ich mit einer höheren Intelligenz zusammenarbeiten, und es gibt fast ein Gefühl des Respekts“, sagte Pietro Schirano, CEO von MagicPath, in einem von OpenAI geteilten Zitat.

GPT-5.5 Pro, das für anspruchsvollere, hochpräzise Arbeiten entwickelt wurde, wird separat für Pro-, Business- und Enterprise-Nutzer in ChatGPT eingeführt. Bei BrowseComp, das die Fähigkeit eines Modells testet, schwer auffindbare Informationen im Web aufzuspüren, erreicht GPT-5.5 Pro 90,1 % und liegt damit vor Gemini 3.1 Pro mit 85,9 %.

Das Modell ist auch im Durchschnitt das intelligenteste, basierend auf dem Artificial Analysis Index. GPT 5.5 meldet eine effizientere und nützlichere Verwendung von Tokens, was im Allgemeinen zu besseren Ergebnissen führt.

Artificial Analysis Index
Bild: OpenAI

Die Preisgestaltung könnte jedoch einige Nutzer schockieren. Die API wird bei ihrer Einführung, die laut OpenAI „sehr bald“ erfolgen soll, 5 $ pro Million Input-Tokens und 30 $ pro Million Output-Tokens kosten. GPT-5.5 Pro in der API wird 30 $ pro Million Input-Tokens und 180 $ pro Million Output-Tokens kosten.

Diese Zahlen sind höher als bei GPT-5.4 – 2,50 $ pro Million Input-Tokens und 15,00 $ pro Million Output-Tokens – während die Preise für GPT-5.5 Pro dieselben bleiben wie für GPT-5.4 Pro.

Dennoch argumentierte OpenAI-CEO Sam Altman auf X, dass die Effizienzsteigerungen bei den Tokens die Kosten ausgleichen – GPT-5.5 erledigt dieselben Codex-Aufgaben mit weniger Tokens, was selbst bei einem höheren Pro-Token-Preis zu günstigeren Ausführungen führt.

Nur zum Vergleich: Xiaomi MiMo v2.5 Pro verlangt 1 $ und 3 $ pro Million Input- bzw. Output-Tokens, Minimax M2.7 kostet 0,30 $ bzw. 1,20 $ und Kimi K2.5 erfordert 0,44 $ und 2,00 $ pro Million Tokens.