Kumpulan Tag Berita Kripto & Konten Tematik

openai-gpt-5-5-release-agentic-coding-benchmarks

OpenAI Merilis GPT-5.5: Lebih Cepat, Lebih Cerdas—Dan Lebih Mahal

Model terbaru OpenAI menyamai kecepatan GPT-5.4 sekaligus mengunggulinya di hampir setiap tolok ukur. Model ini mulai diluncurkan untuk pengguna ChatGPT berbayar hari ini.

2026-04-23 Sumber:decrypt.co

GDP

Pemrograman AI Agentik

OpenAI GPT-5.5

Kinerja Model AI

Secara singkat

GPT-5.5 diluncurkan hari ini untuk pengguna Plus, Pro, Business, dan Enterprise di ChatGPT dan Codex, dengan akses API segera hadir seharga $5/Juta token input dan $30/Juta token output.
Model ini mencapai 82,7% pada Terminal-Bench 2.0—sebuah benchmark yang menguji alur kerja command-line yang kompleks—mengalahkan Claude Opus 4.7 dengan 69,4% dan Gemini 3.1 Pro dengan 68,5%.
GPT-5.5 menggunakan token secara signifikan lebih sedikit untuk menyelesaikan tugas-tugas Codex yang sama dengan GPT-5.4, membuatnya lebih efisien meskipun harganya lebih tinggi.

OpenAI meluncurkan GPT-5.5 pada hari Kamis, menawarkannya sebagai model yang ditargetkan untuk penggunaan komputer agen. Ini menulis dan men-debug kode, menjelajahi web, mengisi lembar kerja, dan terus bekerja melalui tugas multi-langkah tanpa memerlukan manusia untuk mengawasi setiap langkah.

Rilis ini sudah diluncurkan hari ini untuk pelanggan Plus, Pro, Business, dan Enterprise di ChatGPT dan Codex, kata OpenAI.

“Kami merilis GPT-5.5, model kami yang terpintar dan paling intuitif untuk digunakan, dan langkah selanjutnya menuju cara baru dalam menyelesaikan pekerjaan di komputer,” kata OpenAI dalam sebuah pengumuman. “Peningkatan ini sangat kuat dalam pengkodean agen, penggunaan komputer, pekerjaan pengetahuan, dan penelitian ilmiah awal—area di mana kemajuan bergantung pada penalaran lintas konteks dan pengambilan tindakan dari waktu ke waktu.

Introducing GPT-5.5

A new class of intelligence for real work and powering agents, built to understand complex goals, use tools, check its work, and carry more tasks through to completion. It marks a new way of getting computer work done.

Now available in ChatGPT and Codex. pic.twitter.com/rPLTk99ZH5

— OpenAI (@OpenAI) April 23, 2026

Berita utama dari OpenAI: GPT-5.5 terbukti lebih cerdas dari pendahulunya, GPT-5.4—dan tidak lebih lambat. Mencocokkan latensi per-token GPT-5.4 dalam penyediaan dunia nyata sambil mencapai skor yang lebih tinggi di seluruh benchmark adalah jenis peningkatan efisiensi yang biasanya tidak terjadi. Model yang lebih besar cenderung lebih lambat saat berjalan dengan perangkat keras yang sama.

Pada Terminal-Bench 2.0, yang menguji seberapa baik sebuah model menangani alur kerja command-line yang kompleks yang membutuhkan perencanaan dan penggunaan alat berulang, GPT-5.5 mencetak 82,7%. Claude Opus 4.7 mencapai 69,4%, sementara Gemini 3.1 Pro berada di 68,5%. Itu bukan keunggulan yang marjinal.

Pada GDPval, sebuah benchmark yang menguji pekerjaan pengetahuan di 44 pekerjaan nyata—mulai dari keuangan hingga riset hukum hingga manajemen produk—GPT-5.5 menyamai atau mengalahkan profesional industri dalam 84,9% perbandingan.

GPT 5.5 benchmarks, compared against other models from OpenAI, Gemini and Claude from Anthropic — Gambar: OpenAI

Model ini juga merupakan pembuat kode yang cukup baik, seperti yang diharapkan. Pada Expert-SWE, sebuah benchmark internal untuk tugas pengkodean jangka panjang dengan perkiraan waktu penyelesaian manusia rata-rata 20 jam, GPT-5.5 mengungguli GPT-5.4. Pada SWE-Bench Pro, yang menilai resolusi masalah GitHub dunia nyata, ia mencapai 58,6%. Claude Opus 4.7 mencetak lebih tinggi dengan 64,3%, tetapi OpenAI mengklaim mungkin karena “Anthropic melaporkan tanda-tanda memorisasi pada sebagian masalah”

Peluncuran ini hadir di pasar yang bergerak cepat sejak ledakan AI agen. GPT-5.4 tiba hanya dua hari setelah GPT-5.3, sementara Xiaomi beralih dari MiMo-V2-Pro ke MiMo 2.5 Pro—dengan kemampuan multimodal penuh—dalam waktu sekitar lima minggu. Jeda antara GPT-5.4 dan GPT-5.5 adalah sekitar tujuh minggu. Itulah kecepatannya sekarang.

Namun, apakah model ini akan membuat perbedaan bagi pengguna sehari-hari yang tidak selalu membuat hal besar berikutnya? Jika Anda menggunakan tier gratis, tidak: GPT-5.5 tidak akan tersedia untuk pengguna gratis. Jika Anda membayar untuk Plus seharga $20/bulan, ini diluncurkan hari ini. Kami mencoba mengujinya di bawah akun Pro kami, tetapi model tersebut tidak langsung tersedia.

Hal yang lebih besar mungkin adalah apa yang dilakukan GPT-5.5 di dalam Codex—lingkungan pengkodean agen OpenAI—di mana ia terbukti lebih kuat. “Rasanya seperti saya bekerja dengan kecerdasan yang lebih tinggi, dan hampir ada rasa hormat,” kata Pietro Schirano, CEO MagicPath, dalam kutipan yang dibagikan oleh OpenAI.

GPT-5.5 Pro, yang dirancang untuk pekerjaan yang lebih sulit dan akurasi lebih tinggi, diluncurkan secara terpisah untuk pengguna Pro, Business, dan Enterprise di ChatGPT. Pada BrowseComp, yang menguji kemampuan model untuk melacak informasi yang sulit ditemukan di seluruh web, GPT-5.5 Pro mencetak 90,1%, mengungguli Gemini 3.1 Pro dengan 85,9%.

Model ini juga merupakan yang paling cerdas rata-rata berdasarkan Artificial Analysis Index. GPT 5.5 melaporkan penggunaan token yang lebih efisien dan berguna, menghasilkan hasil yang lebih baik secara umum.

Namun, harganya bisa mengejutkan sebagian pengguna. API akan mengenakan biaya $5 per juta token input dan $30 per juta token output saat diluncurkan, yang menurut OpenAI akan datang "sangat segera". GPT-5.5 Pro di API akan berharga $30 per juta token input dan $180 per juta token output.

Angka-angka tersebut lebih tinggi dari GPT-5.4—$2,50 per juta token input dan $15,00 per juta token output—sementara harga untuk GPT-5.5 Pro tetap sama dengan GPT-5.4 Pro.

Meskipun demikian, CEO OpenAI Sam Altman berargumen di X bahwa peningkatan efisiensi token mengimbangi biaya—GPT-5.5 menyelesaikan tugas-tugas Codex yang sama dengan token yang lebih sedikit, yang berarti biaya operasional lebih murah bahkan dengan tarif per-token yang lebih tinggi.

Sebagai perbandingan, Xiaomi MiMo v2.5 Pro mengenakan biaya $1 dan $3 per juta token input dan output, Minimax M2.7 berharga masing-masing $0,30 dan $1,20, dan Kimi K2.5 membutuhkan $0,44 dan $2,00 per juta token.

Artikel Populer

Kelompok industri game AS mendesak Senat untuk melarang pasar prediksi olahraga dalam RUU kripto: laporan

4 Beberapa jam yang lalu

Pertarungan UU GENIUS semakin memanas saat senator mempertahankan regulator negara bagian

12 Beberapa jam yang lalu

Senator bipartisan mendesak Kementerian Keuangan untuk menegakkan kewenangan negara bagian berdasarkan Undang-Undang GENIUS

12 Beberapa jam yang lalu

Artikel Lainnya

Kelompok industri game AS mendesak Senat untuk melarang pasar prediksi olahraga dalam RUU kripto: laporan

4 Beberapa jam yang lalu

World Liberty Financial yang didukung Trump mendekati persetujuan OCC untuk piagam kepercayaan federal: laporan

5 Beberapa jam yang lalu