
اوپنایآی (OpenAI) روز پنجشنبه GPT-5.5 را معرفی کرد و آن را اساساً به عنوان مدلی برای استفاده عاملیت محور از کامپیوتر معرفی کرد. این مدل کد مینویسد و اشکالزدایی میکند، وب را مرور میکند، صفحات گسترده را پر میکند، و بدون نیاز به نظارت انسانی در هر مرحله، وظایف چند مرحلهای را ادامه میدهد.
اوپنایآی اعلام کرد که این نسخه از امروز برای مشترکان پلاس (Plus)، پرو (Pro)، بیزینس (Business) و اینترپرایز (Enterprise) در ChatGPT و Codex در حال عرضه است.
اوپنایآی در اطلاعیهای گفت: «ما GPT-5.5 را، هوشمندترین و بصریترین مدل خود تا کنون، و گام بعدی به سوی روشی جدید برای انجام کارها با کامپیوتر، منتشر میکنیم.» «دستاوردهای آن به ویژه در کدنویسی عاملیت محور، استفاده از کامپیوتر، کارهای دانشی، و تحقیقات علمی اولیه قوی هستند – حوزههایی که پیشرفت در آنها به استدلال در طول زمان و اقدام بر اساس زمینه بستگی دارد.»
Introducing GPT-5.5
A new class of intelligence for real work and powering agents, built to understand complex goals, use tools, check its work, and carry more tasks through to completion. It marks a new way of getting computer work done.
Now available in ChatGPT and Codex. pic.twitter.com/rPLTk99ZH5
— OpenAI (@OpenAI) April 23, 2026
خبر اصلی از اوپنایآی: GPT-5.5 به طور قابل سنجشی از سلف خود، GPT-5.4، باهوشتر است و سرعتش کاهش نیافته است. مطابقت تأخیر به ازای هر توکن GPT-5.4 در سرویسدهی واقعی، در حالی که امتیازات بالاتری در بنچمارکها کسب میکند، نوعی بهبود کارایی است که معمولاً رخ نمیدهد. مدلهای بزرگتر معمولاً هنگام اجرا بر روی سختافزار یکسان، کندتر هستند.
در Terminal-Bench 2.0، که میزان عملکرد یک مدل در مدیریت جریانهای کاری پیچیده خط فرمان را که نیاز به برنامهریزی و استفاده مکرر از ابزار دارند، آزمایش میکند، GPT-5.5 امتیاز 82.7% را کسب کرده است. Claude Opus 4.7 با 69.4% و Gemini 3.1 Pro با 68.5% در رتبههای بعدی قرار دارند. این یک برتری ناچیز نیست.
در GDPval، یک بنچمارک که کارهای دانشی را در 44 شغل واقعی – از امور مالی تا تحقیقات حقوقی و مدیریت محصول – آزمایش میکند، GPT-5.5 در 84.9% مقایسهها با متخصصان صنعت مطابقت دارد یا از آنها پیشی میگیرد.
همانطور که انتظار میرفت، کدنویس بسیار خوبی نیز هست. در Expert-SWE، یک بنچمارک داخلی برای وظایف کدنویسی طولانیمدت با زمان تکمیل انسانی تخمینی متوسط 20 ساعت، GPT-5.5 عملکرد بهتری نسبت به GPT-5.4 دارد. در SWE-Bench Pro، که حل مسائل واقعی گیتهاب را ارزیابی میکند، به 58.6% میرسد. Claude Opus 4.7 با 64.3% امتیاز بالاتری دارد، اما اوپنایآی ادعا میکند که این ممکن است به دلیل آن باشد که «Anthropic گزارشهایی از نشانههای حفظ کردن در زیرمجموعهای از مسائل را ارائه کرده است.»
این عرضه در بازاری صورت میگیرد که از زمان رونق هوش مصنوعی عاملیت محور به سرعت در حال حرکت است. GPT-5.4 تنها دو روز پس از GPT-5.3 عرضه شد، در حالی که شیائومی در حدود پنج هفته از MiMo-V2-Pro به MiMo 2.5 Pro – با قابلیتهای کامل چندوجهی – رفت. فاصله بین GPT-5.4 و GPT-5.5 حدود هفت هفته بود. اکنون سرعت اینگونه است.
اما آیا این مدل برای کاربران عادی که همیشه در حال کدنویسی اتفاقات بزرگ بعدی نیستند، تفاوتی ایجاد خواهد کرد؟ اگر در سطح رایگان هستید، خیر: GPT-5.5 برای کاربران رایگان ارائه نمیشود. اگر ماهانه 20 دلار برای Plus پرداخت میکنید، امروز عرضه میشود. ما سعی کردیم آن را با حساب پرو خود آزمایش کنیم، اما مدل بلافاصله در دسترس نبود.
احتمالاً مهمتر از آن، کاری است که GPT-5.5 در داخل Codex – محیط کدنویسی عاملیت محور اوپنایآی – انجام میدهد، جایی که ثابت شده قدرتمندتر است. پیترو شیرانو (Pietro Schirano)، مدیرعامل MagicPath، در نقل قولی که اوپنایآی منتشر کرد، گفت: «واقعاً حس میکنم که با هوشی بالاتر کار میکنم، و تقریباً نوعی احترام وجود دارد.»
GPT-5.5 Pro، طراحی شده برای کارهای سختتر و با دقت بالاتر، به طور جداگانه برای کاربران پرو (Pro)، بیزینس (Business) و اینترپرایز (Enterprise) در ChatGPT عرضه میشود. در BrowseComp، که توانایی یک مدل را برای یافتن اطلاعات دشوار در سراسر وب آزمایش میکند، GPT-5.5 Pro امتیاز 90.1% را کسب میکند و از Gemini 3.1 Pro با 85.9% پیشی میگیرد.
این مدل همچنین بر اساس شاخص Artificial Analysis، به طور متوسط هوشمندترین است. GPT 5.5 استفاده کارآمدتر و مفیدتری از توکنها گزارش میدهد که به طور کلی نتایج بهتری را به همراه دارد.
با این حال، قیمتگذاری میتواند برخی از کاربران را شوکه کند. API هنگام عرضه 5 دلار برای هر میلیون توکن ورودی و 30 دلار برای هر میلیون توکن خروجی دریافت خواهد کرد، که اوپنایآی میگوید "بسیار به زودی" ارائه میشود. GPT-5.5 Pro در API 30 دلار برای هر میلیون توکن ورودی و 180 دلار برای هر میلیون توکن خروجی هزینه خواهد داشت.
این ارقام بالاتر از GPT-5.4 هستند – 2.50 دلار برای هر میلیون توکن ورودی و 15.00 دلار برای هر میلیون توکن خروجی – در حالی که قیمتگذاری برای GPT-5.5 Pro همانند GPT-5.4 Pro باقی میماند.
با این حال، سم آلتمن (Sam Altman)، مدیرعامل اوپنایآی، در X استدلال کرد که افزایش کارایی توکن هزینهها را جبران میکند – GPT-5.5 همان وظایف Codex را با توکنهای کمتری تکمیل میکند، که به معنای اجرای ارزانتر حتی با نرخ بالاتر به ازای هر توکن است.
برای مقایسه، Xiaomi MiMo v2.5 Pro برای هر میلیون توکن ورودی 1 دلار و برای هر میلیون توکن خروجی 3 دلار هزینه دریافت میکند، Minimax M2.7 به ترتیب 0.30 دلار و 1.20 دلار هزینه دارد، و Kimi K2.5 برای هر میلیون توکن 0.44 دلار و 2.00 دلار نیاز دارد.