تجمیع برچسب اخبار کریپتو و اخبار اختصاصی

openai-gpt-5-5-release-agentic-coding-benchmarks

اوپن‌ای‌آی GPT-5.5 را منتشر کرد: سریع‌تر، هوشمندتر ـ و گران‌تر

جدیدترین مدل OpenAI با سرعت GPT-5.4 مطابقت دارد و در تقریباً هر معیار عملکرد بهتری از آن دارد. امروز در اختیار کاربران پرداختی ChatGPT قرار می‌گیرد.

2026-04-23 منبع:decrypt.co

GDP

کدنویسی هوش مصنوعی عامل‌گرا

OpenAI GPT-5.5

عملکرد مدل هوش مصنوعی

به طور خلاصه

GPT-5.5 امروز برای کاربران پلاس (Plus)، پرو (Pro)، بیزینس (Business) و اینترپرایز (Enterprise) در ChatGPT و Codex عرضه می‌شود، با دسترسی به API که به زودی با هزینه 5 دلار برای هر میلیون توکن ورودی و 30 دلار برای هر میلیون توکن خروجی فراهم خواهد شد.
این مدل در بنچمارک Terminal-Bench 2.0 که جریان‌های کاری پیچیده خط فرمان را آزمایش می‌کند، به امتیاز 82.7% دست یافته است و Claude Opus 4.7 را با 69.4% و Gemini 3.1 Pro را با 68.5% شکست می‌دهد.
GPT-5.5 برای تکمیل همان وظایف Codex در مقایسه با GPT-5.4، توکن‌های بسیار کمتری مصرف می‌کند که آن را با وجود قیمت بالاتر، کارآمدتر می‌سازد.

اوپن‌ای‌آی (OpenAI) روز پنجشنبه GPT-5.5 را معرفی کرد و آن را اساساً به عنوان مدلی برای استفاده عاملیت محور از کامپیوتر معرفی کرد. این مدل کد می‌نویسد و اشکال‌زدایی می‌کند، وب را مرور می‌کند، صفحات گسترده را پر می‌کند، و بدون نیاز به نظارت انسانی در هر مرحله، وظایف چند مرحله‌ای را ادامه می‌دهد.

اوپن‌ای‌آی اعلام کرد که این نسخه از امروز برای مشترکان پلاس (Plus)، پرو (Pro)، بیزینس (Business) و اینترپرایز (Enterprise) در ChatGPT و Codex در حال عرضه است.

اوپن‌ای‌آی در اطلاعیه‌ای گفت: «ما GPT-5.5 را، هوشمندترین و بصری‌ترین مدل خود تا کنون، و گام بعدی به سوی روشی جدید برای انجام کارها با کامپیوتر، منتشر می‌کنیم.» «دستاوردهای آن به ویژه در کدنویسی عاملیت محور، استفاده از کامپیوتر، کارهای دانشی، و تحقیقات علمی اولیه قوی هستند – حوزه‌هایی که پیشرفت در آن‌ها به استدلال در طول زمان و اقدام بر اساس زمینه بستگی دارد.»

Introducing GPT-5.5

A new class of intelligence for real work and powering agents, built to understand complex goals, use tools, check its work, and carry more tasks through to completion. It marks a new way of getting computer work done.

Now available in ChatGPT and Codex. pic.twitter.com/rPLTk99ZH5

— OpenAI (@OpenAI) April 23, 2026

خبر اصلی از اوپن‌ای‌آی: GPT-5.5 به طور قابل سنجشی از سلف خود، GPT-5.4، باهوش‌تر است و سرعتش کاهش نیافته است. مطابقت تأخیر به ازای هر توکن GPT-5.4 در سرویس‌دهی واقعی، در حالی که امتیازات بالاتری در بنچمارک‌ها کسب می‌کند، نوعی بهبود کارایی است که معمولاً رخ نمی‌دهد. مدل‌های بزرگ‌تر معمولاً هنگام اجرا بر روی سخت‌افزار یکسان، کندتر هستند.

در Terminal-Bench 2.0، که میزان عملکرد یک مدل در مدیریت جریان‌های کاری پیچیده خط فرمان را که نیاز به برنامه‌ریزی و استفاده مکرر از ابزار دارند، آزمایش می‌کند، GPT-5.5 امتیاز 82.7% را کسب کرده است. Claude Opus 4.7 با 69.4% و Gemini 3.1 Pro با 68.5% در رتبه‌های بعدی قرار دارند. این یک برتری ناچیز نیست.

در GDPval، یک بنچمارک که کارهای دانشی را در 44 شغل واقعی – از امور مالی تا تحقیقات حقوقی و مدیریت محصول – آزمایش می‌کند، GPT-5.5 در 84.9% مقایسه‌ها با متخصصان صنعت مطابقت دارد یا از آن‌ها پیشی می‌گیرد.

GPT 5.5 benchmarks, compared against other models from OpenAI, Gemini and Claude from Anthropic — تصویر: OpenAI

همانطور که انتظار می‌رفت، کدنویس بسیار خوبی نیز هست. در Expert-SWE، یک بنچمارک داخلی برای وظایف کدنویسی طولانی‌مدت با زمان تکمیل انسانی تخمینی متوسط 20 ساعت، GPT-5.5 عملکرد بهتری نسبت به GPT-5.4 دارد. در SWE-Bench Pro، که حل مسائل واقعی گیت‌هاب را ارزیابی می‌کند، به 58.6% می‌رسد. Claude Opus 4.7 با 64.3% امتیاز بالاتری دارد، اما اوپن‌ای‌آی ادعا می‌کند که این ممکن است به دلیل آن باشد که «Anthropic گزارش‌هایی از نشانه‌های حفظ کردن در زیرمجموعه‌ای از مسائل را ارائه کرده است.»

این عرضه در بازاری صورت می‌گیرد که از زمان رونق هوش مصنوعی عاملیت محور به سرعت در حال حرکت است. GPT-5.4 تنها دو روز پس از GPT-5.3 عرضه شد، در حالی که شیائومی در حدود پنج هفته از MiMo-V2-Pro به MiMo 2.5 Pro – با قابلیت‌های کامل چندوجهی – رفت. فاصله بین GPT-5.4 و GPT-5.5 حدود هفت هفته بود. اکنون سرعت اینگونه است.

اما آیا این مدل برای کاربران عادی که همیشه در حال کدنویسی اتفاقات بزرگ بعدی نیستند، تفاوتی ایجاد خواهد کرد؟ اگر در سطح رایگان هستید، خیر: GPT-5.5 برای کاربران رایگان ارائه نمی‌شود. اگر ماهانه 20 دلار برای Plus پرداخت می‌کنید، امروز عرضه می‌شود. ما سعی کردیم آن را با حساب پرو خود آزمایش کنیم، اما مدل بلافاصله در دسترس نبود.

احتمالاً مهم‌تر از آن، کاری است که GPT-5.5 در داخل Codex – محیط کدنویسی عاملیت محور اوپن‌ای‌آی – انجام می‌دهد، جایی که ثابت شده قدرتمندتر است. پیترو شیرانو (Pietro Schirano)، مدیرعامل MagicPath، در نقل قولی که اوپن‌ای‌آی منتشر کرد، گفت: «واقعاً حس می‌کنم که با هوشی بالاتر کار می‌کنم، و تقریباً نوعی احترام وجود دارد.»

GPT-5.5 Pro، طراحی شده برای کارهای سخت‌تر و با دقت بالاتر، به طور جداگانه برای کاربران پرو (Pro)، بیزینس (Business) و اینترپرایز (Enterprise) در ChatGPT عرضه می‌شود. در BrowseComp، که توانایی یک مدل را برای یافتن اطلاعات دشوار در سراسر وب آزمایش می‌کند، GPT-5.5 Pro امتیاز 90.1% را کسب می‌کند و از Gemini 3.1 Pro با 85.9% پیشی می‌گیرد.

این مدل همچنین بر اساس شاخص Artificial Analysis، به طور متوسط هوشمندترین است. GPT 5.5 استفاده کارآمدتر و مفیدتری از توکن‌ها گزارش می‌دهد که به طور کلی نتایج بهتری را به همراه دارد.

Artificial Analysis Index — تصویر: OpenAI

با این حال، قیمت‌گذاری می‌تواند برخی از کاربران را شوکه کند. API هنگام عرضه 5 دلار برای هر میلیون توکن ورودی و 30 دلار برای هر میلیون توکن خروجی دریافت خواهد کرد، که اوپن‌ای‌آی می‌گوید "بسیار به زودی" ارائه می‌شود. GPT-5.5 Pro در API 30 دلار برای هر میلیون توکن ورودی و 180 دلار برای هر میلیون توکن خروجی هزینه خواهد داشت.

این ارقام بالاتر از GPT-5.4 هستند – 2.50 دلار برای هر میلیون توکن ورودی و 15.00 دلار برای هر میلیون توکن خروجی – در حالی که قیمت‌گذاری برای GPT-5.5 Pro همانند GPT-5.4 Pro باقی می‌ماند.

با این حال، سم آلتمن (Sam Altman)، مدیرعامل اوپن‌ای‌آی، در X استدلال کرد که افزایش کارایی توکن هزینه‌ها را جبران می‌کند – GPT-5.5 همان وظایف Codex را با توکن‌های کمتری تکمیل می‌کند، که به معنای اجرای ارزان‌تر حتی با نرخ بالاتر به ازای هر توکن است.

برای مقایسه، Xiaomi MiMo v2.5 Pro برای هر میلیون توکن ورودی 1 دلار و برای هر میلیون توکن خروجی 3 دلار هزینه دریافت می‌کند، Minimax M2.7 به ترتیب 0.30 دلار و 1.20 دلار هزینه دارد، و Kimi K2.5 برای هر میلیون توکن 0.44 دلار و 2.00 دلار نیاز دارد.

مطالب پربازدید

گروه‌های صنعت بازی آمریکا از سنا خواستند تا بازارهای پیش‌بینی ورزشی را در لایحه رمزارزی ممنوع کند: گزارش

2 ساعت قبل

تشدید کشمکش بر سر قانون GENIUS با دفاع سناتورها از تنظیم‌کنندگان ایالتی

10 ساعت قبل

سناتورهای دوحزبی بر خزانه‌داری فشار می‌آورند تا اختیارات ایالت‌ها را تحت قانون GENIUS حفظ کند

10 ساعت قبل

سایر مقالات

گروه‌های صنعت بازی آمریکا از سنا خواستند تا بازارهای پیش‌بینی ورزشی را در لایحه رمزارزی ممنوع کند: گزارش

2 ساعت قبل

World Liberty Financial مورد حمایت ترامپ، در آستانه تاییدیه OCC برای منشور تراست فدرال: گزارش

3 ساعت قبل