InícioALTMAN notíciasOpenAI 最强模型 GPT-5 来了!免费可用,Altman 高呼迈向 AGI 一大步,微软抢先接入

OpenAI 最强模型 GPT-5 来了!免费可用,Altman 高呼迈向 AGI 一大步,微软抢先接入

2025-08-08
OpenAI于8月7日发布新一代旗舰AI模型GPT-5,首次整合推理与快速响应能力,在编程、数学、健康等领域表现突出,错误率显著降低。该模型向免费和付费用户开放,微软同日宣布将其整合至全线产品。CEO Altman称其为"重大升级",是迈向通用人工智能的重要一步。
OpenAI 最强模型 GPT-5 来了!免费可用,Altman 高呼迈向 AGI 一大步,微软抢先接入

今年 OpenAI 最为大众期待的产品来了。

美东时间 8 月 7 日周四,OpenAI 宣布,推出新一代旗舰人工智能(AI)模型 GPT-5。它是 OpenAI 首个「一体化」的 AI 系统,是 OpenAI 首次将 o 系列模型的推理能力与 GPT 系列模型快速响应能力相结合的产物。

OpenAI CEO Sam Altman 在新模型发布会上高度评价 GPT-5,称它是「世界上最好的模型」,是相比此前模型的「重大升级」,并表示,它的问世标志着,OpenAI 在实现通用人工智能(AGI)道路上迈出「重要一步」。

OpenAI 介绍,GPT-5 在多项基准测试中表现出色,在编程、数学、健康等领域达到前沿水平。GPT-5 在 SWE-bench Verified 代码测试中得到 74.9% 的准确率,略超 Anthropic 本周二发布的新模型 Claude Opus 4.1。同时,GPT-5 的幻觉问题大幅改善,错误信息率仅为 4.8%,远低于前代模型 GPT-4o 的 20.6%。

从本周四当日起,GPT-5 向所有 ChatGPT 的免费用户和订阅 Plus、Pro、Team 的付费用户开放,作为默认模型使用,并于一周内在 Enterprise 和 Edu 付费方案上线。

与 GPT-4o 一样,GPT-5 免费和付费版的区别在于用量。Plus 用户享有更高使用限额,Pro 用户可无限使用并获得增强版本 GPT-5 Pro。对于免费用户,完整的推理功能可能需要几天时间才能全部上线。一旦免费用户达到 GPT-5 的用量限制,OpenAI 就将为他们切换到更小的模型 GPT-5 mini。

OpenAI 周三还表示,将以每年 1 美元的象征性收费向美国联邦政府机构提供 ChatGPT 产品。具体来说是 ChatGPT 的企业版,其中包含强化的安全和隐私功能。

OpenAI 刚刚官宣 GPT-5,微软就宣布,从本周四开始,将 GPT-5 整合到旗下广泛的产品组合中,包括 365 Copilot、Copilot、GitHub Copilot 和 Azure AI Foundry 等平台,让微软的企业和消费者用户能够立即体验到 GPT-5 的高级推理能力和编程优势。

OpenAI 的 GPT5 发布公告在一开头就说,GPT-5 是 OpenAI「最智能、最快速、最实用的模型,其内置的思维能力,让每个人都能拥有专家级的智慧。」

根据 OpenAI 介绍,作为 OpenAI 的「最强大模型」,GPT-5 在三个关键领域实现了显著提升。

首先是编程能力。GPT-5 是 OpenAI 迄今为止最强大的编码模型,在复杂的前端生成和大型代码库调试方面表现突出,能够仅凭一个提示就创建美观响应式的网站、应用程序 App 和游戏。早期测试者注意到其在间距、排版和留白等设计选择方面的改进。

在从 GitHub 获取现实世界编码任务的基准测试 SWE-bench Verified 中,GPT-5 思考后首次尝试的准确率达 74.9%,高于 OpenAI 推理模型 o3 的 69.1% 和 GPT-4o 的 30.8%。

OpenAI 最强模型 GPT-5 来了!免费可用,Altman 高呼迈向 AGI 一大步,微软抢先接入

评论指出,这意味着,GPT-5 的表现略胜于 Anthropic 周二推出的 Claude Opus 4.1 和谷歌 DeepMind 的 Gemini 2.5 Pro,后两者在 SWE-bench Verified 测试的得分分别为 74.5% 和 59.6%。

不过,在衡量数学、人文和自然科学领域模型表现的各学科专家级能力 Humanity『s Last Exam 测试中,带有扩展推理功能的 GPT-5 增强版本 GPT-5 pro 在使用工具的情况下得分 42%。这略低于得分 44.4% 的 xAI 模型 Grok 4 Heavy。

OpenAI 最强模型 GPT-5 来了!免费可用,Altman 高呼迈向 AGI 一大步,微软抢先接入

Altman 称,GPT-5 尤其擅长按需启动整个软件 App,也就是所谓的「氛围编码」、即用 AI 根据自然语言提示生成功能代码,从而加快开发速度。

作为实例,OpenAI 的研究者演示了,要求 GPT-5 创建一款网页 App,帮助说英语的用户学习法语,且该 App 必须有一个引人入胜的主题,包含抽认卡、测验、经典的贪吃蛇游戏,以及追踪每日学习进度的方法。

研究者将相同的提示词提交到两个 GPT-5 窗口中,几分钟后生成了两个不同的 App。OpenAI 的负责人称,这些 App「存在一些缺陷」,但用户可以根据个人喜好再调整 AI 生成的软件,例如更改背景或添加更多标签页。

在创意写作方面,GPT-5 能够处理结构复杂的写作任务,如无韵律的抑扬格五音步诗或自然流动的自由诗。OpenAI 的 ChatGPT 业务副总 Nick Turley 表示,GPT-5 在创意任务上表现出「更好的品味」,响应更自然。

OpenAI 最强模型 GPT-5 来了!免费可用,Altman 高呼迈向 AGI 一大步,微软抢先接入

健康咨询是第三个重要提升领域。

GPT-5 能更积极地标记潜在健康问题,帮助用户解析医疗结果,尽管 OpenAI 强调,ChatGPT 不能替代医疗专业人员。

在名为 HealthBench Hard Hallucinations 的测试中,具备思考能力的 GPT-5 出现幻觉的错误信息率仅为 1.6%。这远低于 GPT-4o 和 o3 模型,后两者的错误信息率分别为 15.8% 和 12.9%。

OpenAI 最强模型 GPT-5 来了!免费可用,Altman 高呼迈向 AGI 一大步,微软抢先接入

OpenAI 称,GPT-5 相比此前的模型更可靠和实用,它能更准确地回答现实世界的疑问,出现幻觉的可能性显著降低。

在对代表 ChatGPT 生产流量的匿名提示词启用网络搜索后,GPT-5 响应中包含事实错误的可能性比 GPT-4o 低约 45%;在思考后,GPT-5 响应中包含事实错误的可能性比 o3 低约 80%。下图可见,GPT-5 响应的错误信息率仅为 4.8%,GPT-4o 为 20.6%,o3 为 22%。

OpenAI 最强模型 GPT-5 来了!免费可用,Altman 高呼迈向 AGI 一大步,微软抢先接入

OpenAI 还表示,为 GPT-5 引入了一种新的安全训练形式,名为安全补全(safe completions)。它教模型在安全范围内尽可能给出最有帮助的答案。有时,这可能意味着部分回答用户的问题,或者只提供高水平的回答。

如果需要拒绝,经过训练的 GPT-5 会以透明的方式告知用户拒绝的原因,并提供安全的替代方案。

在受控的实验和 OpenAI 的生产模型中,OpenAI 都发现这种安全补全的方法更加细致入微,能够更好地引导双重用途问题,增强对模糊意图的鲁棒性,并减少不必要的过度拒绝。

OpenAI 的后训练负责人 Michelle Pokrass 表示:「GPT-5 已经过训练,能够识别任务何时无法完成,避免猜测,并能更清晰地解释局限性,相比之前的模型,这减少了无根据的断言。」

OpenAI 称,GPT-5 在指令执行方面表现提升,其执行自定义指令的能力也得到了相应的提升。OpenAI 将为所有 ChatGPT 用户推出四种预设性格的全新研究预览版。

初始的四种性格选项——愤世嫉俗者(Cynic)、机器人(Robot)、倾听者(Listener)和书呆子(Nerd)都是可选的,用户可在设置中随时调整,用以匹配 ChatGPT 和用户的沟通风格。

上述四种性格最初适用于文本聊天,之后将扩展到语音聊天,让用户无需编写自定义提示词即可设置 ChatGPT 的交互方式——无论是简洁专业的、周到支持的,还是略带讽刺的。

OpenAI 称,所有这些新性格都达到或超过了我们减少谄媚行为的内部评估标准。

在本周四的简报会上,Altman 对 GPT-5 给予了极高评价,将 GPT-5 定位为通往 AGI 的重要里程碑。他表示:

Altman 在简报会上甚至不惜用「踩」GPT-4 抬高 GPT-5。他说:

GPT-5 采用统一的系统架构,配备实时路由器,能够根据对话类型、复杂性和工具需求自动决定是快速响应还是进行深度「思考」。这消除了用户选择合适设置的需要,使 ChatGPT 更易于使用。

在经济价值工作的内部基准测试中,使用推理模式的 GPT-5 在大约一半的案例中可与专家水平相当或更优,涵盖法律、物流、销售和工程等 40 多个职业。OpenAI VP Nick Turley 称:「这个模型的感觉真的很好。」

Altman 比喻,使用 GPT-5 就像随时拥有一支学历通通为博士的专家团队。他还说:「在很多新领域,人们受到想法的限制,但实际上却没有执行能力。」

微软在 GPT-5 发布当日即宣布,将其整合到广泛的产品线中。在企业级应用方面,Microsoft 365 Copilot 将利用 GPT-5 更好地处理复杂问题、在长对话中保持专注并理解用户上下文。企业用户可通过推理功能处理电子邮件、文档和文件。

对于消费者,Microsoft Copilot 的新智能模式将利用 GPT-5 帮助用户发现最佳解决方案。用户可通过 copilot.microsoft.com 或 Windows、Mac、Android 和 iOS 设备上的 Copilot 应用免费体验 GPT-5。

OpenAI 最强模型 GPT-5 来了!免费可用,Altman 高呼迈向 AGI 一大步,微软抢先接入

开发者将通过 GitHub Copilot 和 Visual Studio Code 获得 GPT-5 支持,用于编写、测试和部署代码。Azure AI Foundry 平台将提供所有 GPT-5 模型,配备 AI 驱动的模型路由器,根据每个任务的复杂性、性能需求和成本效率选择最优模型。

微软 AI 红队使用严格的安全协议测试了 GPT-5 推理模型,结果显示,该模型在恶意软件生成、欺诈自动化等多种攻击模式下展现出 OpenAI 历代模型中最强的 AI 安全配置之一。

Bate-papo ao vivo

Equipe de Suporte ao Cliente

Agora mesmo

Caro usuário do LBank

Nosso sistema de atendimento ao cliente online está com problemas de conexão. Estamos trabalhando ativamente para resolver o problema, mas, no momento, não podemos fornecer um prazo exato para a recuperação. Pedimos sinceras desculpas por qualquer inconveniente que isso possa causar.

Se precisar de ajuda, entre em contato conosco por e-mail e responderemos o mais rápido possível.

Obrigado pela sua compreensão e paciência.

Equipe de Suporte ao Cliente do LBank