GPT-5 发布了，到底有没有那么神？

日期：2025-08-09 13:23:27 / 人气：139

GPT-5，终于在深夜出炉。
以为很震惊，以为很惊艳？确实有。
但先来看一张图：OpenAI 在全球直播展示 Benchmark 时，竟能把 52.8 显示得比 69.1 还高，甚至让 69.1 与 30.8 平齐。单就这一点，开场号称 “博士水平” 的 AI，出现如此 “按需缩放” 坐标系的失误，引得网友怒喷不已。
甚至 Altman 都赶忙出来转移话题，称技术博客上是正确的…… 确实，技术博客确实有所更正。但如此失误，着实不应该，毕竟大家都等了 2 年啊！
博士水平的 AI，来了
不过有一说一，除了这个被大众诟病的致命失误之外，GPT-5 在现场的表现还算是可圈可点。
在技术博客中，OpenAI 开场直接一句：“迄今为止，这是我们最智能、最快速、最实用的模型，内置的思考能力让每个人都能拥有专家级智能。”
这次发布的 GPT-5 拥有四个版本：
GPT-5：在不同领域中进行 Coding 和执行任务的标准模式；
GPT-5 mini：轻量版版本，适用于对明确界定的任务和场景；
GPT-5 nano：强调运行速度和性价比；
GPT-5 Chat：ChatGPT 中使用的版本。
GPT-5 目前已面向普通用户提供免费、plus 和 Pro 三种模式。同时在 API 平台上，推出了 GPT-5、GPT-5 nano、GPT-5 mini 三种模型选择。不仅如此，承接此前时隔 6 年的开源，OpenAI 表示这次 GPT-5 面向所有人，免费！并且是博士水平的那种。
我们先来看下 Benchmark。最让人吸睛的，还是 GPT-5 在 AIME 2025 的表现，直接拿下满分的成绩。其次就是编程能力，相较于 o3 和 4o，GPT-5 在思考模式加持之下，达到了 74.9% 的水平。
除此之外，这个模型在多种多模态评测中表现出色，覆盖了图像、视频、空间理解和科学推理等方面。更强的多模态能力，意味着 ChatGPT 在处理图片和其他非文字信息时更聪明了 —— 比如看懂图表、总结一张演示照片的内容，或者回答关于图示的问题。
而且比较罕见的是，第三方的大模型竞技场（Imarena.ai）也是及时跟进，直接发表声明：“全方面第一”。具体而言，竞技场涉及的内容包括：文本、Web 开发、视觉、编程、数学、创造力、长查询等。由此可见，GPT-5 从目前评测标准来看，确实是 AI 大模型的卫冕之王。
再看效果
成绩是一方面，但实际效果才是硬道理。深谙此理的 Sam Altman 在自己的 X 账号上也是立马跟进，发布了由 GPT-5 生成的效果，并且表示有 GPT-5 权限的用户，只需发送 “use beatbot to make a sick beat to celebrate gpt-5” 即可体验。不得不说，营销这块，Altman 还是非常手拿把掐的。
不过在直播的现场演示过程中，GPT-5 还是有不少惊艳的表现在身上的。例如让 GPT-5 生成一个学语法的 APP，不要以为是简单的网站，除了可以完成市面上 AI 的交互之外，它在里面还可以内嵌一个小游戏（点击 “Mouse&Cheese”）；并且若是想改变 APP 里面的内容，只要一句话，瞬间（现场实测）就可以改变布局。
对于更加庞大且复杂的项目，例如现场 OpenAI 展示了用 GPT-5 先编程出来的代码，在运行之后，便得到了一个 3D 效果的 “世界”。总而言之，从现场效果来看，GPT-5 也是担得起 “最聪明、最强编程” 的大模型。
“观众” 们买单吗？
从目前 X 上 “观众” 的反馈来看，讨论最激烈的就是前面我们提到的图表 bug。甚至有网友做了一张简单粗暴的 Excel 表格来讽刺这次的失误。
不过另一方面，老东家微软 CEO 火速出面站台，并配有一个 “爱心” 图片以表支持；再如开发者们常用的 VS Code，官方也是 Day 0 无缝衔接 GPT-5。
不过对于普罗大众来说，反馈声音最大的莫过于：“说好的免费，我的 ChatGPT 咋没有呢？”
总而言之，用户到底买不买单，实测效果到底有没有那么神，需要让子弹再飞一会了。

作者：极悦娱乐

GPT-5 发布了，到底有没有那么神？

新闻资讯 News

案例展示 Case

现在致电 xylmwohu OR 查看更多联系方式 →

现在致电 xylmwohu OR 查看更多联系方式 →