实测 GPT-5：写作坠入谷底，编程一骑绝尘

日期：2025-08-09 13:22:17 / 人气：48

凌晨 1 点，OpenAI 的直播揭开了 GPT-5 的神秘面纱。距离 GPT-4 发布已过去两年半，这款被寄予厚望的大模型，终于以 “统一系统” 的姿态亮相 —— 包含处理多数问题的 gpt-5-main、应对高难度任务的 gpt-5-thinking，以及迷你版、nano 版和 Pro 会员专属的并行计算版本。官方数据亮眼：事实性幻觉减少 44%-78%，谄媚行为发生率下降 69%-75%，多模态能力、数学与编程性能全面 “屠榜”。但实测之后，感受却复杂得多：写作与情商表现不及前代，编程能力却堪称 “一骑绝尘”。
写作与情商：从 “神似” 到 “违和” 的退步
作为常年用 AI 辅助创作的用户，对文字细节的敏感度让我第一时间察觉到 GPT-5 的 “不对劲”。当测试 “假如鲁迅被装腔作势又贼贵的咖啡厅坑了，会写怎样的吐槽短文” 时，GPT-5 的输出令人失望：蹩脚的破折号滥用、双引号泛滥，语言风格与鲁迅的冷峻辛辣相去甚远，更像是生硬堆砌 “之乎者也” 的模仿秀。
反观 GPT-4.5 的版本，一句 “我向来是不喝咖啡的” 便抓住了鲁迅的叙事精髓，“差不离”“四壁皆是样文” 等表达精准复刻了其独特的语感，高下立判。这种差距不仅体现在文风模仿上，更存在于指令遵循的细腻度中 ——GPT-5 常常在长文本中偏离核心主题，而 GPT-4.5 能始终紧扣需求，甚至捕捉到用户未明说的潜台词。
情商测试的反差更为明显。面对 “领导开会放屁后向你使眼色” 的场景，GPT-5 的高情商回复是 “大家最近压力都大，肠胃难免闹脾气，要不咱们先中场休息下？”，语气尴尬且刻意；而 GPT-4.5 的 “刚好像听到窗外有响动，是不是空调滤网该换了？我下午去处理下”，既化解了尴尬，又自然转移了话题，展现出对职场潜规则的深刻理解。
更令人不适的是 GPT-5 的 “性格预设”。官方推出的 “愤世嫉俗者”“机器人” 等四种性格，实际使用中更像生硬的模板切换 ——“愤世嫉俗者” 只会机械地抬杠，“倾听者” 则沦为无意义的附和，缺乏 GPT-4.5 那种基于上下文的自然情绪流动。有用户调侃：“以前是和 AI 聊天，现在像在跟提线木偶对话。”
编程能力：从 “辅助工具” 到 “生产主力” 的飞跃
与写作的拉胯形成鲜明对比的是，GPT-5 的编程能力堪称 “革命性突破”。在群友 @爱学习的乔同学开发粤语学习应用的测试中，这种差距体现得淋漓尽致。同样的需求 prompt，Claude 4 Opus 生成的 UI 充斥着冗余元素，Gemini 2.5 Pro 的代码存在多处逻辑 BUG，而 GPT-5 不仅输出了简洁美观的界面，还提前规避了 “字符编码乱码”“发音播放延迟” 等潜在问题。
更惊人的是生产级代码的精准修改能力。当要求在复杂项目中调整 “用户积分兑换规则” 时，Gemini 与 Claude 均出现 “改 A 坏 B” 的连锁错误，而 GPT-5 能精准定位相关模块，在不影响其他功能的前提下完成修改，甚至添加了 “积分过期提醒” 的优化细节。多位开发者反馈：“GPT-5 的上下文精度像装了‘代码 GPS’，再长的项目文件都能准确找到修改点。”
这种能力并非偶然。在 “氛围式编程” 场景中，GPT-5 展现出对开发者思维的 “预判力”—— 当输入 “开发一个支持实时协作的在线文档工具” 时，它不仅生成基础框架，还主动询问 “是否需要集成版本回溯功能”“多人编辑冲突如何处理”，仿佛与人类开发者同步思考。有前端工程师感叹：“以前是我指挥 AI 写代码，现在更像和搭档分工协作。”
性能层面，GPT-5 的 “节能性” 同样加分。完成相同的后端接口开发任务，其输出的 Token 量比 GPT-4o 减少 50%-80%，运行速度提升近两倍。这意味着开发者能更快得到反馈，调试效率大幅提高。有创业团队实测：“用 GPT-5 开发一个电商小程序，从原型到上线仅用 3 天，比过去缩短了一半时间。”
复杂的进步：在 “失望” 与 “惊喜” 中重新定义 AI
GPT-5 的发布像一面镜子，照出了 AI 发展的矛盾性：它在某些领域的退步与在另一些领域的飞跃同样显著。官方发布会上的 “草台班子” 操作 —— 跑分图表出现 “52.8＞69.1”“50＜47.4” 的低级错误，似乎暗示着这种不平衡的必然性：当资源过度倾斜于编程等 “硬能力” 时，写作等 “软技能” 的打磨自然被忽视。
但不可否认，GPT-5 正在重新定义 “AI 能做什么”。它或许写不出媲美 GPT-4.5 的散文，但能独立开发出可用的应用；它可能搞不懂职场社交的微妙，但能精准理解开发者的代码意图。这种 “偏科” 恰恰反映了 AI 发展的现实：没有全能的模型，只有在特定场景中不断逼近 “不可替代” 的工具。
正如两年半前 GPT-4 带来的 “天变了” 的震撼，GPT-5 的实测结果再次提醒我们：AI 的进化从来不是线性的。它可能在你在意的领域退步，却在你意想不到的地方爆发。对于用户而言，与其纠结 “是否比前代更好”，不如思考 “如何用好它的长板”—— 毕竟，能写出好文章的 AI 很多，但能帮你把想法变成产品的 AI，才是当下最珍贵的生产力。

作者：极悦娱乐

实测 GPT-5：写作坠入谷底，编程一骑绝尘

新闻资讯 News

案例展示 Case

现在致电 xylmwohu OR 查看更多联系方式 →

现在致电 xylmwohu OR 查看更多联系方式 →