实测 GPT-5:写作坠入谷底,编程一骑绝尘
日期:2025-08-09 13:22:17 / 人气:14

凌晨 1 点,OpenAI 的直播揭开了 GPT-5 的神秘面纱。距离 GPT-4 发布已过去两年半,这款被寄予厚望的大模型,终于以 “统一系统” 的姿态亮相 —— 包含处理多数问题的 gpt-5-main、应对高难度任务的 gpt-5-thinking,以及迷你版、nano 版和 Pro 会员专属的并行计算版本。官方数据亮眼:事实性幻觉减少 44%-78%,谄媚行为发生率下降 69%-75%,多模态能力、数学与编程性能全面 “屠榜”。但实测之后,感受却复杂得多:写作与情商表现不及前代,编程能力却堪称 “一骑绝尘”。
写作与情商:从 “神似” 到 “违和” 的退步
作为常年用 AI 辅助创作的用户,对文字细节的敏感度让我第一时间察觉到 GPT-5 的 “不对劲”。当测试 “假如鲁迅被装腔作势又贼贵的咖啡厅坑了,会写怎样的吐槽短文” 时,GPT-5 的输出令人失望:蹩脚的破折号滥用、双引号泛滥,语言风格与鲁迅的冷峻辛辣相去甚远,更像是生硬堆砌 “之乎者也” 的模仿秀。
反观 GPT-4.5 的版本,一句 “我向来是不喝咖啡的” 便抓住了鲁迅的叙事精髓,“差不离”“四壁皆是样文” 等表达精准复刻了其独特的语感,高下立判。这种差距不仅体现在文风模仿上,更存在于指令遵循的细腻度中 ——GPT-5 常常在长文本中偏离核心主题,而 GPT-4.5 能始终紧扣需求,甚至捕捉到用户未明说的潜台词。
情商测试的反差更为明显。面对 “领导开会放屁后向你使眼色” 的场景,GPT-5 的高情商回复是 “大家最近压力都大,肠胃难免闹脾气,要不咱们先中场休息下?”,语气尴尬且刻意;而 GPT-4.5 的 “刚好像听到窗外有响动,是不是空调滤网该换了?我下午去处理下”,既化解了尴尬,又自然转移了话题,展现出对职场潜规则的深刻理解。
更令人不适的是 GPT-5 的 “性格预设”。官方推出的 “愤世嫉俗者”“机器人” 等四种性格,实际使用中更像生硬的模板切换 ——“愤世嫉俗者” 只会机械地抬杠,“倾听者” 则沦为无意义的附和,缺乏 GPT-4.5 那种基于上下文的自然情绪流动。有用户调侃:“以前是和 AI 聊天,现在像在跟提线木偶对话。”
编程能力:从 “辅助工具” 到 “生产主力” 的飞跃
与写作的拉胯形成鲜明对比的是,GPT-5 的编程能力堪称 “革命性突破”。在群友 @爱学习的乔同学开发粤语学习应用的测试中,这种差距体现得淋漓尽致。同样的需求 prompt,Claude 4 Opus 生成的 UI 充斥着冗余元素,Gemini 2.5 Pro 的代码存在多处逻辑 BUG,而 GPT-5 不仅输出了简洁美观的界面,还提前规避了 “字符编码乱码”“发音播放延迟” 等潜在问题。
更惊人的是生产级代码的精准修改能力。当要求在复杂项目中调整 “用户积分兑换规则” 时,Gemini 与 Claude 均出现 “改 A 坏 B” 的连锁错误,而 GPT-5 能精准定位相关模块,在不影响其他功能的前提下完成修改,甚至添加了 “积分过期提醒” 的优化细节。多位开发者反馈:“GPT-5 的上下文精度像装了‘代码 GPS’,再长的项目文件都能准确找到修改点。”
这种能力并非偶然。在 “氛围式编程” 场景中,GPT-5 展现出对开发者思维的 “预判力”—— 当输入 “开发一个支持实时协作的在线文档工具” 时,它不仅生成基础框架,还主动询问 “是否需要集成版本回溯功能”“多人编辑冲突如何处理”,仿佛与人类开发者同步思考。有前端工程师感叹:“以前是我指挥 AI 写代码,现在更像和搭档分工协作。”
性能层面,GPT-5 的 “节能性” 同样加分。完成相同的后端接口开发任务,其输出的 Token 量比 GPT-4o 减少 50%-80%,运行速度提升近两倍。这意味着开发者能更快得到反馈,调试效率大幅提高。有创业团队实测:“用 GPT-5 开发一个电商小程序,从原型到上线仅用 3 天,比过去缩短了一半时间。”
复杂的进步:在 “失望” 与 “惊喜” 中重新定义 AI
GPT-5 的发布像一面镜子,照出了 AI 发展的矛盾性:它在某些领域的退步与在另一些领域的飞跃同样显著。官方发布会上的 “草台班子” 操作 —— 跑分图表出现 “52.8>69.1”“50<47.4” 的低级错误,似乎暗示着这种不平衡的必然性:当资源过度倾斜于编程等 “硬能力” 时,写作等 “软技能” 的打磨自然被忽视。
但不可否认,GPT-5 正在重新定义 “AI 能做什么”。它或许写不出媲美 GPT-4.5 的散文,但能独立开发出可用的应用;它可能搞不懂职场社交的微妙,但能精准理解开发者的代码意图。这种 “偏科” 恰恰反映了 AI 发展的现实:没有全能的模型,只有在特定场景中不断逼近 “不可替代” 的工具。
正如两年半前 GPT-4 带来的 “天变了” 的震撼,GPT-5 的实测结果再次提醒我们:AI 的进化从来不是线性的。它可能在你在意的领域退步,却在你意想不到的地方爆发。对于用户而言,与其纠结 “是否比前代更好”,不如思考 “如何用好它的长板”—— 毕竟,能写出好文章的 AI 很多,但能帮你把想法变成产品的 AI,才是当下最珍贵的生产力。
作者:极悦娱乐
新闻资讯 News
- 十问金融“国补”:消费与经营贷...08-14
- 左宗棠晚年:晚清矛盾的浓缩与时...08-14
- 帕金森病为何没有特效药?08-14
- 硅谷顶级种子轮风投人:颠覆认知...08-14