GPT-5第一波用户反馈:笨拙,还我4o

任先生 2025-08-10 阅读:20 评论:0
  炒股就看金麒麟分析师研报,权威,专业,及时,全面,助您挖掘潜力主题机会! (来源:网易科技) OpenAI备受瞩目的新一代模型GPT-5在发布后遭遇了意想不到的初步反应,部分早期用户抱怨其表现“笨拙”,甚至不如前代产品。 许多用户表示,...

  炒股就看金麒麟分析师研报,权威,专业,及时,全面,助您挖掘潜力主题机会!

(来源:网易科技)

OpenAI备受瞩目的新一代模型GPT-5在发布后遭遇了意想不到的初步反应,部分早期用户抱怨其表现“笨拙”,甚至不如前代产品。

许多用户表示,这款被誉为能将ChatGPT提升至“博士级专家”水平的新模型,在实际使用中却频频在简单的数学和拼写问题上出错,甚至会编造信息。有许多付费用户表达了失望情绪,甚至呼吁恢复使用其前代模型GPT-4o。

OpenAI首席执行官Sam Altman于周五迅速做出回应。他承认GPT-5的发布过程“坎坷”,并将用户体验不佳归咎于技术故障。Altman表示,一个负责根据用户提问自动选择不同复杂程度模型的“自动切换器”在发布当天大部分时间处于失灵状态,导致系统调用了较弱的模型,使得GPT-5看起来“笨拙得多”。

对OpenAI而言,此次发布的成败攸关重大。该公司不仅需要以此证明其在人工智能领域的持续领先地位,更需要说服企业和个人用户为其高级服务付费。这些收入对于抵消其在人才、芯片和数据中心等方面的巨额投入至关重要,而一个不稳定的开局无疑会为这一商业目标蒙上阴影。

“自动切换”机制引发困惑

此次用户负面反馈的根源,很大程度上指向了GPT-5底层一个全新的运行机制。与以往版本不同,GPT-5引入了一个“自动切换器”(autoswitcher),系统会根据用户查询的复杂程度,自动在不同等级的模型之间进行切换。OpenAI希望通过这种方式最大限度地优化其宝贵的计算资源。

然而,这种设计也意味着用户并非总能调用OpenAI最强大的技术。当该切换机制未能准确判断或出现故障时,用户的体验便会大幅下降。

一个测试案例生动地说明了这一点:当被问及单词“blueberry”中有几个字母“b”时,GPT-5最初给出了错误的答案“三个”。但在被提示“再想一想”之后,系统似乎调用了更高级的推理模型,最终给出了正确答案。这一机制的不透明性是用户感到困惑和不满的主要原因之一。

尽管负面反馈占据了社交媒体的头条,但GPT-5的早期评价呈现两极分化。部分专业人士在试用后给出了积极评价。开发者Simon Willison在一篇博客文章中称GPT-5是“我最喜欢的新模型”,认为它“能胜任工作”且“偶尔表现出色”,但也补充说,“它与我们之前拥有的模型没有本质上的区别”。

宾夕法尼亚大学沃顿商学院教授Ethan Mollick则对其研究、写作和简化编程的能力感到惊叹:

Altman承认首秀失误并承诺改进

面对汹涌的负面评价,OpenAI管理层试图平息用户的担忧。在周五于Reddit平台举行的“Ask Me Anything”(AMA)活动中,Altman坦承了发布初期的技术问题。他承诺,“从今天开始,GPT-5会显得更智能”。

他表示,OpenAI正在研究允许Plus付费用户继续使用GPT-4o的方案,并将为Plus用户提供双倍的使用速率限制,以鼓励他们更好地适应新模型。

此外,针对发布会上引发“图表犯罪”(chart crime)嘲讽的一张严重失准的图表,Altman在社交平台X上承认这是一个“巨大的图表失误”,进一步显示了此次发布的仓促与混乱。

GPT-5第一波用户反馈:笨拙,还我4o 第1张

根据用户排名的流行榜单LMArena,GPT-5在周五中午已升至多个类别的榜首。但另一个基准测试ARC-AGI-2则显示,GPT-5落后于xAI的最新版Grok模型。

GPT-5的此次发布正值人工智能领域竞争空前激烈的时刻,这使其表现出的任何不稳定性都备受关注。OpenAI正努力维持其近三年前由ChatGPT引爆的生成式AI热潮所带来的领先优势,而包括马斯克的xAI在内的竞争对手正穷追不舍。

对于每周拥有近7亿用户的ChatGPT而言,一个平稳、可靠的用户体验是维持其市场地位和证明其商业价值的关键。此次发布的波折,无疑对投资者和市场信心构成了一次考验。

版权声明

本文仅代表任先生博客观点,不代表任先生博客立场。
本文系作者授权任先生博客发表,未经许可,不得转载。

分享:

扫一扫在手机阅读、分享本文

热门文章
  • 微信分付可以借出来吗:一步之遥,从分付额度变现微信现金的4个顶级操作

    微信分付可以借出来吗:一步之遥,从分付额度变现微信现金的4个顶级操作
    微信分付怎么变现:一步之遥,从分付额度变现微信现金的4个顶级操作使用微信的用户,只有一小部分的拥有分付,一般在你的支付分或者个人信用分达到650以上才有机会,一般最低额度也是500以上,那么我们有什么办法,可以合法合规的情况下,变现微信分付的额度,提到微信账户里,小编整理了4个顶级操作,非常牛,来看看是怎么操作的吧!教程:1.直接扫码通过直接扫码的方式,这个必须是商家码才可以,个人码是不可以的,需要和商家有一定的熟悉感,操作的前提下,我们应该保证自己的财产安全,一般商家给的点...
  • 建滔积层板现涨超3% 花旗重申“买入”评级

    建滔积层板现涨超3% 花旗重申“买入”评级
      建滔积层板(01888)早盘上涨3.46%,现报8.96港元,成交额4702.23万港元。   近日,花旗发布研究报告称,在建滔积层板(01888)股价回落17%后,重申“买入”评级,对其开启90天上行催化观察,因为预期公司将在7月中旬发布盈喜;预料公司今年上半年股东应占盈利同比升82%至7.68亿元,目标价12.5港元,预期今年至2026年的每股盈利复合年均成长率为60%。...
  • 房县黄酒的酿造工艺与步骤(2024详细教程)

    房县黄酒的酿造工艺与步骤(2024详细教程)
    房县黄酒的酿造工艺与步骤房县黄酒,源自中国湖北省房县的传统酿造佳品,历史悠久,工艺独特。其独特的口感和香气得益于精细的酿造工艺。以下是房县黄酒的主要酿造步骤:黄酒购买热线:133412496001. 选料与浸泡酿造房县黄酒的首要步骤是选择高质量的原料。主要原料为糯米和麦曲,它们的选择直接决定了黄酒的口感和品质。糯米要求粒大饱满,无病虫害;麦曲则应选用优质大麦,经过精心培养制成。选好的糯米需要经过浸泡,使米粒充分吸水膨胀,有利于后续的蒸煮过程。2. 蒸煮与冷却将浸泡好的糯米进行...
  • 鼻血喷涌!女明星丝袜诱惑,惊艳全场

    鼻血喷涌!女明星丝袜诱惑,惊艳全场
    丝袜作为时尚界的经典元素,早已成为女明星红毯、舞台、杂志拍摄等场合的必备利器。女明星们根据自己的身形、气质以及活动场合,选择不同颜色、质地和厚度的丝袜,展现出各式各样的丝袜风格。有的偏好黑色丝袜的神秘诱惑,有的则喜欢肉色丝袜的自然轻盈,还有的选择彩色丝袜,展现出鲜明的个性,都有哪些女明星让你鼻血喷涌呢?1.范冰冰的性感,妖娆2.米雪的俏皮,可爱3.性感林志玲4.诱惑马伊琍5.骨感张柏芝那个是你的菜呢?...
  • 未成年少女性侵与强迫卖淫案:湖南男子因涉及贩卖活动获重刑

    未成年少女性侵与强迫卖淫案:湖南男子因涉及贩卖活动获重刑
    湖南宁远县重判介绍卖淫男子:13岁少女遭性侵案引发社会反思湖南宁远县近日公布了一起令人痛心的案件。一名13岁的未成年少女在遭遇性侵后,被迫从事卖淫活动。经过调查和审理,涉案男子因介绍卖淫被重判。此案不仅揭示了社会对未成年人保护的缺失,也引发了公众对性侵和未成年人权益保护的深思。据悉,该案中的未成年少女在13岁时遭遇了性侵,身心受到了极大的伤害。更为严重的是,她随后被迫从事卖淫活动,成为了陈某等不法分子的赚钱工具。陈某利用未成年女孩从事有偿陪侍和卖淫活动,涉及多名未成年人女孩,...