OpenAI发布o3-mini卷入“价格战”,推理模型首次向免费用户开放

任先生 2025-02-02 阅读:214 评论:0
专题:DeepSeek为何能震动全球AI圈   当地时间1月31日,OpenAI宣布推出新一代推理模型o3系列的mini版本。据OpenAI介绍,o3-mini是其最具成本效益的推理模型,在科学、数学、编程等领域的能力较强,同时兼具o1-m...

专题:DeepSeek为何能震动全球AI圈

  当地时间1月31日,OpenAI宣布推出新一代推理模型o3系列的mini版本。据OpenAI介绍,o3-mini是其最具成本效益的推理模型,在科学、数学、编程等领域的能力较强,同时兼具o1-mini的低成本和低延迟特点,o3-mini可与联网搜索功能搭配使用,不过o3-mini还不支持视觉功能。

  “o3-mini的能力可设置为低等、中等、高等。能力设置为中等的o3-mini与o1在数学、编程和科学方面的表现相当,但反应速度更快。专家测试人员的评估表明,o3-mini给出的答案比o1-mini更准确且清晰。测试者观察到,在有关现实世界的难题上,o3-mini的主要错误减少了39%。”OpenAI表示。

  从能力上看,作为mini版本,o3-mini在一些测试中的表现略超o1。在数学测试AIME 2024、博士水平测试GPQA Diamond、竞赛编码测试Codeforces、软件工程测试sw -bench中,o3-mini得分分别为87.3、79.7、2130、49.3,高于o1的得分83.3、78、1891、48.9。

OpenAI发布o3-mini卷入“价格战”,推理模型首次向免费用户开放 第1张

OpenAI发布o3-mini卷入“价格战”,推理模型首次向免费用户开放 第2张

  此外,o3-mini在编码测试LiveBench中表现优于o1,在一般知识测试General knowledge中表现优于o1-mini。从速度上看,o3-mini在A/B测试(一种对比测试)中的平均响应时间为7.7秒,响应速度比o1-mini快24%。

  此前国内大模型公司DeepSeek发布DeepSeek-R1,并称该模型性能对标OpenAI o1正式版,该模型不仅开源,API(接口)价格还明显低于o1。DeepSeek-R1输入(缓存命中)、输出定价分别为每百万tokens1元、6元,低于o1的55元、438元。或是迫于压力,OpenAI CEO山姆·奥尔特曼(Sam Altman)在当地时间1月23日宣布,OpenAI将推出新一代o3系列的o3-mini版本,且ChatGPT免费用户将能使用o3-mini。

  此次OpenAI正式推出o3-mini后,OpenAI再次强调,ChatGPT是首次向免费用户提供推理模型,用户可以在消息编辑器中选择“Reason”来尝试使用OpenAI 3-mini。不过,付费用户的使用范围更广,可以使用o3-mini的高等能力。ChatGPT Plus和Team用户的流量限制从01 -mini的每日50条增加到03 -mini的每日150条,Pro用户则可以无限制地使用o3-mini。

  OpenAI也在提供越来越低的API调用价格,据其介绍,自GPT-4推出以来,每个token的定价下降了95%。o3-mini输入(缓存命中)、输出每百万tokens的定价为0.55美元、4.4美元,仍高于DeepSeek-R1。

  虽然DeepSeek并未公开DeepSeek-R1的训练成本,但此前DeepSeek公开了另一个模型DeepSeek-v3的训练预算为“2048个GPU、2个月、近600万美元”,外界认为DeepSeek-R1在能力对标o1的同时,训练成本可能也偏低,这可能意味着DeepSeek团队的技术水平较高。随着DeepSeek近期受到关注,OpenAI客观上也承受了一定压力。

  OpenAI正在采取措施维持自身的优势,除了推出o3-mini“应战”,近日还有消息称,OpenAI正在就新一轮融资进行谈判,拟筹资金额高达 400 亿美元,该轮融资将由软银集团牵头,使OpenAI的估值达到3000亿美元,不过该传言尚未得到OpenAI证实。

  (本文来自第一财经)

版权声明

本文仅代表任先生博客观点,不代表任先生博客立场。
本文系作者授权任先生博客发表,未经许可,不得转载。

分享:

扫一扫在手机阅读、分享本文

热门文章
  • 微信分付可以借出来吗:一步之遥,从分付额度变现微信现金的4个顶级操作

    微信分付可以借出来吗:一步之遥,从分付额度变现微信现金的4个顶级操作
    微信分付怎么变现:一步之遥,从分付额度变现微信现金的4个顶级操作使用微信的用户,只有一小部分的拥有分付,一般在你的支付分或者个人信用分达到650以上才有机会,一般最低额度也是500以上,那么我们有什么办法,可以合法合规的情况下,变现微信分付的额度,提到微信账户里,小编整理了4个顶级操作,非常牛,来看看是怎么操作的吧!教程:1.直接扫码通过直接扫码的方式,这个必须是商家码才可以,个人码是不可以的,需要和商家有一定的熟悉感,操作的前提下,我们应该保证自己的财产安全,一般商家给的点...
  • 建滔积层板现涨超3% 花旗重申“买入”评级

    建滔积层板现涨超3% 花旗重申“买入”评级
      建滔积层板(01888)早盘上涨3.46%,现报8.96港元,成交额4702.23万港元。   近日,花旗发布研究报告称,在建滔积层板(01888)股价回落17%后,重申“买入”评级,对其开启90天上行催化观察,因为预期公司将在7月中旬发布盈喜;预料公司今年上半年股东应占盈利同比升82%至7.68亿元,目标价12.5港元,预期今年至2026年的每股盈利复合年均成长率为60%。...
  • 房县黄酒的酿造工艺与步骤(2024详细教程)

    房县黄酒的酿造工艺与步骤(2024详细教程)
    房县黄酒的酿造工艺与步骤房县黄酒,源自中国湖北省房县的传统酿造佳品,历史悠久,工艺独特。其独特的口感和香气得益于精细的酿造工艺。以下是房县黄酒的主要酿造步骤:黄酒购买热线:133412496001. 选料与浸泡酿造房县黄酒的首要步骤是选择高质量的原料。主要原料为糯米和麦曲,它们的选择直接决定了黄酒的口感和品质。糯米要求粒大饱满,无病虫害;麦曲则应选用优质大麦,经过精心培养制成。选好的糯米需要经过浸泡,使米粒充分吸水膨胀,有利于后续的蒸煮过程。2. 蒸煮与冷却将浸泡好的糯米进行...
  • 鼻血喷涌!女明星丝袜诱惑,惊艳全场

    鼻血喷涌!女明星丝袜诱惑,惊艳全场
    丝袜作为时尚界的经典元素,早已成为女明星红毯、舞台、杂志拍摄等场合的必备利器。女明星们根据自己的身形、气质以及活动场合,选择不同颜色、质地和厚度的丝袜,展现出各式各样的丝袜风格。有的偏好黑色丝袜的神秘诱惑,有的则喜欢肉色丝袜的自然轻盈,还有的选择彩色丝袜,展现出鲜明的个性,都有哪些女明星让你鼻血喷涌呢?1.范冰冰的性感,妖娆2.米雪的俏皮,可爱3.性感林志玲4.诱惑马伊琍5.骨感张柏芝那个是你的菜呢?...
  • 未成年少女性侵与强迫卖淫案:湖南男子因涉及贩卖活动获重刑

    未成年少女性侵与强迫卖淫案:湖南男子因涉及贩卖活动获重刑
    湖南宁远县重判介绍卖淫男子:13岁少女遭性侵案引发社会反思湖南宁远县近日公布了一起令人痛心的案件。一名13岁的未成年少女在遭遇性侵后,被迫从事卖淫活动。经过调查和审理,涉案男子因介绍卖淫被重判。此案不仅揭示了社会对未成年人保护的缺失,也引发了公众对性侵和未成年人权益保护的深思。据悉,该案中的未成年少女在13岁时遭遇了性侵,身心受到了极大的伤害。更为严重的是,她随后被迫从事卖淫活动,成为了陈某等不法分子的赚钱工具。陈某利用未成年女孩从事有偿陪侍和卖淫活动,涉及多名未成年人女孩,...