如何证明自家的模型是行业一流水平?跟DeepSeek比一比。

随着DeepSeek爆火,2025年的大模型市场,DeepSeek就像手机圈的iPhone一样,成了各家模型厂商发布新品时的最新对标对象。

除了模型能力上号称超过DeepSeek之外,上述对标更直观的表现在价格上。

在今天百度文心大模型4.5 Turbo、文心大模型X1 Turbo发布时,百度创始人李彦宏就吐槽DeepSeek也不是万能的。除了能力上只能处理文本,还不能理解和生成图片、音频、视频等多媒体内容、幻觉率高外,李彦宏认为使用DeepSeek更大的问题是慢和贵,“中国市场上绝大多数的大模型API调用价格都比DeepSeek满血版要低,而且速度也更快。”

当然,其中也包括最新发布的文心4.5 Turbo和文心X1 Turbo。官方数据显示,文心4.5 Turbo每百万token的输入价格为0.8元,输出价格3.2元。

作为对比,即便在打五折后的优惠时段(00:30-8:30),DeepSeek V3每百万token的输入价格也达到1元,输出价格4元。

推理模型上,百度模型的性价比则进一步凸显:文心大模型X1 Turbo每百万token输入价格1元,输出价格4元,与DeepSeek R1优惠时段价格一致,但比DeepSeek R1标准时段(8:30-00:30)要便宜得多(R1每百万token输入8元,输出16元)。

想用性价比顶住DeepSeek竞争压力的不止百度一家。4月17日字节发布的豆包1.5·深度思考模型上,其每百万token的输入价格为4元,输出价格16元,综合成本上依然要比DeepSeek R1标准时段便宜。

这样的性价比策略更是不止局限于国内大模型玩家。国外同样如此。

4月份谷歌发布的首个混合推理模型Gemini 2.5 Flash,便主打一个低成本。在关闭思考模式下,Gemini 2.5 Flash每百万token输出成本暴降600%,可以达到0.6美元/百万token,输入价格0.15美元,也远低于DeepSeek R1标准时段价格。

稍微偏离性价比策略的模型玩家是OpenAI。

2月底发布GPT-4.5后,其API价格达到75美元/百万token输入、150美元/token输出,是GPT-4o的30倍,高昂价格令其饱受争议。

但OpenAI很快纠正了自己的“错误”。2个月后的4月份,OpenAI专为开发者推出了三款全新模型:GPT-4.1、GPT-4.1 mini和GPT-4.1 nano。最便宜的GPT4.1 nano,每百万token输入价格暴降至0.1美元,输出价格0.4美元。

但只靠性价比显然还不足以打开市场。DeepSeek之所以能够出圈,除了低成本之外,其重要前提之一是模型能力有了创新,首次向外界免费展示了思维链的奇妙存在。

01

模型降本是趋势,但国外比国内更贵

延续至今的大模型降本之争,源头便是DeepSeek。2024年5月,DeepSeek借助大模型价格战一跃成名。当时,DeepSeek发布了DeepSeek V2开源模型,并在行业内率先降价,将推理成本降到每百万token仅1块钱,约等于GPT-4 Turbo的七十分之一。

随后,字节、腾讯、百度、阿里等科技大厂纷纷降价跟进。中国大模型价格战由此揭幕。

在接受“暗涌”采访时,DeepSeek创始人梁文锋解释道,抢用户并不是DeepSeek降价的主要目的。“我们降价一方面是因为我们在探索下一代模型的结构中,成本先降下来了,另一方面也觉得无论API,还是AI,都应该是普惠的、人人可以用得起的东西。”

此前,有云厂商高管曾向直面AI(ID:faceaibang)解释:“降价一直存在,并且只要摩尔定律在,降低计算成本将一直是模型行业的趋势。”

包括李彦宏在内的部分大佬更是认为,降本将是推动AI应用爆发的重要前提。

但在降本的全球趋势之下,值得注意的不同现象是,国外同类型、同尺寸的模型,调用成本依然要比国内的更贵。

4月份刚刚发布的OpenAI o3新推理模型上,其每百万token的输入价格为10美元,输出价格40美元。但以输入价格论,o3是文心X1 Turbo的超70倍。

造成这种不同的原因之一,或许也跟国外模型厂商的多元化商业变现有关。

相比国内只能靠B端API调用收费,目前国外还有来自C端的销售订阅服务,甚至后者商业变现能力还要强于前者。The Information爆料,OpenAI今年订阅销售额有望达到80亿美元,远超销售其API接口的约20亿美元。

OpenAI CEO奥特曼近期在接受采访时就谈道,自己更感兴趣的是,弄清楚如何为一个真正出色的自动化软件工程师,或者其他类型的代理,向人们收取高额费用,而不是通过基于广告的模式来赚取一些小钱。

此前,外界就曾爆出,OpenAI有望推出高达2000美元,乃至2万美元的月度订阅制。目前,OpenAI设有每月20美元和200美元两档订阅模式。

02

只有性价比还不够,关键在于模型是否有特色

商业变现受限之下,陷入价格战之中的国内模型厂商,还可能迎来更大的成本压力,甚至跌入互联网时代烧钱补贴的竞争逻辑。

更大的挑战还在于,仅靠性价比也并不能彻底留住用户。

DeepSeek在去年开启价格战后,虽然在行业内开始崭露头角,但并未在大众层面引发关注。直到DeepSeek R1模型的到来,DeepSeek才真正出圈,成为一款家喻户晓的AI产品。

奥特曼在点评DeepSeek爆火现象时曾认为,模型的能力并不是真正让DeepSeek获得病毒式传播的关键,关键在于DeepSeek免费开放了OpenAI隐藏起来的思维链。

但环顾当下的一众新模型产品,除了在各项数据上比肩或者赶超DeepSeek,乃至OpenAI之外,它们尚未在产品体验和功能上有创新之举。

这方面从谷歌到豆包,都先后做过了反面示例。晚于DeepSeek R1近两天发布的豆包1.5 Pro大模型,尽管在预训练和推理成本上还要低于DeepSeek V3,但却因为模型体验不如前者,而未能在舆论场上激起太多水花。

同样赶在DeepSeek R1之后发布的谷歌Gemini 2.0系列大模型,尽管其Gemini 2.0 Flash-Lite版本的调用价格,比DeepSeek V3更低,但仅靠价格优势,也依然难以俘获用户的芳心。

这也从某种程度上解释了,为什么顶着全球最贵大模型称号的Claude,依然能俘获一批开发者的芳心,如继DeepSeek之后另一出圈的通用AI Agent产品Manus,便是基于Anthropic的Claude 3.5模型开发而来。

一切竞争的原点,都又回到了底层模型的技术创新和突破上。