作者 程心,编辑 罗辑,图片 电影《美国队长3》剧照
大模型价格战,已经不是什么新闻。
从OpenAI发布GPT-4o,将API价格下调50%,并宣布面向普通用户免费开始,就标志着大模型的竞争从性能进入到了成本时代。
国内的价格战从创业公司开始,先是DeepSeek宣布降价,智普AI,面壁智能等创业公司跟进开始。直到火山引擎,将战火从创业公司烧到大厂跟前,然后就是一系列的连锁反应。
图源:火山引擎官方
5月21日,阿里云最先应战,百度智能云直接掀了桌子,宣布两款轻量级主力模型免费,科大讯飞跟进,就连一向在行业里保持低调的腾讯,也给出了相当有诚意的优惠。
短短一周之内,一场围绕着价格的角逐就从局部冲突演变为全面战争,大模型杀疯了。
但在这场混战中,最典型也最有代表性的,恐怕要属阿里云和火山引擎,因为这两者的价格战,代表了目前大模型企业和云计算平台最典型的两种竞争方式。
火山引擎“奇袭”阿里云
某种程度上,大模型的价格战是无可避免的。但国内这场价格战却有一个非常戏剧性的特点。
即大厂之间,率先降价的并不是之前一直高举“低价”大旗的阿里云,而是字节跳动旗下的火山引擎。
图源:阿里云、火山引擎官方
火山引擎和阿里云的竞争,就像一个成名多年的高手,在自己最得意的招式上,被一个年轻小伙子出其不意的抢了先机,这无法不让人感到意外。
但这件事情其实是早有预兆,我们可以从字节和阿里过往的竞争中找到一些端倪。
如果从阿里和字节的层面,这一次其实是字节跳动第二次“奇袭”阿里,因为第一次是去年抖音电商异军突起猛攻淘宝。
2023年,抖音电商全年GMV快速超过2万亿,抖音向整个电商行业证明了它不仅仅是一个内容创造者,更是一个流量黑洞。只要抖音能抓住消费者的注意力,就能撬动B端让利。
通过这种方式,抖音电商在淘宝的“眼皮子”底下长大了,以一种几乎戏谑的方式,挑战着淘宝的传统电商老大的地位。
如今,抖音又将这个“绝招”用在了云市场上。
当我们把时间线拉长,捋清字节跳动这一年AI的轨迹,就会发现它“没有一个动作是多余的”。
比如「自象限」在《解密Kimi:大模型应用当红顶流是如何练成的?》提到,字节旗下的豆包与Kimi等应用在C端市场打响了营销战。如今,火山引擎又率先挑起面向B端和开发者的价格战。
看起来营销战和价格战分别对2C和2B发起的进攻,但本质上这是字节跳动一盘棋中的两步。
据「自象限」了解到,在字节跳动内部「豆包」及其他大模型应用产品的产品战略负责人是曾经操刀过Musical.ly和TikTok早期产品规划的副总裁朱骏,而火山引擎主要负责豆包大模型的2B服务,与千行百业的结合,由谭待负责。
也就是说,本质上,豆包2C的营销和投放和火山引擎的2B战略是两条业务线。
但有一个问题在于,2B市场尤其是传统行业在做创新性决策时,往往需要一个参照物或者是一个样本,对于完全陌生的领域,他们更追求“可预判性”而不是完全未知。
一位火山引擎的头部客户告诉「自象限」:“领导不懂技术,但他们可能用豆包,我们提案,就说内部做一个豆包,领导一下就能懂了。”
对于2B客户而言,创不创新是小事,但不能行差踏错。
由于豆包在C端市场已经通过营销打下了一定的用户心智,以及由于豆包的助力模型是云雀语音大模型,在一众大模型产品中,豆包具有一定的差异化,用户几乎不需要打字,通过语音就能和豆包进行对话,还有Agent通话功能。
这个功能,满足了很多老年人的需求。从去年开始我们发现身边有很多老人开始陆续使用豆包,有的父亲带着豆包去买菜,碰到不认识的菜就拍下来问问豆包;有的博士生导师和豆包一起改学生的论文;有的姥爷用豆包带娃哄孩子...
一位接近豆包的行业人士向「自象限」透露到:“从Grace改名叫豆包的时,产品团队几乎就选中了老年人群体和接地气的路线,也对这部分群体做了针对性的营销和渗透,尤其是通过抖音的定向推送。”
有流量平台果然能“一鱼多吃”,更何况目前大部分的公司的话语权,都掌握在这部分人手里。
这看起来是一个迂回策略,但事实上,或许从字节将大模型产品从Grace改名为豆包,外人都笑他“土”的时候,这盘棋的第一步就已经落子。
通过技术见长而打造产品差异化是第一步;而根据产品的差异化精准定位人群,是第二步。
通过抖音的大流量平台,进行精准的投放培养用户心智、和产品认知,顺带着参与了一轮营销战,是第三步。
有了标杆产品之后,2C和2B就开始有了连接点,以「豆包」为模版,打造企业自己的豆包,一度是火山引擎的核心销售话术。
这个销售策略和字节跳动2B的风格一致,即:将自己擅长的能力外化。飞书是字节内部管理流程的外化、火山引擎的诞生是源于字节推荐算法能力的外化。
降价,是全面引爆2B市场认知度的一把火,但却不是唯一的目的。谭待不断强调,降价的前提是因为“我们大模型的能力准备好了”,或许火山引擎想要对外的传达的,不只是价格低,而是模型能力早已ready。
但我们推测,降价、掀起价格战只是大模型的某一阶段,它并不是字节甚至火山引擎的直接目的。至于他的目的是什么,谭待也说的很清楚:“大模型尚未真正大规模落地,只要把价格降下来就还有机会。火山引擎最重要的,就是如何把最佳实践做好、市场做大。”
从而实现第四朵云的弯道超车。大模型是云厂商的新机会,很明显,火山引擎正在牢牢抓住这个新的机会不放,目前,已经获得了和阿里云同一牌桌的机会。
不过,想要做好整个市场,火山引擎还太“嫩”了,在阿里云的优势战区,火山引擎光“讨巧”已经不灵了,后面还需要拿出点硬实力。
技术降本VS规模化降本
套用马斯克的一句话:没有人不想用大模型,只要它足够便宜。
大模型的降价是一种必然,只是谁也没想过,它会来的那么快。
也更没人会没想到,到了大模型时代,阿里竟是第一个被字节跳动冲击的公司。
除了电商的核心业务之外,阿里云是名副其实的“二当家”,过去几年,阿里云在云市场拥有着绝对的先发优势,无论是IaaS层的规模化、2B的服务经验还是生态体系的健全程度,都让火山引擎这个“年轻小子”无法望其项背。
去年4月,阿里云主导了云市场的大规模降价潮,一年过去了当我们回头再看便会发现,彼时的降价并不是一个基于市场化竞争的决定,而是规模化带来的降本,降本之后的良性降价。
云计算发展了近20年,大部分IDC基建已经铺设的基本完善,也来到了摊薄成本的转折点,从2009年成立开始至2024年,随着基础设施的完善,平台整体性能的提高,降价成为了一种必然趋势,也是云厂商走过成长期,进入成熟期的标志。
在这一次通义千问的全面降价中,阿里也不断提到公有云规模化带来的算力普惠,阿里云公共云事业部刘伟光特意点出了:“公共云技术公里和规模效应,将带来巨大的成本和性能优势。”
归根结底,阿里云的降价仍然是规模化降本导致的降价,是足够老、足够久、足够庞大的人,才有的特权。
相比之下,火山引擎太年轻了,它第一次对外提供服务是2019年,和阿里云比谁更“厚”,几乎是一条死路。
但不代表,火山引擎就不能把成本“打下来”。
让我们回顾一下移动互联网时代的抖音,当时面临最大的困难是用户习惯?市场渗透?还是推荐算法难题?
其实都不是,当时抖音大规模普及面临最大的问题,是“流量太贵了”。
在那个3G到4G转变的节点,在人均每个月只有20M、30M流量的年代,没有人愿意一个月花几百块钱刷抖音。
所以从那时候开始,抖音的算法团队就在探索如何用更少的流量资源来刷视频这件事,这种算法的逻辑本质上和今天用有限的算力推理出更多结果是一个道理。
所以阿里通义降价的核心是规模化,而火山引擎则是技术带来的降本。
谭待曾公开讲道:“我们今天之所以降价,是因为我们能做到。我们在技术上有非常多的优化手段,能把它的成本降低,同时把效果做好。比如我们在模型结构上做优化和调整,在工程上用分布式推理替代单机推理,通过混合调度体系,日均处理1200亿Tokens文本,生成3000万张图片,加强使用算力的程度,大大降低成本。”
除了豆包大模型之外,被称为“大模型界的拼多多”的DeepSeek,也通过技术手段将算力成本降到最低,在行业地板的价格,仍然能获得50%的利润。同时如潞晨科技一样的创业公司,也正在锚定算力优化的路线,通过算法侧的改变,将单卡的开发程度达到最高,将多卡的耗损降到最低。
图源:DeepSeek论文中的优化架构
在当下这个阶段,规模化降本和技术降本是两条互相缠绕着的路线,阿里云和火山引擎都选择了适合自己的路。
这场“奇袭”,始于字节在大模型时代的猛攻。但也如同上文所说,奇袭可以杀个措手不及,但不代表能够获得胜利。
当火山引擎要在阿里的腹地与其贴脸开打,还有一场场硬仗等待着他。