作者 | 荣智慧
编辑 | 向 由
唯物的中国芯片产业深度观察
百度忽然来了一个 180 度转弯。
2 月 13 日,百度宣布聊天机器人 " 文心一言 " 于 4 月 1 日起免费。2 月 14 日,百度又宣布文心大模型 4.5 系列陆续推出,6 月 30 日正式开源。
在开源的深度求索(DeepSeek)面向大众之前,百度一直是闭源模型和收费服务的拥护者。
然而,连人工智能领头羊 OpenAI 也扛不住压力,早一步抛出 " 免费加开源 " 消息;一众互联网巨头如英伟达、亚马逊、微软均将深度求索模型集成到自家平台;一堆做 " 深度求索入口 " 的应用也趁机捞了一把流量,包括不缺流量的支付宝和微信。
" 文心一言 " 于 4 月 1 日起免费,并于 2 月 13 日起上线 " 深度搜索 " 功能 / 图源:@文心一言
百度的转变并不是一个孤立事件。
受深度求索的开源 " 刺激 ",全球人工智能大模型竞争技术路线逐渐有开源压倒闭源之势。开源和闭源并没有绝对的优劣之分,只是当市场上出现颠覆者后,原先的主导者失去闭源的盈利护城河,不得不借 " 开源盛世 " 来扩张生态。
这场由深度求索引发的效率革命,标志着大模型竞争进入 " 后暴力计算时代 ":模型效率取代绝对性能,成为核心竞争力;同时,全球 AI 权力秩序被重构,美国 " 一家独大 " 霸权遭到削弱。
在后浪推前浪的趋势下,未来的胜出者将是平衡驾驭二者的 " 变色龙 ",既通过开源获取生态势能,也利用闭源实现价值捕获。
" 顺势而为 "
深度求索 " 以小博大 ",颠覆了人工智能大模型玩家的旧格局。
监测网站 Similarweb 数据显示,2025 年 1 月,深度求索网站的访问量环比增长 2257%,单月访问量达 2.78 亿次,虽然与 ChatGPT 高达 38 亿次的访问量还有不小差距,但依然超过了苹果 iCloud、Salesforce 等大公司网站。
OpenAI 最先乱了阵脚,不断开放新功能 " 挽尊 "。
1 月 31 日,放出推理模型 o3-mini。2 月 3 日,搜索网页提炼文献的深度研究(Deep Research)上线。2 月 5 日,带有网页搜索功能的 ChatGPT 面向所有用户开放。
ChatGPT 的深入研究
2 月 13 日,CEO 萨姆 · 奥特曼在社交媒体宣布下一代 AI 大模型路线图,GPT-5 大模型基础版将对 ChatGPT 免费用户无限量开放。ChatGPT 的付费订阅者中,Plus 版、Pro 版订阅者可以解锁更 " 聪明 " 的 GPT-5。模型功能将包含语音、Canvas(写作、编码工具)、搜索、深度研究等。
几乎同时,百度也打出 " 免费加开源 " 牌。先是 PC 端聊天应用 " 文心一言 " 和移动端应用 " 文小言 " 将于 4 月 1 日起全面免费,文心大模型 4.5 也将在 6 月 30 日开源。
环球同此凉热,巨头也担心 " 下课 "。
OpenAI 和百度齐齐从闭源转向开源,原因比较接近:二者都是人工智能模型领域的先行者和主导者,本来可以靠闭源和收费来赚钱。如今深度求索物特别美、价尤其廉、人民群众十分喜欢,他们再唱老调就真的赚不到钱了。
在美国,靠 ChatGPT 一举成名的 OpenAI,最早推出收费模式。2022 年 11 月 ChatGPT 免费上线,2023 年 2 月便推出 20 美元 / 月的 Plus 会员。2024 年 5 月 GPT-4o 面世,12 月推出 200 美元 / 月的 Pro 版本。
ChatGPT 至今有 4 个收费计划,Team、Enterprise 面向企业,Plus、Pro 面向个人。Plus 可以使用 OpenAI 全部模型,也可以创建 GPTs;Pro 用户在 Plus 的权益之外,还可以使用今年 1 月刚推出的智能体功能 Operator(操作员)。
ChatGPT 个人版本中的 Plus、Pro 收费计划
在中国,百度较早入局人工智能大模型领域。2021 年 7 月推出文心大模型 3.0,2023 年 3 月推出聊天机器人 " 文心一言 "。2023 年 6 月,文心大模型升级到 3.5 版本。10 月,文心大模型 4.0 版本发布。2024 年 6 月,4.0 Turbo 发布。
据百度称,2024 年文心大模型日均调用量超过 15 亿次,较 2023 年增长超 30 倍。
2023 年 11 月,百度文心一言推出付费会员模式,连续包月价格为 49.9 元 / 月,会员可以使用 2023 年 10 月发布的、目前仍是百度最新的模型文心一言 4.0,此外还有图片生成、网页插件等权益。
中国其他大模型公司也有收费模式。智谱 AI 的聊天机器人智谱清言,连续包月价格为 19 元 / 月,可解锁最新模型的无限次使用、视频生成等功能;月之暗面旗下的 Kimi 智能助手有打赏功能,但并未绑定使用权益。
总体来看,在人工智能大模型本身就存在开源路线、Meta 的开源大模型 Llama 实力雄厚的情况下,闭源模型并不存在高枕无忧的护城河。
开源的深度求索一问世," 头铁 " 的 OpenAI、百度就不得不 " 顺势而为 " 了。
开闭之争
开源和闭源的 " 源 ",指的是 " 源代码 "。开放源代码,允许其他开发者使用、传播,技术可以持续改进。" 开源 " 理念源自 20 世纪 90 年代开发者社区。
" 战争 " 是埃隆 · 马斯克挑起来的。2024 年 2 月,作为 OpenAI 的创始人和最早投资人之一,马斯克起诉 OpenAI 违背创始协议、追逐商业利益,将 AI 大模型闭源。OpenAI 反唇相讥,称马斯克早就认可其 " 追逐商业利益 "。
3 月,马斯克将旗下大模型 Grok-1 开源,以此证明自己 " 并非逐利 "。一个月后,Meta 发布 Llama3 系列模型,是当时最强大的开源大模型。原本闭源的谷歌也有点坐不住了,2024 年 2 月发布开源模型系列 Gemma。
Gemma 2 与 Llama 3、Grok-1 基准测试结果对比
美国的开源模型阵营,对闭源的生成式预训练模型 GPT 穷追不舍。业界普遍认为闭源模型的能力把开源模型甩开 " 一年半左右 "。
在中国,由于算力受到阻碍,开源还是闭源的讨论很少。2024 年,百度创始人、CEO 李彦宏多次表示," 模型开源的意义其实不是很大 "" 开源模型会越来越落后 "。
也有一些公司选择开源路线。
金沙江创投主管合伙人朱啸虎的言论 " 不会投资中国的基座大模型创业公司 " 曾激起热议,他认为开源大模型随时会颠覆闭源基座模型。阿里云先后开源多个模型;创业公司里,零一万物、百川智能、面壁智能都在打造开源模型。
中国各地方政府支持的实验室或研究所也聚焦开源大模型,包括科技部和北京市政府支持成立的智源研究院,深圳市政府主导的鹏城实验室,上海市政府主导的上海 AI 实验室,以及粤港澳大湾区数字经济研究院等。
虽然开源模型和闭源模型还有一定差距,但随着技术路线的清晰和开源技术的迭代,开源和闭源的差距将不断缩小、直至拉平。
但坚持 " 闭源更好 " 的百度,当时的判断是,开源并不便宜,且技术会越发落后," 开源模型没有商业模式 "。这一判断基于三个条件:一是算力和工程能力门槛高,只有科技大厂才有实力主导开源模型;研发成本高,传统开源软件的商业模式 " 没钱可烧 ";三是闭源模型通过程序接口(API)调用,可供企业部署软件。
上海 2023 世界人工智能大会上百度展示文心大模型(文心一格,文心一言)的核心科技 / 图源:视觉中国
深度求索 " 异军突起 ",恰恰证明这三个条件并不完全成立。
而且,百度期待的 " 企业级客户 " 也兴趣寥寥。因为数据是企业最宝贵的资源,一旦放在大厂平台上,日后是否真正属于自己就不好说了。移动互联网时代的 " 像素级复制 ",曾给中国创业者最沉重的打击。
论中国互联网三巨头 BAT,阿里是押注开源的典型代表。2022 年 11 月,阿里发布了中文 AI 大模型开源社区 " 魔搭 "(Model Scope)。通义千问模型也是开源的。2023 年 8 月以来,阿里云先后开源和更新了数十个参数版本的模型。
魔搭社区的部分模型库
腾讯的 " 混元大模型 " 去年选择开源,其公开说法是,经过一年多的探索,在闭源模式下将产品和技术积累到一定程度后,才选择了开源。
2025 年初,深度求索第一次令中国企业看到了开源模式的商业价值和影响力、看到了产业格局变化的可能性、看到了生态开放的冲击力——技术民主化的拐点已经到来。
" 最后 ",百度选择开源。
" 开源盛世 "?
互联网时代,一贯存在 " 巨头守成 " 加 " 新锐破局 " 的竞争。
由于 " 新锐 " 深度求索的颠覆性冲击,巨头 OpenAI 立刻作出 " 免费 " 反应,随即产生了传导效应—— GPT-4o 免费后,中国 AI 初创公司的 API 调用成本下降 30%,百度随之失去了收费壁垒。而 OpenAI 的闭源数据飞轮仍在加速,其日均新增训练数据量动辄是中国企业的 5 倍以上,技术代差可能进一步拉大。
对于 AI 企业而言,开源或闭源只是一种发展手段,不是什么 " 绝对理想 "。
要理解开源模型和闭源模型的核心差异,可以从基础条件、技术原理、应用场景、可营利性和局限性等五个维度来观察。
从基础条件看,开源模型以公开数据集、社区贡献数据为数据来源,以分布式的、开发者自有的 GPU 集群为算力支撑,开发主体是社区协作者,比如 GitHub 的开发者,需要处理开源协议兼容性,存在一些合规成本。
2023 年,GitHub 的开发者破亿
闭源模型以专有数据如用户行为日志、私有数据库、清洗后公开数据为数据来源,靠集中式的超算中心为算力支撑,开发主体是企业级团队,需要承担数据隐私、版权诉讼风险等合规成本,像纽约时报就因数据来源跟 OpenAI 打过官司。
光看成本,还是开源模型省钱。Meta 的 Llama2 训练成本约 250 万美元,OpenAI 的 GPT-4 依赖微软 Azure 算力,单次训练成本超 1 亿美元。
从技术原理看,开源模型的架构多为稠密 Transformer(注意力机制深度学习模型)变体,训练方法为公开强化学习框架,靠社区反馈迭代,靠外部审查保障安全,比如抱脸(Hugging Face)的模型扫描。
闭源模型的架构为融合私有架构,像 GPT-4 是稀疏化 MoE(混合专家模型),训练方法为定制化强化学习,靠用户交互数据实时反哺迭代,内置内容过滤机制。
闭源模型在稀疏激活(激活极少比例参数处理每个 Token)和多模态对齐(文本—图像—代码联合表征)领域,领先开源模型 1.5 — 2 年左右。
从应用场景看,开源模型可以为企业做私有化部署,模型剪裁后进行边缘计算,在手机端运行,可以为社区贡献数据。闭源模型可以为企业提供标准化 SaaS 服务,在云端进行计算和推理,依赖商业价值导向来处理长尾需求。
像彭博基于开源 Llama 做了一个金融领域模型,成本降低了 70%。Salesforce Einstein GPT 直接调用了 GPT-4 的 API,开发 CRM(客户关系管理)工具。
从收入差异看,开源模型靠技术服务——模型优化和部署赚钱,但定价受社区生态制约,边际成本会随着用户增长而摊薄(开发者贡献算力),护城河则来自生态规模,像 " 抱脸 " 积累了 15 万个模型。
闭源模型靠订阅费用赚钱,垄断定价权,边际成本则随用户线性增长而上升(云计算资源被消耗),护城河来自技术代差。
开源模型一般 5 — 7 年才能盈利,靠开发出售 Linux 套件的 Red Hat 就是例子。闭源模型 3 年内就能实现正向现金流,OpenAI 在 2023 年营收超 16 亿美元。
OpenAI 2024 年的估值和预计收入数据
从局限性看,开源模型的迭代比较慢,有合规风险和安全漏洞,一旦开发者流失就失去了可持续性。闭源模型由于存在技术黑箱,无法修改底层模型,很难针对性优化,数据隐私问题和单点故障也很难解决,还面临高资本的开支压力。
开源模型最大的限制就是生态碎片化。闭源模型则无力克服技术锁死效应。
实际上,开源与闭源并非对立,二者可能构成 AI 进化的双螺旋结构:开源加速技术民主化,闭源推动商业可持续性。
未来的胜出者将是平衡驾驭二者的 " 变色龙 ",既通过开源获取生态势能,也利用闭源实现价值捕获。
还没有评论,来说两句吧...