色哥大模子「六小虎」里，至少两家要放手大模子了

发布日期：2024-10-13 16:13 点击次数：66

文｜周鑫雨色哥剪辑｜苏建勋 2024 年，不少曾立下"作念中国 OpenAI "军令状的模子公司，开动打脸。据《智能涌现》了解，被称为" AI 六小虎"的 6 家中国大模子独角兽（智谱、零一万物、MiniMax、百川智能、月之暗面、阶跃星辰）中，仍是有两家缓缓放手预历练模子，缩减了预历练算法团队东说念主数，业务要点转向 AI 诳骗。（本文但愿重点参议国内 AI 公司对"预历练"大模子的道路聘任，过甚背后的想考与后续侧重点，为了不引起无谓要的纷争，遂隐去放手预历练模子的企业称呼。）赶大模...

文｜周鑫雨色哥

剪辑｜苏建勋

2024 年，不少曾立下"作念中国 OpenAI "军令状的模子公司，开动打脸。

据《智能涌现》了解，被称为" AI 六小虎"的 6 家中国大模子独角兽（智谱、零一万物、MiniMax、百川智能、月之暗面、阶跃星辰）中，仍是有两家缓缓放手预历练模子，缩减了预历练算法团队东说念主数，业务要点转向 AI 诳骗。

（本文但愿重点参议国内 AI 公司对"预历练"大模子的道路聘任，过甚背后的想考与后续侧重点，为了不引起无谓要的纷争，遂隐去放手预历练模子的企业称呼。）

赶大模子早集的百度，9 月也一度传出"能够率放手通用基础大模子研发，主要作念诳骗"的音问。即便后续被百度辟谣，但"放手预历练模子"，仍是成了行业的一个蜕变点。

不错说，能让厂商上大模子牌桌的，便是"预历练"。所谓的"预历练（pre-train）"，就好比大模子的基础老师阶段，赋予模子海量而通用的学问，是决定模子性能最要道的阶段，亦然模子厂商最中枢的本事壁垒。

关于 AI 行业而言，跟着第三方预历练模子的性能提高，诳骗层企业缓缓放手预历练模子，专注于让模子更懂用户的"后历练（post-train）"尺度，是从简算力资本考量下的平常趋势。

2024 年 8 月，硅谷的明星 AI 企业、变装演出类诳骗的典范 Character.AI，晓喻放手预历练，转向与第三方模子协调。他们在官方博客中给出的事理是：这使咱们能够插足更多资源进行后历练，并为不休增长的用户群体创造新的居品体验。

关联词，模子层企业放手预历练模子，意味着主动走下 AGI 竞速的牌桌。

更并且，"自研预历练模子"的故事，曾在短短一年间，给这些模子层企业带来丰厚的融资、顶级的东说念主才，以及市集的声誉。模子公司放手预历练，刺破了 AI 本事的泡沫。

就如一位 AI 从业者对《智能涌现》所评价的那样：

"不少厂商从 OpenAI 身上获取的不是通往 AGI 的本事，而是盲目奴婢的自信。"

但关于 AI 赛说念而言，放手预历练，也不算全然无望的信号。在资金、算力紧缺确当下，现存的大模子厂商，也开动对自身的才协调资源近况，进行了再行评估。

从模子转向诳骗，意味着在追逐 AGI 之前，AI 公司先聘任了活下去。

钱不够烧了，模子和居品二保一

狂堆参数的 Scaling Law，当前是预历练的主流旅途，同期也意味着腾贵且捏续的算力和数据插足。

马斯克曾估算，GPT-5 的历练可能需要 3 万 -5 万张 H100，仅芯片资本就卓越 7 亿好意思元（约 50 亿元），险些是百度一通盘这个词季度的净利润。

关于尚未盈利的创业公司而言，络续堆参数真金不怕火模子，筹钱开端便是一个难关。

据《智能涌现》了解，跟着估值跨上 200 亿元台阶，国内大模子公司最新的单轮次融资限制在 50 亿元独揽。估值的举高，也会伴跟着融资难度的加重。

别称投资东说念主告诉《智能涌现》，本年终末一季度，大模子独角兽不会再积极布局融资，"不管是企业照旧一级市集，对下一轮融资皆保捏悲不雅"。

数十亿元的融资，模子厂商不仅要分担给捏续堆参数的模子历练，还要喂给不休烧钱营销、却盈利才调有限的 AI 诳骗居品。

当下，与 OpenAI 的本事差距仍然难以弥合，国产模子之间的性能，也尚未拉开显明的差距。不少国内模子厂商开动借助"数据 + 场景"的长板，在 AI 诳骗上发力，试图率先跑出 AI 时期的"微信"和"抖音"——就连 ToB 基因显赫的智谱 AI 和百川智能，也先后推出了"智谱清言"和"百小应"等 C 端诳骗。

限制化的 AI 诳骗，缓缓代替了最初的模子性能，成为模子厂商留在 AI 牌桌上的筹码。因此，用户数据，成了模子厂商不得不有趣的贪图。

《智能涌现》曾报说念，月之暗面在 B 站给出的 CPA（用户蜕变东说念主均资本）报价高达 30 元独揽。而另有知情东说念主士告诉《智能涌现》，如今模子厂商最高的报价，来自于字节逾越的"豆包"，"险些是 Kimi 报价的 2 倍"。

2024 年以来投流刷脸的营销嘱咐，让不少模子厂商的营销预算翻了数倍。营销价钱情随事迁，但在 AI 居品互异化历程还不够确当下，砸钱买流量险些是获客的唯独长进。

一家大模子独角兽的职工告诉《智能涌现》，公司曾在 2024 年中，中止了 AI 对话居品在部分酬酢媒体的投放，"当月获客数据立马变得很出丑"。一个月后，公司又复原了投流。

并不是通盘的大模子公司，皆能从暂无穷头的烧钱中看到但愿。

如今，AI 居品所耗尽的推理资本，较一年前仍是下落了近 99%。但不少业内东说念主士反应，模子的历练依然占算力资本的至少 7 成。

这意味着，放手预历练模子，是资源紧缺确当下，最具性价比的决定。

放手预历练模子的其中一家独角兽，据多名知情东说念主士露出，自 2024 年中，整家公司的成见要点仍是放在了国外的 AI 诳骗居品，以及上市。

大模子公司，困在变现纷扰

为什么在模子和居品中聘任松手前者保证后者？中枢原因照旧在于，当前靠大模子自己，莫得澄清的变现渠说念。

多名从业者对《智能涌现》反应，2024 年开启的模子降价潮，并莫得提高模子的营收才调。

"模子 API 的降价，本色上是为了让客户体验模子才调，并蜕变资土产货部署等高净利业务的付费。"别称模子厂商大客户司理对《智能涌现》默示，"但说明莫得达到预期，本年上半年大部分模子厂商的 ToB 业务，营收是砍半的。"

他难忘，在一款模子晓喻免费后，后台涌入了不少"白嫖"的设备者，"有一个作念计议的设备者，一天用的 Token 数，就占了通盘效户的 60%。"

模子付费蜕变的失败，很猛历程是因为，被称为"价钱屠户"的开源模子更强了。

跟着 Llama 3.1、Mistral Large 2、DeepSeek V 2.5 等一系列开源模子，性能仍是达到了叫板 GPT-4，以致 GPT-4o 的历程。

相对地，闭源模子的竞争力正在被缩小。"付费才调高的企业，一般有我方的本事团队，不错基于开源模子顺利作念设备。"上述大客户司理默示，关于本事才调不及的企业而言，"开源模子影响的是客户对模子价钱的激情预期。"

一个典型案例是，2023 年 Llama 2 发布后，某大模子独角兽接到的客户报价，顺利砍了一个" 0 "。

模子变现才调不及，意味着当下模子厂商的现款流，险些只可依靠融资，以及能够快速找到 PMF（居品 - 市集匹配度）的 AI 诳骗。

但如今，能为模子厂商眩惑到融资的，除了漂亮的用户数据，只剩下跃升的模子性能。

别称投资东说念主告诉《智能涌现》，模子厂商谁能先把 o1（OpenAI 最新模子）的才调追平，一级市集照旧会为其小沸一番。

但 2024 年，不少大模子厂商，仍是卡在了本事的瓶颈。

中国肛交

GPT-4 后，大模子本事的发展仍是进入了深水区。9 月，前 OpenAI 首席科学家 Ilya Sutskever ——他曾将 Scaling Law 班师使用在 ChatGPT 等要道模子上——在晓喻树立新公司 SSI 时直言："每个东说念主皆只说 Scaling 假定。但每个东说念主皆忽略了一个问题：咱们到底在 Scaling 什么？"

大言语模子的迭代速率变慢、多模态仍处于攻坚早期，是模子赛说念的近况。" GPT-4 之前，OpenAI 有公开的驻扎本事证明，全球还能对着‘抄’。之后本事证明不公开了，国内厂商的参考谜底也没了。"别称从业者默示，"更并且，OpenAI 的谜底也不一定正确。"

一群失去标的的大模子公司，需要在本事的不笃定性中，再行找到踏实性。

放手预历练的模子厂商，收拢的是尚有盈利后劲的 AI 诳骗。多名知情者皆对《智能涌现》默示，其中一家厂商的某款国外 AI 出产力器具居品，孝顺 2024 年以来的大部分营收，"公司当今 70% 的东说念主力皆在作念居品"——而这款出海诳骗的底层模子，也缓缓从自研的，换成了 GPT-4 和 GPT-4o。

而另一家在国内靠 ToB 起家的模子公司，也在 2024 年中推出了出产力和文娱相的 C 端 AI 诳骗。

剩下仍在坚捏预历练的厂商，则开动在本事上降本增效。

一家模子独角兽的职工告诉《智能涌现》，本年公司在算力采购上很克制，权术先采选优化历练框架等面孔，缩小模子的历练资本。

再比如，OpenAI 最新模子 o1 所接纳的 Self-play（自博弈）政策，能够在不加多参数的情况下进步模子性能，也成了不少模子厂商低资本历练模子的稻草。

关于通盘这个词 AI 行业而言，放手预历练模子，并不是一个无望的信号。拾象科技 CEO 李广密近期也公开对外在示，将来 80% 的公司会放手预历练，硅谷缓缓酿成的共鸣是 RL（强化学习）是接下来的肆虐点，能在抑止算力资本的情况下，进步特定参数模子的才调。

这意味着从本事狂热重回感性后，厂商对本事范式和行业资源，开动再行想考和整合。