基模到顶，应用起飞

发表于 2026-04-07 分类于 NLP 评论：阅读次数：

Cursor 的母公司 Anysphere 大概 150 人，2025 年 11 月年收入突破 10 亿美元。OpenAI 到 2026 年初有 4500 名员工，2025 年收入 131 亿美元，但据 Fortune 报道，亏损约 90 亿美元，而且预计一直亏到 2028 年。

一个不训练任何模型的应用公司，人均产出碾压了训练模型的公司。这组数字是 2025 年 AI 行业最值得琢磨的信号。

模型越来越难做好了

GPT-5 的故事要从它之前的失败讲起。据 The Information 报道（Inside OpenAI's Rocky Path to GPT-5），2024 年下半年 OpenAI 内部一直在做一个叫 Orion 的项目，原定就是 GPT-5。但 Orion 没能产出一个更好的模型，最后被降级为 GPT-4.5，2025 年 2 月发布。

真正的 GPT-5 直到 2025 年 8 月才上线。MIT Technology Review 当天的评价很直接："GPT-5 is, above all else, a refined product...it falls far short of the transformative AI future that Altman has spent much of the past year hyping." 用户端的反馈更尴尬，大量人在 Reddit 上说 GPT-4o 体感更好。发布当天自动模型切换就崩了，Altman 第二天不得不出来解释"GPT-5 will seem smarter starting today"。

回想 GPT-3.5 到 GPT-4 的跃迁，那种"这东西突然能用了"的冲击感。再看 GPT-4 到 GPT-5，几乎所有评测者的结论都是"更好了，但没那么大的差距"。The Atlantic 的评价最诚实："At this stage of the AI boom, when every major chatbot is legitimately helpful in numerous ways, benchmarks, science, and rigor feel almost insignificant. What matters is how the chatbot feels."

跑分还在涨，但用户的体感增量在缩小。堆数据、堆算力、堆参数换模型能力的路子没有失效，只是越往上走越费劲，边际收益肉眼可见地被压平了。

做模型的公司自己在用脚投票

如果只看外界的评价还不够说服力，看看做模型的公司自己在做什么。

OpenAI 的产品线在过去一年膨胀得很快：Codex（代码助手）、ChatGPT Agent（帮你操作电脑完成任务的智能体）、Atlas（AI 浏览器）、Health（健康咨询）、Shopping（购物推荐）。更关键的是组织架构的变化：他们请了前 Instacart CEO Fidji Simo 来担任应用线的 CEO。一家以模型研究起家的公司，给应用线单独设了一个 CEO。

Anthropic 这边同样明显。2025 年 5 月 Claude Code 正式发布，集成了 VS Code 和 JetBrains。12 月收购了 Bun（一个 JavaScript 运行时）来加速 Claude Code 的性能。2026 年 1 月成立 Labs 部门，由 Instagram 联合创始人 Mike Krieger 领衔。产品线里多了 Cowork（协作工具）。甚至在 2026 年超级碗上投了广告，嘲讽 OpenAI 在 ChatGPT 里加广告。

这些动作拼在一起看，不是"顺便做个应用"。这是战略重心的转移。当一家模型公司给应用线配 CEO，当另一家模型公司去超级碗打消费品牌广告，它们在告诉市场一件事：光卖模型不够了。

应用层的效率碾压

回到 Cursor 的故事。Anysphere 2022 年成立，2023 年拿到 OpenAI 领投的 800 万美元种子轮。然后是一条几乎垂直的增长曲线：2025 年 1 月年收入突破 1 亿美元，6 月突破 5 亿，11 月突破 10 亿。10 个月 10 倍。估值从 2024 年 11 月的 25 亿美元涨到 2025 年 11 月的 293 亿美元。它不训练模型，它调用 Anthropic、OpenAI 这些公司的接口。

Perplexity 是另一个案例。据 Sacra 2026 年 2 月的分析，年收入约 2 亿美元，估值约 200 亿美元。它的搜索引擎 Sonar 基于 Meta 开源的 Llama 模型。2025 年 8 月它甚至出价 345 亿美元试图收购 Chrome。一个用开源模型做搜索的公司，出价收购全球最大的浏览器。

对比一下做模型的公司的处境。OpenAI 收入 131 亿但亏 90 亿。Anthropic 估值 3800 亿美元，2500 名员工，但盈利状况没有公开。做模型本质上是重资产生意：训练一个顶级模型要烧掉几十亿美元的算力，然后通过 API 调用慢慢收回来。应用层不一样，Cursor 150 人就能做到 10 亿美元年收入，因为模型是别人训的，它只需要把模型用好。

DeepSeek 击穿了模型的定价权

如果说 GPT-5 的故事是模型在顶端越来越难做好，DeepSeek 的故事就是模型成本在底部被击穿。

DeepSeek 160 人，训练 V3 模型花了约 600 万美元。作为对比，GPT-4 的训练成本据报道约 1 亿美元。DeepSeek-R1 在多个测试中接近 GPT-4 和 o1 的水平，而且用的是受出口管制限制的较弱显卡。

消息出来那天，英伟达市值蒸发了 6000 亿美元，美股史上最大单日跌幅。这个反应本身就很说明问题：市场对模型定价权的信心，在一天之内被动摇了。

DeepSeek 的意义不只是"中国 AI 崛起了"。它证明了一件更根本的事情：顶级模型能力正在变成大宗商品。当一个 160 人的团队用十分之一的成本和十分之一的算力就能逼近最前沿的水平，"我有最好的模型"就不再是一条护城河。更何况 DeepSeek-R1 还是完全开源的，任何人都可以拿来用。

模型变成了基础设施

这些故事拼在一起，指向同一个结论：模型正在变成基础设施。

不是说模型不重要了，就像没人说电力不重要。但电力公司的利润率和估值倍数，跟用电的消费品牌不在一个量级。当模型能力足够好、成本足够低、供应商足够多的时候，价值创造的重心自然向上移动。

Cursor 不关心底层模型是 Claude 还是 GPT，它关心的是怎么把代码补全做到让程序员离不开。Perplexity 不关心用的是 Llama 还是自研模型，它关心的是搜索体验能不能干掉 Google。这就是基础设施化之后的逻辑：下游对上游的忠诚度很低，谁便宜好用就用谁。

三个可以回头验证的预测

写到这里是 2026 年 4 月。以下是对接下来一两年的三层预测，明后年回来对照。

人才结构的变化，一年内可以验证。 AI 行业最抢手的人才正在从研究员变成产品经理和应用工程师。Fidji Simo 管 OpenAI 应用线，Mike Krieger 从 Anthropic 首席产品官转去领导新成立的 Labs 部门。2027 年，顶级 AI 公司高管层里产品背景会压过研究背景。训练模型的能力变成了采购项，产品感觉变成了核心竞争力。

做模型的公司会被迫做应用，两到三年内验证。 纯做模型的商业模式撑不住。OpenAI 已经在走这条路，从聊天机器人扩展到智能体、搜索、Health、Shopping，Anthropic 也是。最终形态更像苹果（芯片、系统、应用全做）而不是 Intel（只卖芯片给别人）。纯卖接口的模型公司会越来越难，因为 DeepSeek 们会持续压低价格，开源模型会持续缩小差距。

智能体操作系统颠覆应用层入口，三到五年推演。 今天的独立 AI 应用也是过渡形态，但不是被既有产品吸收，而是被智能体操作系统颠覆。OpenClaw 4 个月 35 万 Star 揭示的趋势是：用户不需要打开一堆 AI 应用，需要的是一个统一的 AI 层接管所有交互入口。Cursor 的终极威胁不是另一个 AI 编辑器，而是智能体直接帮你写代码，你连编辑器都不用打开。Perplexity 的终极威胁不是 Google 变聪明了，而是"搜索"这个动作本身消失了，智能体在你提问之前就已经把信息准备好了。终局是应用作为入口被瓦解，AI 智能体成为新的操作系统层。

三年铺完了光纤

从模型到应用到智能体操作系统，本质上是同一个故事的三个章节：技术从"谁能造出来"到"谁能用得好"再到"用户连用都不需要自己用"。每一次权力转移都伴随着上一层玩家的不甘心和下一层玩家令人吃惊的效率。

这一次的速度完全不一样了。以前每个时代的基础设施需要十年才能成熟，应用再花十年爆发。现在所有人都在用 AI 写 AI，用智能体构建智能体，用 Claude Code 开发下一代 Claude Code 的插件。整个行业进入了自举式的迭代循环，每一层的产出直接加速下一层的开发。从铺光纤到应用爆发用了三年，从应用爆发到智能体操作系统可能只需要一年。指数曲线的可怕之处不在于它有多快，在于当你觉得"现在已经够快了"的时候，它还在加速。