OpenAI经审计财务文件被披露后,大模型公司的商业化压力被摆到了台前:2025年营收达到130.7亿美元,但净亏损约385亿美元,折合人民币约2601亿元。这个数字之所以刺眼,不只是因为亏损规模足够大,而是它让外界重新看见前沿模型背后的真实成本结构:训练、推理、数据、人才、算力合同、企业交付和安全合规,任何一项都不是轻资产生意。

同一组最新资讯里,Cursor宣布准备推出超1.5万亿参数的新模型,预训练阶段使用10万块以上GPU;智谱发布开源GLM-5.2,主打753B参数、1M稳定上下文和长程任务能力;逆矩阵完成超亿美元融资,继续押注通用世界基座模型;硅基流动此前刷新中国AI基础设施融资纪录。几条线索放在一起看,AI行业并没有因为亏损而降速,反而进入了一个更残酷的阶段:能力继续向上,成本必须被解释清楚,商业闭环也必须更快跑出来。
亏损暴露成本真相
OpenAI的财务数据让很多人第一次直观感受到,前沿模型不是简单的软件订阅业务。传统互联网产品一旦完成研发,新增用户的边际成本可能很低;但大模型不同,用户每一次高强度对话、代码生成、长上下文分析、多模态推理,都要消耗真实算力。模型越强、上下文越长、调用越频繁,推理成本越难被忽略。
130.7亿美元营收说明需求确实存在,385亿美元净亏损则说明需求还没有完全覆盖扩张成本。这里面既包括前沿训练的巨额投入,也包括面向企业和开发者的服务成本。更关键的是,头部公司不能轻易停止投入,因为一旦模型能力落后,开发者生态、企业客户和资本预期都会受到影响。于是大模型公司陷入一种典型张力:必须继续烧钱证明未来,同时又必须尽快证明这笔钱不是无底洞。
这也解释了为什么价格、限额、订阅分层和企业合同会成为行业焦点。模型公司既要让普通用户感到可负担,又要避免高频用户把推理成本打穿;既要吸引开发者接入,又要给企业客户稳定 SLA;既要用旗舰模型维持品牌,又要用小模型、路由系统和缓存机制压低成本。财务压力不会让模型竞争消失,但会迫使竞争从“谁更强”变成“谁能把强能力交付得更经济”。
算力军备仍在加码
Cursor准备推出超1.5万亿参数新模型,并宣称使用10万块以上GPU预训练,说明AI编程赛道仍然相信大规模训练会带来关键增益。代码任务看似垂直,实际牵涉长上下文理解、项目级记忆、多文件修改、测试修复、工具调用和工程规范判断。要让编程助手从“补全代码”走向“承担复杂工程任务”,模型本身仍需要更强的推理和执行能力。
这类投入也意味着AI编程工具正在从应用层向模型层回撤。过去很多应用公司依赖外部模型,通过产品体验、插件生态和工作流设计形成差异;但当编程入口的价值越来越高,头部玩家就会希望把底层能力掌握在自己手里。自研模型不一定马上替代所有外部模型,却能在核心场景里做更深优化,比如更懂代码库结构、更懂IDE操作、更懂企业工程流程。
问题在于,10万块GPU不是一个轻松的商业选择。它对应的是巨额资本开支、训练调度能力、数据工程能力和长期推理成本。Cursor的新模型如果要在实际产品中释放价值,就不能只是跑分好看,而要让开发者明显感到更少返工、更少幻觉、更强项目级稳定性。否则,算力军备会变成财务报表上的压力,而不是产品体验里的护城河。
开源模型抬高底线
智谱GLM-5.2的发布给行业带来另一种压力:开源模型正在把基础能力底线继续抬高。753B参数、MIT协议、1M稳定上下文窗口,再加上长程任务能力的强调,意味着企业和开发者有了更多不完全依赖闭源旗舰模型的选择。对很多场景来说,只要开源模型足够强、部署和微调路径足够清晰,就能在成本、数据控制和定制化方面形成吸引力。
开源模型的价值不只在“免费使用”。它更像一种行业参照系:闭源模型想收更高价格,就必须证明自己在复杂推理、工具调用、可靠性、多模态、速度或服务稳定性上确实领先;应用公司想构建垂直产品,也可以基于开源底座做深度适配,而不是把所有命运押在单一API上。GLM-5.2把长上下文和开源许可同时推到前台,会让企业重新计算模型选型。
这对闭源巨头并不是单纯坏消息。开源生态抬高底线后,行业会更快进入分层:通用任务使用性价比模型,复杂任务调用旗舰模型,敏感数据走本地或私有化部署,高频推理交给更便宜的小模型。真正的竞争不再是单个模型包打天下,而是模型组合、路由策略、工程集成和成本控制能力的竞争。
融资流向基础设施
逆矩阵完成超亿美元融资,硅基流动完成大额融资,说明资本仍然愿意押注AI基础能力和基础设施。不同的是,资金不再只追逐“聊天机器人外壳”,而是更多流向世界模型、Token服务、推理平台、数据处理和企业级交付系统。越到产业深水区,越能看出底层设施的重要性。
世界模型的想象空间在于让AI理解真实环境、物理规律和复杂行动后果,这对机器人、自动驾驶、工业仿真、游戏和空间智能都有意义。Token基础设施则解决另一个更现实的问题:如何以更低延迟、更高稳定性、更可控价格向海量应用供给模型能力。一个偏长期能力突破,一个偏现实商业运转,但它们共同指向AI产业的底座化。
OpenAI亏损数据与这些融资消息并不矛盾。恰恰相反,它们说明市场已经意识到:如果大模型是一种新基础设施,那么基础设施建设期必然昂贵;但只有那些能把成本摊薄、把能力标准化、把服务规模化的公司,才有机会穿过高投入阶段。资本继续进入,不代表风险消失,而是赌未来的调用量、企业流程迁移和智能体生态足以支撑更大的收入盘子。
应用必须证明回报
大模型公司的成本压力最终会传导到应用层。无论是小米上线云端办公Agent Xiaomi MiMo Claw、Kimi K2.7 Code高速版服务开发者,还是广东政务智能中枢“湾擎”试运行,应用都需要回答同一个问题:AI到底为用户省下了什么,创造了什么,替代了什么成本?只有这个答案足够清楚,用户才会长期付费,组织才会把AI纳入正式流程。
办公Agent的优势在于靠近文档、表格、流程和协作;代码Agent的优势在于直接影响研发效率;政务智能中枢的价值则在于把知识检索、材料生成、流程辅助和跨部门协同集中起来。它们不像单纯聊天产品那样依赖新鲜感,而是更适合用节省时间、减少重复劳动、降低错误率来衡量效果。对于模型公司而言,这类应用场景也是消化推理成本、形成稳定收入的重要出口。
但应用落地越深,责任也越重。AI写错一段闲聊内容,用户可能一笑而过;AI改错代码、误读政务材料、生成错误商务文件,就会带来真实损失。因此,未来应用竞争会越来越强调可审计、可回滚、可解释和权限控制。谁能把模型能力包装成可靠流程,谁就更容易把“试用热情”变成“持续预算”。
行业进入账本阶段
前沿模型、开源模型、AI编程、世界模型、办公Agent和政务中枢看似分散,其实都被同一本账本连接起来:算力投入能否换来足够强的能力,能力能否进入足够多的真实场景,真实场景能否产生可持续收入。OpenAI的巨额亏损让这本账变得刺眼,但它并不等于AI泡沫已经破裂,更像是提醒行业从叙事阶段进入经营阶段。
接下来,模型公司需要证明自己能降低单位推理成本,应用公司需要证明自己能提升用户效率,基础设施公司需要证明自己能支撑更大规模调用,开源社区则会持续压低基础能力门槛。大模型竞争仍会有发布会、参数、榜单和融资,但真正决定长期格局的,可能是更朴素的指标:一次任务多少钱,成功率多高,能否稳定交付,用户愿不愿意继续付费。
所以,OpenAI财务泄密最重要的意义,不是制造一个“亏了多少”的谈资,而是让行业重新面对AI商业化的底层逻辑。模型越强,越需要产业链一起把成本消化掉;应用越多,越需要可靠性和责任边界跟上。AI仍在向前冲,但从现在开始,所有人都得更认真地看账本。











