Scaling Law被重审后，AI竞争开始重算数据、算力和系统效率-速维云

OpenAI早期Scaling Law论文被前研究员点出实验设定缺陷后，模型行业最熟悉的一条增长曲线突然变得不那么稳了。争议的焦点不只是某篇论文是否严谨，而是过去几年许多团队围绕“继续堆参数、继续堆算力”建立的研发直觉，可能需要重新校准：同样的钱、同样的GPU、同样的训练窗口，到底应该投给更大的模型、更干净的数据，还是更高效的推理系统？

Scaling Law争议后，模型竞争正从单纯堆参数转向数据质量、芯片效率和推理系统的综合账本。

这件事之所以重要，是因为它正好撞上AI基础设施成本快速膨胀的现实。模型厂商需要向投资人解释训练预算，云厂商需要向客户解释算力价格，企业用户也在追问为什么AI项目上线后并没有立刻带来预期回报。当一条被广泛引用的经验曲线受到质疑，行业就必须重新回答一个更朴素的问题：AI能力增长究竟靠什么，钱又应该花在哪里？

增长曲线被重新审视

Diogo Almeida指出的关键问题，在于原始Scaling Law实验中固定token预算与余弦学习率衰减的组合，可能让结论偏向“参数优先”。如果实验设计让大模型在训练过程中更容易呈现优势，行业就会自然形成一种路径依赖：只要模型不够强，就继续扩大参数；只要效果还能涨，就继续加卡、加电、加预算。

但大模型训练不是只看最终分数的竞赛。企业真正要承担的是算力采购、数据治理、推理部署、响应延迟和单位调用成本。若“参数越大越划算”的判断被高估，过去许多训练计划就可能存在资源错配。更现实的启发是，模型公司需要把数据规模、数据质量、语言覆盖、训练策略和推理效率放到同一张账本里看，而不是只把参数规模当作产品信心的来源。

这也解释了为什么近期行业讨论里，“训练一个更大模型”不再自动等于“做出更强产品”。模型能力要穿过评测、API、工具调用、企业权限和真实业务流程，最后才会变成用户能感知的价值。任何一个环节的浪费，都会在成本端被放大。Scaling Law争议真正刺中的，是AI公司过去过于依赖单一路径叙事的软肋。

数据与语言的权重上升

这次争议里另一个容易被忽略的信息，是Scaling Law长期以英语数据为主要经验来源。相关研究提到，法语模型效率可能比英语高出50至100倍，这并不意味着某一种语言天然更适合AI，而是提醒行业：不同语言、不同语料结构、不同知识密度，会显著影响训练回报。

这对中文模型和企业私有模型尤其重要。很多企业并不缺参数野心，真正缺的是高质量业务语料、稳定的数据清洗流程，以及能把内部知识转化为可执行规则的建模能力。Agent Ontology这类业务本体论方法受到关注，也正是因为它试图把企业对象、关系、动作和规则先定义清楚，再交给智能体执行。对企业AI来说，模型能力只是底座，业务地图才决定AI能不能按真实流程办事。

换句话说，数据不是训练前随手准备的原材料，而是决定模型边界的核心资产。高质量数据能让较小模型具备更强的场景能力，低质量数据则会让大模型在关键任务上反复出错。对于金融、医疗、制造、政务等行业，内部术语、审批逻辑、异常处理和责任边界往往比公开互联网知识更关键。谁能把这些数据整理成可训练、可检索、可执行的结构，谁就更接近真正可用的企业AI。

算力竞争转向系统效率

同样值得关注的是英伟达GB300 NVL72在AA-AgentPerf基准上的表现：每兆瓦可支持约6.14万个并发智能体，是H200的20倍左右。这个数字的意义不在于又多了一个漂亮跑分，而在于AI基础设施的评价口径正在变化。过去行业常谈训练卡数量、峰值算力和模型参数，现在更需要看单位电力能承载多少真实智能体任务。

智能体应用与传统聊天机器人不同，它要持续调用模型、工具、代码环境和外部系统。如果每个智能体都像一个小团队成员，企业部署就会迅速碰到并发、功耗、散热和成本上限。GB300的指标把问题说得更直白：未来的AI云并不是谁买卡更多谁就赢，而是谁能在电力、网络、内存、调度和模型路由之间做出更高的系统效率。

这会改变云服务和模型服务的销售语言。客户不只会问“你有多少张GPU”，还会问“同样一兆瓦能跑多少任务”“一个智能体完成一次工单要消耗多少token”“高峰期排队多久”“失败重试成本谁承担”。当AI进入企业预算表，性能指标必须和电费、机柜、网络、运维、SLA一起算。算力仍然稀缺，但稀缺资源的用法正在变得更精细。

人才流动释放新信号

清华特奖获得者顾煜贤加入DeepSeek，也给这条主线补上了人才侧注脚。他的研究方向包括预训练数据筛选、知识蒸馏和高效模型架构，恰好对应当前模型竞争的关键转向：不只是做更大的模型，而是用更好的数据、更轻的结构和更聪明的蒸馏方法，把同等资源压出更高能力。

这类人才流向说明，前沿模型团队正在从“单点突破”走向“系统工程”。数据筛选决定训练材料的上限，蒸馏决定能力能否低成本下放，高效架构决定推理能不能规模化。模型公司争夺的不只是明星研究员，而是能把论文、工程和产品成本连接起来的人。谁能把这些环节打通，谁就更可能在下一阶段摆脱单纯烧钱的叙事。

DeepSeek过去给行业留下的印象，本来就与效率、工程化和成本控制相关。新人才加入后，外界关注的也不会只是下一代模型参数有多大，而是它能否在训练数据、推理速度、开源生态、中文能力和商业部署之间继续做出平衡。对中国AI团队来说，这种路线更符合现实约束：算力并非无限，预算需要回报，模型能力最终要落到开发者和企业客户手里。

企业AI更看重可执行性

Agent Ontology的走红，反映出企业客户对AI的期待已经从“能回答问题”变成“能按规则做事”。Palantir、Databricks、Skan AI等方案都强调业务对象和流程建模，本质上是在告诉智能体：哪些数据可以用、哪些动作可以执行、哪些边界不能跨越、哪些结果需要人类确认。

这也是RAG之后的一个自然补充。RAG让AI能检索企业知识，但检索到信息不等于能完成业务动作。比如销售线索跟进、工单分派、财务审批、供应链异常处理，都需要清楚的角色权限、状态流转和例外规则。企业AI真正的价值，不是把一段制度文件复述得更漂亮，而是把制度变成可运行的工作流。

如果没有业务本体，智能体很容易在真实场景里显得“聪明但不可靠”：它能给出建议，却不知道谁有审批权；它能生成方案，却不知道库存、合同和合规条件；它能调用工具，却无法判断结果是否需要升级给人类。企业AI要走向规模化，必须把模型放进组织结构里，而不是把组织流程压缩成一段提示词。

应用层开始追求闭环

Claude Science连接远程服务器完成RNA-seq定量实验、MVLAND把多模型视频创作放进创意画布、上海AI Lab让智能体通过COM代码操纵CAD软件，这些案例看似分散，其实都指向同一个变化：AI应用正在离开单次生成，进入真实工具链。

在科研场景里，AI要能探测环境、安装依赖、提交任务、检查结果；在创作场景里，AI要管理素材、版本、剪辑和模型调用；在工业设计里，AI要理解软件对象和工程约束。对用户来说，单次生成一段文字或图片已经不稀缺，稀缺的是从意图到结果的闭环交付。模型越强，应用层越会把竞争重点放在流程、权限、审计和稳定性上。

这也是为什么许多AI产品开始强调“工作台”“画布”“Agent平台”，而不是单纯强调聊天窗口。用户需要的不只是一个会说话的模型，而是一个能接入文件、数据、工具、服务器和团队协作环境的执行系统。未来AI产品的差异化，可能不在于回答是否更像人，而在于它能不能把复杂任务拆开、执行、校验并留下可追溯记录。

下一阶段拼的是账本

把这些新闻放在一起看，AI竞争正在从“能力信仰”进入“账本阶段”。Scaling Law争议要求行业重新计算训练回报，GB300的每兆瓦智能体指标要求云厂商重新计算推理效率，DeepSeek的人才引进指向数据和架构优化，Agent Ontology则要求企业把业务流程先结构化。

这并不意味着大模型扩张会停止。相反，真正有价值的扩张会更精细：训练侧关注数据和算法效率，推理侧关注单位功耗和并发能力，应用侧关注业务闭环和可审计结果。下一轮赢家未必是喊出最大参数的公司，而是能证明每一块GPU、每一份数据、每一次模型调用都产生实际价值的团队。

对普通企业和开发者来说，这也是一个选择AI服务的新标准。与其只看模型榜单，不如同时看成本、延迟、上下文管理、工具生态、数据合规和失败处理。AI行业越成熟，越不会只靠一次炫技发布会决定胜负。真正能长期留下来的，是那些把技术能力、基础设施效率和业务结果稳定连接起来的产品。

文章版权归作者所有，未经允许请勿转载。

THE END

AI
# AI模型 # 大模型 # AI算力

Scaling Law被重审后，AI竞争开始重算数据、算力和系统效率