Scaling Law被重审后,AI竞争开始重算数据、算力和系统效率

OpenAI早期Scaling Law论文被前研究员点出实验设定缺陷后,模型行业最熟悉的一条增长曲线突然变得不那么稳了。争议的焦点不只是某篇论文是否严谨,而是过去几年许多团队围绕“继续堆参数、继续堆算力”建立的研发直觉,可能需要重新校准:同样的钱、同样的GPU、同样的训练窗口,到底应该投给更大的模型、更干净的数据,还是更高效的推理系统?

AI芯片与服务器机架中的数据曲线,表现大模型算力效率与Scaling Law重估
Scaling Law争议后,模型竞争正从单纯堆参数转向数据质量、芯片效率和推理系统的综合账本。

这件事之所以重要,是因为它正好撞上AI基础设施成本快速膨胀的现实。模型厂商需要向投资人解释训练预算,云厂商需要向客户解释算力价格,企业用户也在追问为什么AI项目上线后并没有立刻带来预期回报。当一条被广泛引用的经验曲线受到质疑,行业就必须重新回答一个更朴素的问题:AI能力增长究竟靠什么,钱又应该花在哪里?

增长曲线被重新审视

Diogo Almeida指出的关键问题,在于原始Scaling Law实验中固定token预算与余弦学习率衰减的组合,可能让结论偏向“参数优先”。如果实验设计让大模型在训练过程中更容易呈现优势,行业就会自然形成一种路径依赖:只要模型不够强,就继续扩大参数;只要效果还能涨,就继续加卡、加电、加预算。

但大模型训练不是只看最终分数的竞赛。企业真正要承担的是算力采购、数据治理、推理部署、响应延迟和单位调用成本。若“参数越大越划算”的判断被高估,过去许多训练计划就可能存在资源错配。更现实的启发是,模型公司需要把数据规模、数据质量、语言覆盖、训练策略和推理效率放到同一张账本里看,而不是只把参数规模当作产品信心的来源。

这也解释了为什么近期行业讨论里,“训练一个更大模型”不再自动等于“做出更强产品”。模型能力要穿过评测、API、工具调用、企业权限和真实业务流程,最后才会变成用户能感知的价值。任何一个环节的浪费,都会在成本端被放大。Scaling Law争议真正刺中的,是AI公司过去过于依赖单一路径叙事的软肋。

数据与语言的权重上升

这次争议里另一个容易被忽略的信息,是Scaling Law长期以英语数据为主要经验来源。相关研究提到,法语模型效率可能比英语高出50至100倍,这并不意味着某一种语言天然更适合AI,而是提醒行业:不同语言、不同语料结构、不同知识密度,会显著影响训练回报。

这对中文模型和企业私有模型尤其重要。很多企业并不缺参数野心,真正缺的是高质量业务语料、稳定的数据清洗流程,以及能把内部知识转化为可执行规则的建模能力。Agent Ontology这类业务本体论方法受到关注,也正是因为它试图把企业对象、关系、动作和规则先定义清楚,再交给智能体执行。对企业AI来说,模型能力只是底座,业务地图才决定AI能不能按真实流程办事。

换句话说,数据不是训练前随手准备的原材料,而是决定模型边界的核心资产。高质量数据能让较小模型具备更强的场景能力,低质量数据则会让大模型在关键任务上反复出错。对于金融、医疗、制造、政务等行业,内部术语、审批逻辑、异常处理和责任边界往往比公开互联网知识更关键。谁能把这些数据整理成可训练、可检索、可执行的结构,谁就更接近真正可用的企业AI。

算力竞争转向系统效率

同样值得关注的是英伟达GB300 NVL72在AA-AgentPerf基准上的表现:每兆瓦可支持约6.14万个并发智能体,是H200的20倍左右。这个数字的意义不在于又多了一个漂亮跑分,而在于AI基础设施的评价口径正在变化。过去行业常谈训练卡数量、峰值算力和模型参数,现在更需要看单位电力能承载多少真实智能体任务。

智能体应用与传统聊天机器人不同,它要持续调用模型、工具、代码环境和外部系统。如果每个智能体都像一个小团队成员,企业部署就会迅速碰到并发、功耗、散热和成本上限。GB300的指标把问题说得更直白:未来的AI云并不是谁买卡更多谁就赢,而是谁能在电力、网络、内存、调度和模型路由之间做出更高的系统效率。

这会改变云服务和模型服务的销售语言。客户不只会问“你有多少张GPU”,还会问“同样一兆瓦能跑多少任务”“一个智能体完成一次工单要消耗多少token”“高峰期排队多久”“失败重试成本谁承担”。当AI进入企业预算表,性能指标必须和电费、机柜、网络、运维、SLA一起算。算力仍然稀缺,但稀缺资源的用法正在变得更精细。

人才流动释放新信号

清华特奖获得者顾煜贤加入DeepSeek,也给这条主线补上了人才侧注脚。他的研究方向包括预训练数据筛选、知识蒸馏和高效模型架构,恰好对应当前模型竞争的关键转向:不只是做更大的模型,而是用更好的数据、更轻的结构和更聪明的蒸馏方法,把同等资源压出更高能力。

这类人才流向说明,前沿模型团队正在从“单点突破”走向“系统工程”。数据筛选决定训练材料的上限,蒸馏决定能力能否低成本下放,高效架构决定推理能不能规模化。模型公司争夺的不只是明星研究员,而是能把论文、工程和产品成本连接起来的人。谁能把这些环节打通,谁就更可能在下一阶段摆脱单纯烧钱的叙事。

DeepSeek过去给行业留下的印象,本来就与效率、工程化和成本控制相关。新人才加入后,外界关注的也不会只是下一代模型参数有多大,而是它能否在训练数据、推理速度、开源生态、中文能力和商业部署之间继续做出平衡。对中国AI团队来说,这种路线更符合现实约束:算力并非无限,预算需要回报,模型能力最终要落到开发者和企业客户手里。

企业AI更看重可执行性

Agent Ontology的走红,反映出企业客户对AI的期待已经从“能回答问题”变成“能按规则做事”。Palantir、Databricks、Skan AI等方案都强调业务对象和流程建模,本质上是在告诉智能体:哪些数据可以用、哪些动作可以执行、哪些边界不能跨越、哪些结果需要人类确认。

这也是RAG之后的一个自然补充。RAG让AI能检索企业知识,但检索到信息不等于能完成业务动作。比如销售线索跟进、工单分派、财务审批、供应链异常处理,都需要清楚的角色权限、状态流转和例外规则。企业AI真正的价值,不是把一段制度文件复述得更漂亮,而是把制度变成可运行的工作流。

如果没有业务本体,智能体很容易在真实场景里显得“聪明但不可靠”:它能给出建议,却不知道谁有审批权;它能生成方案,却不知道库存、合同和合规条件;它能调用工具,却无法判断结果是否需要升级给人类。企业AI要走向规模化,必须把模型放进组织结构里,而不是把组织流程压缩成一段提示词。

应用层开始追求闭环

Claude Science连接远程服务器完成RNA-seq定量实验、MVLAND把多模型视频创作放进创意画布、上海AI Lab让智能体通过COM代码操纵CAD软件,这些案例看似分散,其实都指向同一个变化:AI应用正在离开单次生成,进入真实工具链。

在科研场景里,AI要能探测环境、安装依赖、提交任务、检查结果;在创作场景里,AI要管理素材、版本、剪辑和模型调用;在工业设计里,AI要理解软件对象和工程约束。对用户来说,单次生成一段文字或图片已经不稀缺,稀缺的是从意图到结果的闭环交付。模型越强,应用层越会把竞争重点放在流程、权限、审计和稳定性上。

这也是为什么许多AI产品开始强调“工作台”“画布”“Agent平台”,而不是单纯强调聊天窗口。用户需要的不只是一个会说话的模型,而是一个能接入文件、数据、工具、服务器和团队协作环境的执行系统。未来AI产品的差异化,可能不在于回答是否更像人,而在于它能不能把复杂任务拆开、执行、校验并留下可追溯记录。

下一阶段拼的是账本

把这些新闻放在一起看,AI竞争正在从“能力信仰”进入“账本阶段”。Scaling Law争议要求行业重新计算训练回报,GB300的每兆瓦智能体指标要求云厂商重新计算推理效率,DeepSeek的人才引进指向数据和架构优化,Agent Ontology则要求企业把业务流程先结构化。

这并不意味着大模型扩张会停止。相反,真正有价值的扩张会更精细:训练侧关注数据和算法效率,推理侧关注单位功耗和并发能力,应用侧关注业务闭环和可审计结果。下一轮赢家未必是喊出最大参数的公司,而是能证明每一块GPU、每一份数据、每一次模型调用都产生实际价值的团队。

对普通企业和开发者来说,这也是一个选择AI服务的新标准。与其只看模型榜单,不如同时看成本、延迟、上下文管理、工具生态、数据合规和失败处理。AI行业越成熟,越不会只靠一次炫技发布会决定胜负。真正能长期留下来的,是那些把技术能力、基础设施效率和业务结果稳定连接起来的产品。

© 版权声明
THE END
喜欢就支持一下吧
点赞15 分享
评论 抢沙发

请登录后发表评论

    暂无评论内容