多模型组队逼近Fable 5后,AI竞争开始转向路由和系统交付

OpenRouter把Fusion多模型协作推到台前后,模型竞争里一个更现实的问题被摆上桌面:企业和开发者不一定永远等待单个“最强模型”,也可以把多个价格更低、能力互补的模型组织起来,让系统自己分工、比较和选择答案。Fusion组合多个高性价比国产开源模型后,在DRACO测试中拿到64.7%的成绩,已经非常接近Claude Fable 5的65.3%,成本却只有后者大约一半。紧接着,OrcaRouter又把可编程路由策略Routing DSL放出来,用多模型并行作答、自动择优的方式继续验证这条路。

这类变化不只是榜单上的小数点竞争。过去两年,AI行业习惯用“大模型发布”解释一切:谁参数更大,谁上下文更长,谁在基准测试上多赢几分。但当模型能力越来越接近,真正改变产品体验的,往往是模型外面的系统:路由、缓存、工具调用、记忆、权限、成本预算、失败重试和人工接管。与此同时,具身智能、AI汽车、端侧Siri、代码搜索模型和企业自进化系统也在同步升温,说明AI正在从“单个模型会不会回答”,转向“一个系统能不能稳定完成任务”。

模型组队出圈

Fusion最有代表性的地方,是它把“多模型协作”做成了可直接使用的能力,而不是停留在研究论文或工程师内部脚本里。多个国产开源模型被组织成一个回答系统后,可以同时处理同一问题,再由路由与评估机制选出更合适的结果。对用户来说,前台看到的仍然是一次请求;对后台来说,这已经从单模型推理变成了小型模型团队协作。

这背后有一个很现实的经济账。顶级闭源模型在复杂推理、长上下文和工具使用上仍然有优势,但调用成本、可用性和合规边界并不总是稳定。企业如果把所有关键流程都压在单一模型上,一旦价格变化、接口受限、区域不可用或模型行为调整,业务链路就会受到影响。多模型路由提供的不是“某个模型必胜”,而是让系统具备冗余、替换和成本优化能力。

路由成为新底座

OrcaRouter的Routing DSL把这件事又往前推了一步。它不是简单在几个模型之间轮询,而是允许开发者编排更细的路由策略:哪些任务并行给多个模型,哪些任务先由低成本模型初筛,哪些结果需要再交给强模型校验,哪些场景必须限制预算或延迟。换句话说,模型调用开始从“选一个API”变成“设计一条推理流水线”。

这种变化和近期BudgetMem、LU-KV、FuseSearch-4B等研究形成呼应。BudgetMem讨论智能体记忆系统如何按查询复杂度分配运行成本,LU-KV尝试用投资回报率重新分配KV Cache,FuseSearch-4B则让代码定位模型自己学习“该搜多少”。这些工作看上去分散,实际上都在回答同一个问题:AI系统不可能无限消耗算力,必须学会在效果、速度和成本之间做动态取舍。

多模型路由与AI算力基础设施示意图
多模型协作把AI竞争从单一模型能力,推向路由、算力调度和系统工程。

国产模型的机会

Fusion测试里几个国产开源模型组队后逼近Fable 5,给市场释放了一个信号:国产模型并不一定要在所有维度单点超越最强闭源模型,才有商业价值。只要在特定任务上足够强、成本足够低、部署足够灵活,就可以通过系统编排获得接近顶级模型的综合体验。对中小团队来说,这比“等一个完美模型”更可执行。

这也是Kimi K2.7 Code、FuseSearch-4B、GLM-5.2 Coding等模型持续受到关注的原因。AI编程场景对准确率、上下文、搜索、执行和成本都很敏感,单次回答漂亮并不够,持续处理真实仓库、定位代码、运行命令、修复错误才是关键。如果低成本模型可以在路由系统中承担初筛、检索、草拟、局部修改等任务,强模型就能集中处理高难度决策,整体成本会明显下降。

具身智能升温

同一天的新闻里,具身智能线索也很密集。大晓机器完成天使+轮融资,自研世界模型Kairos登顶四大具身智能榜单;光象科技发布工业级自进化具身智能机器人Phi-Bot X1,并在蔚来焊接场景连续作业21.5小时零失误;OriginFlow成立时间不长就完成多轮融资,试图用新的数据采集范式为机器人补充物理交互数据。这些进展说明,AI系统工程不只发生在云端,也正在进入工厂、汽车和真实物理环境。

具身智能对模型路由的需求甚至更强。机器人面对的是不稳定现场:传感器可能噪声很大,任务可能临时变化,机械臂动作需要安全边界,生产线还要求低延迟和高可靠。一个机器人系统往往需要视觉模型、规划模型、控制模型、异常检测、知识库和人类确认机制共同工作。未来的关键不一定是谁拥有一个最大模型,而是谁能把感知、推理、行动和反馈闭环做成稳定工程。

入口继续分化

苹果在iOS 27里推出更像“小Gemini”的新版Siri,AIVA团队把原生全域Agent AI放进汽车,微软CEO纳德拉讨论“人力资本+Token资本”,这些信息放在一起看,AI入口正在继续分化。手机、车机、办公软件、代码终端、企业后台和机器人本体,都可能成为不同形态的智能入口。用户未必关心背后是哪一个模型,但会关心任务是否能完成、数据是否安全、响应是否稳定、成本是否可控。

这会推动模型公司、云厂商和应用开发者重新分工。底层模型仍然重要,但应用层会越来越看重路由框架、工作流引擎、权限管理、审计记录和行业数据。对企业来说,采购AI能力不再只是买一个聊天窗口,而是要把AI接入客服、销售、研发、财务、法务、制造和运维流程。谁能把模型能力包装成可管理、可回滚、可审计的系统,谁才更接近真实预算。

竞争回到交付

Fable 5相关风波也提醒行业,强模型本身并不能解决全部问题。模型可用性、政策风险、供应稳定性、区域限制和产品连续性,都会影响客户是否敢把核心流程交给AI。多模型路由在这种背景下显得更有价值,因为它天然鼓励替代方案和故障转移:一个模型不可用,系统可以降级到其他模型;强模型成本过高,系统可以先用低成本模型处理大部分请求;任务风险较高,再交给更稳的模型复核。

接下来,AI竞争很可能继续从“谁发布了更强模型”扩展到“谁能交付更稳系统”。模型组队、成本路由、记忆预算、代码搜索、端侧智能、具身执行和企业自进化,都是同一条主线的不同侧面:AI正在变成基础设施,而基础设施最怕的不是某一项指标不够漂亮,而是不稳定、不可控和不可持续。对于开发者和企业用户来说,真正值得关注的不是单次演示有多惊艳,而是这套系统能否在真实业务里长期跑下去。

© 版权声明
THE END
喜欢就支持一下吧
点赞15 分享
评论 抢沙发

请登录后发表评论

    暂无评论内容