多模型组队逼近Fable 5后，AI竞争开始转向路由和系统交付-速维云

OpenRouter把Fusion多模型协作推到台前后，模型竞争里一个更现实的问题被摆上桌面：企业和开发者不一定永远等待单个“最强模型”，也可以把多个价格更低、能力互补的模型组织起来，让系统自己分工、比较和选择答案。Fusion组合多个高性价比国产开源模型后，在DRACO测试中拿到64.7%的成绩，已经非常接近Claude Fable 5的65.3%，成本却只有后者大约一半。紧接着，OrcaRouter又把可编程路由策略Routing DSL放出来，用多模型并行作答、自动择优的方式继续验证这条路。

这类变化不只是榜单上的小数点竞争。过去两年，AI行业习惯用“大模型发布”解释一切：谁参数更大，谁上下文更长，谁在基准测试上多赢几分。但当模型能力越来越接近，真正改变产品体验的，往往是模型外面的系统：路由、缓存、工具调用、记忆、权限、成本预算、失败重试和人工接管。与此同时，具身智能、AI汽车、端侧Siri、代码搜索模型和企业自进化系统也在同步升温，说明AI正在从“单个模型会不会回答”，转向“一个系统能不能稳定完成任务”。

模型组队出圈

Fusion最有代表性的地方，是它把“多模型协作”做成了可直接使用的能力，而不是停留在研究论文或工程师内部脚本里。多个国产开源模型被组织成一个回答系统后，可以同时处理同一问题，再由路由与评估机制选出更合适的结果。对用户来说，前台看到的仍然是一次请求；对后台来说，这已经从单模型推理变成了小型模型团队协作。

这背后有一个很现实的经济账。顶级闭源模型在复杂推理、长上下文和工具使用上仍然有优势，但调用成本、可用性和合规边界并不总是稳定。企业如果把所有关键流程都压在单一模型上，一旦价格变化、接口受限、区域不可用或模型行为调整，业务链路就会受到影响。多模型路由提供的不是“某个模型必胜”，而是让系统具备冗余、替换和成本优化能力。

路由成为新底座

OrcaRouter的Routing DSL把这件事又往前推了一步。它不是简单在几个模型之间轮询，而是允许开发者编排更细的路由策略：哪些任务并行给多个模型，哪些任务先由低成本模型初筛，哪些结果需要再交给强模型校验，哪些场景必须限制预算或延迟。换句话说，模型调用开始从“选一个API”变成“设计一条推理流水线”。

这种变化和近期BudgetMem、LU-KV、FuseSearch-4B等研究形成呼应。BudgetMem讨论智能体记忆系统如何按查询复杂度分配运行成本，LU-KV尝试用投资回报率重新分配KV Cache，FuseSearch-4B则让代码定位模型自己学习“该搜多少”。这些工作看上去分散，实际上都在回答同一个问题：AI系统不可能无限消耗算力，必须学会在效果、速度和成本之间做动态取舍。

多模型协作把AI竞争从单一模型能力，推向路由、算力调度和系统工程。

国产模型的机会

Fusion测试里几个国产开源模型组队后逼近Fable 5，给市场释放了一个信号：国产模型并不一定要在所有维度单点超越最强闭源模型，才有商业价值。只要在特定任务上足够强、成本足够低、部署足够灵活，就可以通过系统编排获得接近顶级模型的综合体验。对中小团队来说，这比“等一个完美模型”更可执行。

这也是Kimi K2.7 Code、FuseSearch-4B、GLM-5.2 Coding等模型持续受到关注的原因。AI编程场景对准确率、上下文、搜索、执行和成本都很敏感，单次回答漂亮并不够，持续处理真实仓库、定位代码、运行命令、修复错误才是关键。如果低成本模型可以在路由系统中承担初筛、检索、草拟、局部修改等任务，强模型就能集中处理高难度决策，整体成本会明显下降。

具身智能升温

同一天的新闻里，具身智能线索也很密集。大晓机器完成天使+轮融资，自研世界模型Kairos登顶四大具身智能榜单；光象科技发布工业级自进化具身智能机器人Phi-Bot X1，并在蔚来焊接场景连续作业21.5小时零失误；OriginFlow成立时间不长就完成多轮融资，试图用新的数据采集范式为机器人补充物理交互数据。这些进展说明，AI系统工程不只发生在云端，也正在进入工厂、汽车和真实物理环境。

具身智能对模型路由的需求甚至更强。机器人面对的是不稳定现场：传感器可能噪声很大，任务可能临时变化，机械臂动作需要安全边界，生产线还要求低延迟和高可靠。一个机器人系统往往需要视觉模型、规划模型、控制模型、异常检测、知识库和人类确认机制共同工作。未来的关键不一定是谁拥有一个最大模型，而是谁能把感知、推理、行动和反馈闭环做成稳定工程。

入口继续分化

苹果在iOS 27里推出更像“小Gemini”的新版Siri，AIVA团队把原生全域Agent AI放进汽车，微软CEO纳德拉讨论“人力资本+Token资本”，这些信息放在一起看，AI入口正在继续分化。手机、车机、办公软件、代码终端、企业后台和机器人本体，都可能成为不同形态的智能入口。用户未必关心背后是哪一个模型，但会关心任务是否能完成、数据是否安全、响应是否稳定、成本是否可控。

这会推动模型公司、云厂商和应用开发者重新分工。底层模型仍然重要，但应用层会越来越看重路由框架、工作流引擎、权限管理、审计记录和行业数据。对企业来说，采购AI能力不再只是买一个聊天窗口，而是要把AI接入客服、销售、研发、财务、法务、制造和运维流程。谁能把模型能力包装成可管理、可回滚、可审计的系统，谁才更接近真实预算。

竞争回到交付

Fable 5相关风波也提醒行业，强模型本身并不能解决全部问题。模型可用性、政策风险、供应稳定性、区域限制和产品连续性，都会影响客户是否敢把核心流程交给AI。多模型路由在这种背景下显得更有价值，因为它天然鼓励替代方案和故障转移：一个模型不可用，系统可以降级到其他模型；强模型成本过高，系统可以先用低成本模型处理大部分请求；任务风险较高，再交给更稳的模型复核。

接下来，AI竞争很可能继续从“谁发布了更强模型”扩展到“谁能交付更稳系统”。模型组队、成本路由、记忆预算、代码搜索、端侧智能、具身执行和企业自进化，都是同一条主线的不同侧面：AI正在变成基础设施，而基础设施最怕的不是某一项指标不够漂亮，而是不稳定、不可控和不可持续。对于开发者和企业用户来说，真正值得关注的不是单次演示有多惊艳，而是这套系统能否在真实业务里长期跑下去。

文章版权归作者所有，未经允许请勿转载。

THE END