顾煜贤加入DeepSeek后，AI竞争开始从模型参数转向系统闭环-速维云

清华特奖获得者顾煜贤加入 DeepSeek，这条消息表面上是一则人才流动，放到当前模型竞争里看，却更像一个信号：大模型公司的胜负正在从“谁先把参数堆大”转向“谁能把数据筛选、知识蒸馏、高效架构和真实工作流连成一套系统”。顾煜贤的研究方向覆盖预训练数据筛选、知识蒸馏和高效模型架构，代表作包括 Jet-Nemotron 和 MiniLLM，这些关键词都指向同一件事——模型能力增长不能只靠更大的训练预算，还要靠更精细的数据和更节制的推理成本。

同一批重点资讯里，Agent Ontology 被重新讨论，Kimi 接入 Codex 的教程受到关注，Claude Science 被用来跑 RNA-seq 定量，MVLAND 把多种视频模型放进创意画布，vLLM Semantic Router 则把模型调用变成多模型协作调度。它们看似分散，实则共同说明：AI 产品正在从“单个模型回答得更好”走向“模型、工具、业务对象、流程规则和计算资源一起协作”。对企业和开发者来说，下一阶段的竞争重点不是多一个聊天入口，而是能不能把 AI 放进真实任务里稳定产出。

人才流向的信号

顾煜贤加入 DeepSeek 之所以值得关注，不只是因为“清华特奖”这个标签足够亮眼，更因为他的研究履历与大模型下一阶段的核心问题高度重合。预训练数据筛选决定模型吃什么，知识蒸馏决定能力如何压缩和迁移，高效架构决定同等算力下能跑出多少效果。过去模型发布常用参数规模、榜单分数和上下文长度制造声量，但真正进入产品和 API 后，企业用户更关心响应速度、稳定性、成本和可控性。

DeepSeek 过去已经凭借成本效率和工程取舍形成鲜明标签，如今继续补强数据与架构方向的人才，说明模型公司对“便宜且好用”的追求正在前移到研发底层。训练数据不再只是越多越好，而是要筛掉噪声、保留有效样本、覆盖关键任务；蒸馏也不再只是把大模型压成小模型，而是把推理、代码、中文、多模态等能力按产品需要重新分配。模型竞争因此越来越像一场系统工程，而不是单点突破。

业务地图成为 Agent 底座

Agent Ontology 的讨论把另一个问题摆到台前：企业真正需要的 Agent，不是一个“更会聊天的机器人”，而是一个懂业务对象、关系、动作和规则的执行者。所谓本体论，可以理解为给 AI 建一张业务地图：客户、合同、订单、库存、审批、权限、异常处理之间是什么关系，哪些动作可以自动执行，哪些节点必须交给人确认，哪些规则不能越线。

这也是 RAG 之后企业 AI 落地经常遇到的瓶颈。检索增强可以让模型查到资料，但查到资料不等于会办事；能总结文档，也不等于能按企业规则完成流程。Palantir、Databricks、Skan AI 等采用这类方法，本质上是在把 AI 从“知识入口”推向“流程执行层”。如果没有业务地图，Agent 很容易在复杂组织里变成一个聪明但不懂规矩的实习生；有了清晰对象和规则，它才可能稳定接入销售、财务、运营、研发和客服系统。

开发者工具进入组合时代

Kimi 接入 Codex 的教程走热，反映了开发者对“可组合 AI 工具”的需求正在上升。很多用户并不只想选择某一个封闭产品，而是希望把中文理解、长文本、代码能力、支付便利性和现有开发工作流拼在一起。开源工具 CC Switch 被用于连接 Kimi For Coding 与 Codex，这类玩法说明 AI 编程工具正在从单一 IDE 插件，变成可切换模型、可连接任务、可嵌入工作流的组合系统。

开发者工具和 Agent 工作流正在从单点模型调用，转向可组合、可调度的系统闭环。

这对模型厂商也是提醒：开发者并不天然忠于某个品牌，他们忠于效率、成本和可控性。谁能让模型更容易接入终端、仓库、文档、任务管理和浏览器，谁就更容易成为工作流的一部分。未来 AI 编程产品的竞争，可能不只是“谁一次性写出更好的代码”，还包括谁更会读项目上下文，谁更适合长任务，谁能减少无效 token，谁能在多人协作里留下可审计记录。

科研工作台开始跑真任务

Claude Science 被用于在服务器上完成 RNA-seq 定量测试，是科研 AI 走向真实工作流的一个典型例子。作者让它连接远程服务器、探测环境、安装 Salmon、提交 SLURM 作业、下载酵母 RNA-seq 数据并完成转录本定量，最终作业成功跑通，结果也具备合理性。这里的关键不在于模型会解释 RNA-seq 概念，而在于它能不能在真实计算环境里把任务串起来。

科研场景对 AI 的要求比普通办公更苛刻。它需要理解专业术语，也要处理软件依赖、命令行、数据路径、计算资源、日志报错和结果复查。一个真正有用的科研 Agent，必须能把“自然语言问题”转换成“可执行流程”，并留下足够清晰的过程记录。Claude Science 的测试说明，科研 AI 正在从问答助手走向工作台，但它能否被广泛采用，还要看权限管理、数据安全、复现实验和错误追踪是否跟得上。

创作工具从模型切换到流程

MVLAND 的创意画布模式也体现了类似变化。它不是单纯发布一个视频生成模型，而是把 Seedance2.0、可灵、HappyHorse 等模型放进画布，允许用户整理图片视频素材、多轨剪辑、保留历史版本、套用模板并快速生成音乐短片。对创作者来说，痛点往往不是“有没有一个模型能生成视频”，而是从素材、脚本、镜头、音乐、版本管理到成片之间的流程太碎。

图片与视频模型已经从质量竞赛进入工作流竞赛。单次生成效果当然重要，但如果创作者每次都要重新整理素材、复制提示词、手动保存版本、再用传统剪辑软件收尾，AI 的效率优势就会被流程成本吃掉。创意画布类产品的价值，是把模型能力嵌入创作过程本身，让用户可以反复调整、组合和复用。未来内容生产工具的核心差异，可能不在“能不能生成一段视频”，而在“能不能把一个想法稳定推进到可发布作品”。

模型调用变成系统调度

vLLM Semantic Router 的方向则更偏基础设施。它把一次模型调用背后的路由、评分、融合和多模型协作系统化，让用户表面上只调用一个 API，底层却可以根据任务特征自动选择不同模型和策略。Micro-Agent、Confidence、Ratings、ReMoM、Fusion、Workflows 等机制，说明模型服务正在从“请求进来、模型回答”变成“请求进来、系统判断该怎么组织模型完成任务”。

这类路由能力对企业尤其重要。不同任务对成本、速度、准确率和安全性的要求并不一样：简单分类没必要调用最贵模型，复杂推理可以多模型交叉验证，高风险输出需要更严格的审查链路。Semantic Router 的意义，是让 AI 基础设施更像一个调度系统，而不是单一模型的包装层。随着 Agent 数量增加，企业最终要管理的不是几个模型名称，而是一整套任务分派、预算控制、质量评估和风险治理机制。

下一阶段拼的是闭环

把这些消息连起来看，AI 竞争正在出现一条清晰主线：模型能力仍然是基础，但真正拉开差距的，是能否形成闭环。DeepSeek 补强数据与架构人才，是研发闭环；Agent Ontology 梳理业务对象和规则，是组织闭环；Kimi 接入 Codex，是开发工具闭环；Claude Science 跑通科研流程，是专业场景闭环；MVLAND 做创意画布，是内容生产闭环；vLLM 路由多模型，是基础设施闭环。

这也意味着，企业选择 AI 产品时不能只看演示效果。一个演示里表现惊艳的模型，如果接不进数据、权限、工具和流程，就很难长期创造价值；一个看起来不那么炫的系统，如果能稳定完成任务、控制成本、保留日志并支持人工接管，反而更接近真实生产力。AI 的下一轮落地，不会只由最会说话的模型决定，而会由最懂流程、最会协作、最能被治理的系统决定。

文章版权归作者所有，未经允许请勿转载。

THE END