清华特奖获得者顾煜贤加入 DeepSeek,这条消息表面上是一则人才流动,放到当前模型竞争里看,却更像一个信号:大模型公司的胜负正在从“谁先把参数堆大”转向“谁能把数据筛选、知识蒸馏、高效架构和真实工作流连成一套系统”。顾煜贤的研究方向覆盖预训练数据筛选、知识蒸馏和高效模型架构,代表作包括 Jet-Nemotron 和 MiniLLM,这些关键词都指向同一件事——模型能力增长不能只靠更大的训练预算,还要靠更精细的数据和更节制的推理成本。
同一批重点资讯里,Agent Ontology 被重新讨论,Kimi 接入 Codex 的教程受到关注,Claude Science 被用来跑 RNA-seq 定量,MVLAND 把多种视频模型放进创意画布,vLLM Semantic Router 则把模型调用变成多模型协作调度。它们看似分散,实则共同说明:AI 产品正在从“单个模型回答得更好”走向“模型、工具、业务对象、流程规则和计算资源一起协作”。对企业和开发者来说,下一阶段的竞争重点不是多一个聊天入口,而是能不能把 AI 放进真实任务里稳定产出。
人才流向的信号
顾煜贤加入 DeepSeek 之所以值得关注,不只是因为“清华特奖”这个标签足够亮眼,更因为他的研究履历与大模型下一阶段的核心问题高度重合。预训练数据筛选决定模型吃什么,知识蒸馏决定能力如何压缩和迁移,高效架构决定同等算力下能跑出多少效果。过去模型发布常用参数规模、榜单分数和上下文长度制造声量,但真正进入产品和 API 后,企业用户更关心响应速度、稳定性、成本和可控性。
DeepSeek 过去已经凭借成本效率和工程取舍形成鲜明标签,如今继续补强数据与架构方向的人才,说明模型公司对“便宜且好用”的追求正在前移到研发底层。训练数据不再只是越多越好,而是要筛掉噪声、保留有效样本、覆盖关键任务;蒸馏也不再只是把大模型压成小模型,而是把推理、代码、中文、多模态等能力按产品需要重新分配。模型竞争因此越来越像一场系统工程,而不是单点突破。
业务地图成为 Agent 底座
Agent Ontology 的讨论把另一个问题摆到台前:企业真正需要的 Agent,不是一个“更会聊天的机器人”,而是一个懂业务对象、关系、动作和规则的执行者。所谓本体论,可以理解为给 AI 建一张业务地图:客户、合同、订单、库存、审批、权限、异常处理之间是什么关系,哪些动作可以自动执行,哪些节点必须交给人确认,哪些规则不能越线。
这也是 RAG 之后企业 AI 落地经常遇到的瓶颈。检索增强可以让模型查到资料,但查到资料不等于会办事;能总结文档,也不等于能按企业规则完成流程。Palantir、Databricks、Skan AI 等采用这类方法,本质上是在把 AI 从“知识入口”推向“流程执行层”。如果没有业务地图,Agent 很容易在复杂组织里变成一个聪明但不懂规矩的实习生;有了清晰对象和规则,它才可能稳定接入销售、财务、运营、研发和客服系统。
开发者工具进入组合时代
Kimi 接入 Codex 的教程走热,反映了开发者对“可组合 AI 工具”的需求正在上升。很多用户并不只想选择某一个封闭产品,而是希望把中文理解、长文本、代码能力、支付便利性和现有开发工作流拼在一起。开源工具 CC Switch 被用于连接 Kimi For Coding 与 Codex,这类玩法说明 AI 编程工具正在从单一 IDE 插件,变成可切换模型、可连接任务、可嵌入工作流的组合系统。

这对模型厂商也是提醒:开发者并不天然忠于某个品牌,他们忠于效率、成本和可控性。谁能让模型更容易接入终端、仓库、文档、任务管理和浏览器,谁就更容易成为工作流的一部分。未来 AI 编程产品的竞争,可能不只是“谁一次性写出更好的代码”,还包括谁更会读项目上下文,谁更适合长任务,谁能减少无效 token,谁能在多人协作里留下可审计记录。
科研工作台开始跑真任务
Claude Science 被用于在服务器上完成 RNA-seq 定量测试,是科研 AI 走向真实工作流的一个典型例子。作者让它连接远程服务器、探测环境、安装 Salmon、提交 SLURM 作业、下载酵母 RNA-seq 数据并完成转录本定量,最终作业成功跑通,结果也具备合理性。这里的关键不在于模型会解释 RNA-seq 概念,而在于它能不能在真实计算环境里把任务串起来。
科研场景对 AI 的要求比普通办公更苛刻。它需要理解专业术语,也要处理软件依赖、命令行、数据路径、计算资源、日志报错和结果复查。一个真正有用的科研 Agent,必须能把“自然语言问题”转换成“可执行流程”,并留下足够清晰的过程记录。Claude Science 的测试说明,科研 AI 正在从问答助手走向工作台,但它能否被广泛采用,还要看权限管理、数据安全、复现实验和错误追踪是否跟得上。
创作工具从模型切换到流程
MVLAND 的创意画布模式也体现了类似变化。它不是单纯发布一个视频生成模型,而是把 Seedance2.0、可灵、HappyHorse 等模型放进画布,允许用户整理图片视频素材、多轨剪辑、保留历史版本、套用模板并快速生成音乐短片。对创作者来说,痛点往往不是“有没有一个模型能生成视频”,而是从素材、脚本、镜头、音乐、版本管理到成片之间的流程太碎。
图片与视频模型已经从质量竞赛进入工作流竞赛。单次生成效果当然重要,但如果创作者每次都要重新整理素材、复制提示词、手动保存版本、再用传统剪辑软件收尾,AI 的效率优势就会被流程成本吃掉。创意画布类产品的价值,是把模型能力嵌入创作过程本身,让用户可以反复调整、组合和复用。未来内容生产工具的核心差异,可能不在“能不能生成一段视频”,而在“能不能把一个想法稳定推进到可发布作品”。
模型调用变成系统调度
vLLM Semantic Router 的方向则更偏基础设施。它把一次模型调用背后的路由、评分、融合和多模型协作系统化,让用户表面上只调用一个 API,底层却可以根据任务特征自动选择不同模型和策略。Micro-Agent、Confidence、Ratings、ReMoM、Fusion、Workflows 等机制,说明模型服务正在从“请求进来、模型回答”变成“请求进来、系统判断该怎么组织模型完成任务”。
这类路由能力对企业尤其重要。不同任务对成本、速度、准确率和安全性的要求并不一样:简单分类没必要调用最贵模型,复杂推理可以多模型交叉验证,高风险输出需要更严格的审查链路。Semantic Router 的意义,是让 AI 基础设施更像一个调度系统,而不是单一模型的包装层。随着 Agent 数量增加,企业最终要管理的不是几个模型名称,而是一整套任务分派、预算控制、质量评估和风险治理机制。
下一阶段拼的是闭环
把这些消息连起来看,AI 竞争正在出现一条清晰主线:模型能力仍然是基础,但真正拉开差距的,是能否形成闭环。DeepSeek 补强数据与架构人才,是研发闭环;Agent Ontology 梳理业务对象和规则,是组织闭环;Kimi 接入 Codex,是开发工具闭环;Claude Science 跑通科研流程,是专业场景闭环;MVLAND 做创意画布,是内容生产闭环;vLLM 路由多模型,是基础设施闭环。
这也意味着,企业选择 AI 产品时不能只看演示效果。一个演示里表现惊艳的模型,如果接不进数据、权限、工具和流程,就很难长期创造价值;一个看起来不那么炫的系统,如果能稳定完成任务、控制成本、保留日志并支持人工接管,反而更接近真实生产力。AI 的下一轮落地,不会只由最会说话的模型决定,而会由最懂流程、最会协作、最能被治理的系统决定。











暂无评论内容