ProtoPilot跑通湿实验后，AI科学开始从问答走向实验闭环-速维云

华大智造子公司涌生智能联合上海AI实验室发布ProtoPilot，把自然语言实验意图、多智能体协作、实验协议生成和真实湿实验执行串成闭环，这条消息最值得看的地方，不是又多了一个“科研助手”，而是AI正在从屏幕里的问答系统，走向实验台上的执行系统。研究人员不只是让模型解释论文、整理资料，而是让它理解实验目的、规划流程、适配设备，并把结果带回下一轮判断。

配图依据：文章核心新闻点是ProtoPilot将自然语言实验意图、多智能体协作与真实湿实验执行串成闭环，视觉主体聚焦生命科学实验室、自动化实验设备与AI辅助科研流程。

同一批资讯里，阿里达摩院联合团队用AI智能体ElementsClaw在有限GPU资源内筛出并合成全新超导体；LeCun团队发布AdaJEPA，让世界模型在真实交互中持续校准自己；英伟达GEAR联合李飞飞团队推出Real2Sim系统，用一段真实视频生成可交互机器人仿真环境。这些进展放在一起看，AI科学正在越过“会不会回答正确”的阶段，进入“能不能在真实世界里提出方案、调用工具、验证结果”的阶段。

实验台开始接入Agent

ProtoPilot的核心变化，是把实验意图变成可执行流程。过去科研人员使用AI，大多停留在读文献、写摘要、生成代码、辅助设计方案这些环节，最终是否能落到实验台，仍然要靠人把方案拆成步骤、转成设备能理解的指令，再手动记录结果。这个链条中间有大量重复劳动，也有很多容易出错的细节。

多智能体系统进入后，任务分工会变得更细：一个Agent理解实验目标，一个Agent检索相关知识，一个Agent生成协议，一个Agent检查安全和设备约束，另一个Agent负责把流程转成可执行动作。真正关键的是闭环，而不是单次生成。实验失败后，它需要知道是参数、设备、样本还是协议出了问题，并把这些反馈转成下一次调整。

湿实验考验真能力

生命科学实验和普通办公自动化完全不同。写一份会议纪要错一个词，最多是体验不好；湿实验中一个浓度、温度、时间、移液步骤出错，可能直接导致结果失真。ProtoPilot在第三方测评中表现突出，并在真实湿实验里达到较高阳性率，说明这类系统已经开始接近真实研发流程，而不是停留在演示视频里。

这也意味着AI在生命科学里的价值判断会更严格。模型不能只给出“看起来合理”的方案，而要能经受实验结果验证。科研人员真正需要的不是一个自信的聊天机器人，而是一个能记录假设、解释失败、遵守约束、持续改进的实验协作者。AI如果能在这类高成本场景中稳定减少试错，就会直接影响药物研发、合成生物学、分子检测和实验室自动化的效率。

材料发现也在提速

阿里达摩院联合人大、中科院发布的ElementsClaw，则把AI科学的另一面推到台前：让智能体在庞大的材料空间里寻找人类此前未发现的候选物。它在28个GPU小时内从大量稳定晶体中预测出潜在超导体，并完成4种全新超导体的实验合成。这个数字背后真正重要的，是AI开始把“搜索空间巨大、实验成本高、验证周期长”的科学问题切成可以自动推进的流程。

传统材料发现往往依赖专家经验、理论推导和大量实验筛选，效率受到人力和设备限制。AI智能体的优势在于可以快速阅读数据库、生成候选、评估稳定性、安排优先级，再把最值得验证的样本交给实验环节。它不是取代科学家的好奇心，而是把科学家从低效搜索中解放出来，让人把注意力放到更高层的假设、机制解释和实验设计上。

世界模型补上反馈

LeCun团队发布的AdaJEPA看似更偏基础研究，但它和实验自动化之间存在同一个底层问题：AI必须在真实交互中更新自己。很多模型在训练集和标准测试里表现不错，一进入变化环境就容易失准。世界模型如果不能持续校准，对机器人、自动实验和工业控制来说都会有风险。

AdaJEPA让模型在部署中基于真实交互持续更新参数，规划成功率显著提升，同时只带来很小的额外延迟。这个方向的重要性在于，真实世界不是静态题库。实验设备会有偏差，样本状态会波动，机器人抓取会遇到摩擦和遮挡，生产线也会出现异常。AI要进入这些场景，必须具备从反馈中修正自身判断的能力。

机器人训练换路线

英伟达GEAR联合李飞飞团队推出的Real2Sim系统SimFoundry，则解决具身智能里的另一个瓶颈：真实数据太贵，仿真数据又常常不够真。它只需要一段真实视频，就能自动生成可交互的机器人仿真环境，并扩展出新物体、新场景和新任务，为机器人训练提供更多可用数据。

这和生命科学实验自动化本质上是同一类问题：AI要落地，就必须把数字世界和物理世界接起来。Real2Sim让机器人从真实视频中获得训练环境，ProtoPilot让实验意图进入真实设备，ElementsClaw让材料候选走向实验合成。过去AI更多是在数据里学习世界，现在它开始把自己生成的计划带回真实世界接受检验。

科研工作流会被重组

如果这些系统继续成熟，科研组织方式会被明显改变。实验室里最消耗时间的环节，往往不是灵感本身，而是把灵感变成可执行流程：查资料、写方案、排设备、记录数据、复现实验、整理失败原因。AI Agent一旦能稳定接管这些流程，科研人员的工作重心会从“做大量机械步骤”，转向“提出更好的问题和判断结果是否可信”。

企业研发也会因此重新评估投入结构。过去买AI工具，常常看模型订阅和API费用；未来进入科学和工业场景，还要看设备接口、数据治理、权限控制、实验记录、质量追溯和合规审计。一个能在实验室里使用的AI系统，必须比普通办公助手更透明、更可复现，也更容易被人类接管。