华大智造子公司涌生智能联合上海AI实验室发布ProtoPilot,把自然语言实验意图、多智能体协作、实验协议生成和真实湿实验执行串成闭环,这条消息最值得看的地方,不是又多了一个“科研助手”,而是AI正在从屏幕里的问答系统,走向实验台上的执行系统。研究人员不只是让模型解释论文、整理资料,而是让它理解实验目的、规划流程、适配设备,并把结果带回下一轮判断。

同一批资讯里,阿里达摩院联合团队用AI智能体ElementsClaw在有限GPU资源内筛出并合成全新超导体;LeCun团队发布AdaJEPA,让世界模型在真实交互中持续校准自己;英伟达GEAR联合李飞飞团队推出Real2Sim系统,用一段真实视频生成可交互机器人仿真环境。这些进展放在一起看,AI科学正在越过“会不会回答正确”的阶段,进入“能不能在真实世界里提出方案、调用工具、验证结果”的阶段。
实验台开始接入Agent
ProtoPilot的核心变化,是把实验意图变成可执行流程。过去科研人员使用AI,大多停留在读文献、写摘要、生成代码、辅助设计方案这些环节,最终是否能落到实验台,仍然要靠人把方案拆成步骤、转成设备能理解的指令,再手动记录结果。这个链条中间有大量重复劳动,也有很多容易出错的细节。
多智能体系统进入后,任务分工会变得更细:一个Agent理解实验目标,一个Agent检索相关知识,一个Agent生成协议,一个Agent检查安全和设备约束,另一个Agent负责把流程转成可执行动作。真正关键的是闭环,而不是单次生成。实验失败后,它需要知道是参数、设备、样本还是协议出了问题,并把这些反馈转成下一次调整。
湿实验考验真能力
生命科学实验和普通办公自动化完全不同。写一份会议纪要错一个词,最多是体验不好;湿实验中一个浓度、温度、时间、移液步骤出错,可能直接导致结果失真。ProtoPilot在第三方测评中表现突出,并在真实湿实验里达到较高阳性率,说明这类系统已经开始接近真实研发流程,而不是停留在演示视频里。
这也意味着AI在生命科学里的价值判断会更严格。模型不能只给出“看起来合理”的方案,而要能经受实验结果验证。科研人员真正需要的不是一个自信的聊天机器人,而是一个能记录假设、解释失败、遵守约束、持续改进的实验协作者。AI如果能在这类高成本场景中稳定减少试错,就会直接影响药物研发、合成生物学、分子检测和实验室自动化的效率。
材料发现也在提速
阿里达摩院联合人大、中科院发布的ElementsClaw,则把AI科学的另一面推到台前:让智能体在庞大的材料空间里寻找人类此前未发现的候选物。它在28个GPU小时内从大量稳定晶体中预测出潜在超导体,并完成4种全新超导体的实验合成。这个数字背后真正重要的,是AI开始把“搜索空间巨大、实验成本高、验证周期长”的科学问题切成可以自动推进的流程。
传统材料发现往往依赖专家经验、理论推导和大量实验筛选,效率受到人力和设备限制。AI智能体的优势在于可以快速阅读数据库、生成候选、评估稳定性、安排优先级,再把最值得验证的样本交给实验环节。它不是取代科学家的好奇心,而是把科学家从低效搜索中解放出来,让人把注意力放到更高层的假设、机制解释和实验设计上。
世界模型补上反馈
LeCun团队发布的AdaJEPA看似更偏基础研究,但它和实验自动化之间存在同一个底层问题:AI必须在真实交互中更新自己。很多模型在训练集和标准测试里表现不错,一进入变化环境就容易失准。世界模型如果不能持续校准,对机器人、自动实验和工业控制来说都会有风险。
AdaJEPA让模型在部署中基于真实交互持续更新参数,规划成功率显著提升,同时只带来很小的额外延迟。这个方向的重要性在于,真实世界不是静态题库。实验设备会有偏差,样本状态会波动,机器人抓取会遇到摩擦和遮挡,生产线也会出现异常。AI要进入这些场景,必须具备从反馈中修正自身判断的能力。
机器人训练换路线
英伟达GEAR联合李飞飞团队推出的Real2Sim系统SimFoundry,则解决具身智能里的另一个瓶颈:真实数据太贵,仿真数据又常常不够真。它只需要一段真实视频,就能自动生成可交互的机器人仿真环境,并扩展出新物体、新场景和新任务,为机器人训练提供更多可用数据。
这和生命科学实验自动化本质上是同一类问题:AI要落地,就必须把数字世界和物理世界接起来。Real2Sim让机器人从真实视频中获得训练环境,ProtoPilot让实验意图进入真实设备,ElementsClaw让材料候选走向实验合成。过去AI更多是在数据里学习世界,现在它开始把自己生成的计划带回真实世界接受检验。
科研工作流会被重组
如果这些系统继续成熟,科研组织方式会被明显改变。实验室里最消耗时间的环节,往往不是灵感本身,而是把灵感变成可执行流程:查资料、写方案、排设备、记录数据、复现实验、整理失败原因。AI Agent一旦能稳定接管这些流程,科研人员的工作重心会从“做大量机械步骤”,转向“提出更好的问题和判断结果是否可信”。
企业研发也会因此重新评估投入结构。过去买AI工具,常常看模型订阅和API费用;未来进入科学和工业场景,还要看设备接口、数据治理、权限控制、实验记录、质量追溯和合规审计。一个能在实验室里使用的AI系统,必须比普通办公助手更透明、更可复现,也更容易被人类接管。
商业化拼的是可信闭环
AI科学听起来很前沿,但真正商业化时会落到很朴素的问题:能不能缩短研发周期,能不能减少无效实验,能不能提升命中率,能不能让结果可解释、可复核、可追责。生命科学、材料、机器人、工业生产都不是靠一次炫酷演示就能成交的市场,客户会看长期稳定性和实际节省的成本。
这也是ProtoPilot、ElementsClaw、AdaJEPA、SimFoundry共同释放的信号:AI行业的下一段增长,不只来自更强的聊天模型,也来自能把模型能力嵌进真实流程的系统工程。谁能把假设、工具、执行、反馈、验证连成闭环,谁就有机会在科学研发和物理世界应用里拿到真正的生产力红利。












暂无评论内容