Radical Numerics融资后，AI科学竞争开始走进生命科学和医学验证-速维云

Radical Numerics拿到5000万美元种子轮融资，把“生物版DeepSeek”这个说法从技术圈讨论推到了产业融资现场。它的核心看点不是又一家AI制药公司成立，而是Evo2核心团队选择围绕多模态生物数据重建通用生物AI：基因序列、蛋白结构、细胞状态、实验数据和药物研发流程，正在被放进同一个模型底座里重新组织。

生物AI、医学影像和科学验证正在成为AI落地的新主线。

这条主线旁边，阿里达摩院用常规CT顺便筛查肠癌，普林斯顿与斯坦福团队发布Science Earth行星级AI科学操作系统，南京大学团队解释大模型算术错误机制，蚂蚁CodeFuse团队改进Test Time Scaling，几件事连起来看，AI竞争正在从“回答问题更像人”转向“能不能进入科学发现、医学筛查和工程研发的真实流程”。模型能力仍然重要，但更关键的是数据、实验、验证和责任边界。

生物AI走向融资台前

Radical Numerics由生物学AI模型Evo2核心团队创立，5000万美元种子轮融资说明资本对生物基础模型仍然有强烈预期。它要做的并不是单点药物筛选工具，而是整合多模态生物数据的通用生物AI，这意味着模型需要同时理解序列、结构、功能、实验结果和疾病机制之间的复杂关系。

AI制药过去几年已经经历过一轮热潮，但很多项目卡在“生成候选分子”和“真实临床验证”之间。生物系统并不像文本或图像那样容易用单一指标评估，模型生成一个看似合理的分子，并不等于它能在人体内安全有效。Radical Numerics强调通用生物AI，本质上是在把竞争焦点前移到更底层的数据表征和生物规律建模。

值得注意的是，新版本不再默认开源也释放了一个信号：生命科学AI正在从学术开放探索走向商业壁垒竞争。团队需要资金购买数据、建设算力、组织湿实验验证，也需要用闭源能力保护商业回报。对行业来说，这会带来更强投入，也会让外部评估变得更难，未来谁能拿出可复现、可验证、可转化的结果，才是真正的分水岭。

医学筛查更接近落地

相比宏大的通用生物模型，阿里达摩院联合广东省人民医院发布的DAMO COCA肠癌筛查AI模型更接近临床现场。它的特别之处在于利用常规平扫CT“顺便”筛查肠癌，而不是要求患者额外接受一套专门检查。真实世界试验覆盖2.7万例，并检出5例漏诊肠癌，这类信息比单纯跑分更能说明应用价值。

医疗AI真正难的地方，从来不只是识别准确率。医院流程、医生信任、误报成本、漏报风险、患者沟通、责任归属和监管审批，都会影响一个模型能否长期使用。DAMO COCA区分全人群高特异性版和高风险人群高敏感性版，说明团队已经意识到不同场景下需要不同取舍：普通筛查更怕误报造成负担，高风险人群则更需要尽量减少漏检。

这类应用的商业价值也不只属于单个模型供应商。影像设备、医院信息系统、区域医疗平台、医保控费和体检机构都会被卷入。AI如果能在已有CT流程中增加一层风险提示，就可能提升早筛效率；但它也必须被放在医生工作流里，而不是变成一个孤立弹窗。医疗场景对AI的要求很现实：少打扰、能解释、可追责、能持续更新。

科学操作系统浮出水面

Science Earth提出“行星级AI科学操作系统”，听起来很宏大，但背后抓住的是科学研究正在变得越来越分布式。不同实验室拥有不同模型、数据、仪器、论文和领域经验，过去这些能力往往被封在机构和学科边界内。开放协议如果能把它们连接起来，就有机会让AI在跨学科问题上发现新的组合路径。

这和普通聊天机器人完全不是一个层级。科学研究需要提出假设、检索证据、设计实验、调用工具、复核结果，并在失败后重新调整方向。AI要在这里发挥作用，不能只会生成流畅文字，而要能把任务拆成可验证步骤，知道哪些结论来自数据，哪些只是推测，哪些环节需要人类专家确认。

如果说通用生物AI提供的是某一类科学对象的基础模型，那么Science Earth代表的是科学能力的网络化调度。未来科研AI的竞争，可能不只是“谁的模型更聪明”，还包括谁能连接更多高质量数据、工具和专家流程。对企业而言，这会影响药物研发、新材料、能源、电池、农业和工业仿真等多个领域。

基础能力还要补课

南京大学团队研究大模型为什么算不对加法，提出等本位和轨迹来解释LLM算术错误的几何机制。这类研究看起来不像融资新闻那样热闹，却很关键。因为当AI进入科研和医疗流程后，任何基础推理偏差都可能被放大：一个计算错误、一次证据错配、一个错误置信度，都可能影响后续判断。

蚂蚁CodeFuse团队的EGSS算法则指向另一个现实问题：模型在推理时并不是想得越多越好。Test Time Scaling能提升能力，但也会带来计算冗余和选择脆弱。EGSS在SWE-Bench-Verified上提升全模型表现并节省Token，说明行业正在认真处理“让模型更会用推理预算”这件事。

这些底层改进对科学AI尤其重要。生命科学、医学影像和科研操作系统都不是闲聊场景，用户要的不是更会包装答案，而是更稳定的推理链、更明确的不确定性、更低的试错成本。模型如果不能在关键步骤上保持可靠，再漂亮的演示也很难进入严肃生产环境。

从演示到验证

这一批资讯共同说明，AI正在从“生成内容”走向“参与发现”。Radical Numerics押注生物基础模型，DAMO COCA进入真实医学筛查，Science Earth尝试连接全球科学能力，基础算法研究则在补推理和计算短板。它们的共同方向不是让AI看起来更热闹，而是让AI在真实世界里产生可验证结果。

但验证周期也会变长。内容生成工具可以当天上线、当天反馈，医疗和生命科学项目却要面对实验、伦理、审批、临床、同行复核和长期安全性。资本愿意押注，是因为一旦跑通，价值足够大；行业必须克制，是因为任何过度宣传都可能伤害用户信任。

接下来值得关注的不是某家公司喊出多大的模型，而是它能否拿出更清晰的数据来源、更严格的验证流程、更稳定的工作流集成，以及更透明的风险说明。AI科学化不是一句口号，它要求模型公司从产品发布者变成长期责任承担者。谁能把能力、数据和验证闭环做扎实，谁才有机会在下一阶段拿到真正的产业位置。

文章版权归作者所有，未经允许请勿转载。

THE END