Radical Numerics拿到5000万美元种子轮融资,把“生物版DeepSeek”这个说法从技术圈讨论推到了产业融资现场。它的核心看点不是又一家AI制药公司成立,而是Evo2核心团队选择围绕多模态生物数据重建通用生物AI:基因序列、蛋白结构、细胞状态、实验数据和药物研发流程,正在被放进同一个模型底座里重新组织。

这条主线旁边,阿里达摩院用常规CT顺便筛查肠癌,普林斯顿与斯坦福团队发布Science Earth行星级AI科学操作系统,南京大学团队解释大模型算术错误机制,蚂蚁CodeFuse团队改进Test Time Scaling,几件事连起来看,AI竞争正在从“回答问题更像人”转向“能不能进入科学发现、医学筛查和工程研发的真实流程”。模型能力仍然重要,但更关键的是数据、实验、验证和责任边界。
生物AI走向融资台前
Radical Numerics由生物学AI模型Evo2核心团队创立,5000万美元种子轮融资说明资本对生物基础模型仍然有强烈预期。它要做的并不是单点药物筛选工具,而是整合多模态生物数据的通用生物AI,这意味着模型需要同时理解序列、结构、功能、实验结果和疾病机制之间的复杂关系。
AI制药过去几年已经经历过一轮热潮,但很多项目卡在“生成候选分子”和“真实临床验证”之间。生物系统并不像文本或图像那样容易用单一指标评估,模型生成一个看似合理的分子,并不等于它能在人体内安全有效。Radical Numerics强调通用生物AI,本质上是在把竞争焦点前移到更底层的数据表征和生物规律建模。
值得注意的是,新版本不再默认开源也释放了一个信号:生命科学AI正在从学术开放探索走向商业壁垒竞争。团队需要资金购买数据、建设算力、组织湿实验验证,也需要用闭源能力保护商业回报。对行业来说,这会带来更强投入,也会让外部评估变得更难,未来谁能拿出可复现、可验证、可转化的结果,才是真正的分水岭。
医学筛查更接近落地
相比宏大的通用生物模型,阿里达摩院联合广东省人民医院发布的DAMO COCA肠癌筛查AI模型更接近临床现场。它的特别之处在于利用常规平扫CT“顺便”筛查肠癌,而不是要求患者额外接受一套专门检查。真实世界试验覆盖2.7万例,并检出5例漏诊肠癌,这类信息比单纯跑分更能说明应用价值。
医疗AI真正难的地方,从来不只是识别准确率。医院流程、医生信任、误报成本、漏报风险、患者沟通、责任归属和监管审批,都会影响一个模型能否长期使用。DAMO COCA区分全人群高特异性版和高风险人群高敏感性版,说明团队已经意识到不同场景下需要不同取舍:普通筛查更怕误报造成负担,高风险人群则更需要尽量减少漏检。
这类应用的商业价值也不只属于单个模型供应商。影像设备、医院信息系统、区域医疗平台、医保控费和体检机构都会被卷入。AI如果能在已有CT流程中增加一层风险提示,就可能提升早筛效率;但它也必须被放在医生工作流里,而不是变成一个孤立弹窗。医疗场景对AI的要求很现实:少打扰、能解释、可追责、能持续更新。
科学操作系统浮出水面
Science Earth提出“行星级AI科学操作系统”,听起来很宏大,但背后抓住的是科学研究正在变得越来越分布式。不同实验室拥有不同模型、数据、仪器、论文和领域经验,过去这些能力往往被封在机构和学科边界内。开放协议如果能把它们连接起来,就有机会让AI在跨学科问题上发现新的组合路径。
这和普通聊天机器人完全不是一个层级。科学研究需要提出假设、检索证据、设计实验、调用工具、复核结果,并在失败后重新调整方向。AI要在这里发挥作用,不能只会生成流畅文字,而要能把任务拆成可验证步骤,知道哪些结论来自数据,哪些只是推测,哪些环节需要人类专家确认。
如果说通用生物AI提供的是某一类科学对象的基础模型,那么Science Earth代表的是科学能力的网络化调度。未来科研AI的竞争,可能不只是“谁的模型更聪明”,还包括谁能连接更多高质量数据、工具和专家流程。对企业而言,这会影响药物研发、新材料、能源、电池、农业和工业仿真等多个领域。
基础能力还要补课
南京大学团队研究大模型为什么算不对加法,提出等本位和轨迹来解释LLM算术错误的几何机制。这类研究看起来不像融资新闻那样热闹,却很关键。因为当AI进入科研和医疗流程后,任何基础推理偏差都可能被放大:一个计算错误、一次证据错配、一个错误置信度,都可能影响后续判断。
蚂蚁CodeFuse团队的EGSS算法则指向另一个现实问题:模型在推理时并不是想得越多越好。Test Time Scaling能提升能力,但也会带来计算冗余和选择脆弱。EGSS在SWE-Bench-Verified上提升全模型表现并节省Token,说明行业正在认真处理“让模型更会用推理预算”这件事。
这些底层改进对科学AI尤其重要。生命科学、医学影像和科研操作系统都不是闲聊场景,用户要的不是更会包装答案,而是更稳定的推理链、更明确的不确定性、更低的试错成本。模型如果不能在关键步骤上保持可靠,再漂亮的演示也很难进入严肃生产环境。
从演示到验证
这一批资讯共同说明,AI正在从“生成内容”走向“参与发现”。Radical Numerics押注生物基础模型,DAMO COCA进入真实医学筛查,Science Earth尝试连接全球科学能力,基础算法研究则在补推理和计算短板。它们的共同方向不是让AI看起来更热闹,而是让AI在真实世界里产生可验证结果。
但验证周期也会变长。内容生成工具可以当天上线、当天反馈,医疗和生命科学项目却要面对实验、伦理、审批、临床、同行复核和长期安全性。资本愿意押注,是因为一旦跑通,价值足够大;行业必须克制,是因为任何过度宣传都可能伤害用户信任。
接下来值得关注的不是某家公司喊出多大的模型,而是它能否拿出更清晰的数据来源、更严格的验证流程、更稳定的工作流集成,以及更透明的风险说明。AI科学化不是一句口号,它要求模型公司从产品发布者变成长期责任承担者。谁能把能力、数据和验证闭环做扎实,谁才有机会在下一阶段拿到真正的产业位置。











