DeepMind谈医疗AI，哈佛急诊研究与医疗Agent把落地问题推到台前-速维云

Google DeepMind 负责人 Demis Hassabis 再次把医疗健康放在 AI 价值叙事的中心位置：AI 不只是写代码、做客服、生成图片的效率工具，更可能成为理解蛋白质、基因、疾病机制和药物研发流程的基础设施。这个判断并不孤立。几乎同时，哈佛医学院相关研究把大模型带进真实急诊诊断场景，麦肯锡对医疗机构的调研也显示，医疗行业对生成式 AI 和 Agent 的态度正在从观望转向试点与部署。

医疗 AI 的特殊之处在于，它不能只靠演示视频和榜单分数说服市场。医生、医院、药企、监管机构和患者都关心同一件事：模型能不能在信息不完整、风险很高、责任边界复杂的真实环境里稳定提供帮助。最新一批资讯共同指向一个趋势：医疗 AI 已经越过“能不能回答医学问题”的阶段，进入“如何接入临床流程、如何控制风险、如何证明价值”的阶段。

DeepMind把医疗放在AI主线

Demis Hassabis 在访谈中强调，AI 最好的用途之一是改善人类健康。这个表态背后，是 AlphaFold 已经预测几乎所有已知蛋白质结构并向研究者开放的现实基础。蛋白质结构预测曾经是生命科学中的高难任务，如今已经成为药物研发、疾病机制研究和基础生物学探索的重要工具。对医疗行业来说，这意味着 AI 的价值不只是替代某个岗位，而是把科研链条中原本昂贵、缓慢、依赖专家经验的环节重新组织起来。

这一点很关键。过去很多医疗 AI 项目容易陷入“单点工具”的局限：比如只做影像识别、只做病历摘要、只做问答助手。DeepMind 的思路更像是把 AI 放进生命科学基础设施里，让模型在蛋白质、基因、新材料和药物发现之间形成连续的研究能力。它不一定立刻出现在普通患者面前，却可能先改变实验室、药企和研究机构的工作方式。

急诊研究带来真实压力测试

哈佛医学院联合医疗机构发表在《Science》的研究，把 OpenAI o1 模型放进真实急诊诊断场景中测试。结果显示，在信息有限、病情复杂的急诊环境里，模型诊断准确率达到 67%，高于资深内科主治医生约 50% 到 55% 的水平。这个数字很容易引发“AI 超越医生”的讨论，但更准确的解读应该是：大模型在辅助初步判断、扩展诊断思路、提醒低频风险方面，已经具备相当强的参考价值。

急诊场景比普通医学问答更难。患者表达可能不完整，检查结果可能还没出来，医生需要在时间压力下做出判断。AI 在这里的意义不是独立开处方，而是帮助医生更快形成候选诊断清单，减少遗漏关键病因的概率。尤其是在基层医院、夜间值班、跨科室会诊等场景里，一个稳定的辅助系统可能显著改善决策质量。

医疗Agent开始进入机构预算

麦肯锡针对 150 位医疗领域高管的调研显示，约半数机构已经落地生成式 AI，几乎没有机构明确表示不考虑 AI Agent。这说明医疗行业虽然谨慎，但并不保守。医院和药企真正关心的是：AI 能不能减少文书负担、提高问诊效率、改善患者沟通、辅助科研设计，并在合规框架内留下可追溯记录。

Agent 的价值在医疗场景里尤其明显。单个聊天机器人只能回答问题，而医疗 Agent 可以连接病历系统、知识库、检查流程、排班系统和药物数据库，完成更长链条的任务。例如自动整理患者病史、提醒医生补充关键检查、生成随访计划、辅助研究团队筛选受试者。它更像一个流程协作者，而不是一个孤立的问答窗口。

落地难点不在模型本身

医疗 AI 真正难的地方，往往不在模型参数规模，而在数据、流程、责任和信任。医院数据高度敏感，跨系统调用困难；临床流程已经很拥挤，医生不愿为一个工具增加额外操作；一旦模型建议出错，责任如何划分也需要清晰制度。即便模型准确率很高，如果不能被医生顺手使用，不能被医院合规审计，不能被患者理解，它仍然很难形成规模化价值。

这也是为什么企业部署能力会变得越来越重要。OpenAI 成立面向企业落地的新公司，Anthropic 也在推进主动助手和企业工作流方向，本质上都是在回答同一个问题：模型能力如何变成组织内部可用、可管、可衡量的系统。医疗行业会是这类能力最严格的考场之一，因为它对安全性、隐私、稳定性和解释性的要求远高于普通办公场景。

产业机会从影像扩展到全流程

医疗 AI 最早被大众熟悉，往往是从影像识别开始。但现在机会已经明显扩展。药物研发端有蛋白质结构预测和分子设计，医院端有分诊、病历、影像、随访和医保审核，科研端有文献分析、实验设计和数据整理，患者端则有健康管理和慢病陪伴。不同环节对 AI 的要求并不相同，也会产生不同商业模式。

对创业公司和医疗机构来说，最现实的路径可能不是一开始就宣称“取代医生”，而是选择痛点清晰、责任边界相对明确、数据闭环容易建立的环节。例如病历质控、医生文书、影像初筛、临床试验匹配、药企研发辅助等，都比直接面向患者给出诊断更容易落地。一旦这些环节形成稳定 ROI，医疗 AI 才会逐步走向更深的临床辅助。

风险治理会决定信任边界

医疗 AI 越接近真实决策，风险治理就越重要。模型幻觉、数据偏差、过度自信、隐私泄露、误导性建议，都可能在医疗场景里放大后果。因此，医疗 AI 不能只追求回答漂亮，还要能说明依据、标注不确定性、保留操作日志，并在关键节点让专业人员确认。真正可靠的系统，应该知道什么时候回答，什么时候提醒需要医生判断，什么时候拒绝越权。

这也解释了为什么 AI 安全审计、模型内省、错误追踪等研究会和医疗 AI 同时升温。医疗行业不会接受一个黑箱系统直接接管诊疗流程，但可能接受一个可审计、可追责、可持续改进的辅助系统。未来医疗 AI 的竞争，很可能不是谁喊得更激进，而是谁能把准确率、合规性、工作流体验和责任边界同时做好。

AI应用进入更务实阶段

从 DeepMind 的生命科学愿景，到哈佛急诊研究的真实测试，再到医疗机构对 Agent 的预算态度，AI 应用正在进入更务实的阶段。市场不再只看模型能不能讲出医学知识，而是看它能不能降低误诊风险、减少医生负担、缩短研发周期、改善患者体验。医疗只是一个代表性场景，类似变化也会发生在法律、金融、教育和制造业。

与此同时，行业里仍有不少轻松但有代表性的动态：AI 游戏平台融资、AI 短漫剧工具商业化、儿童 AI 产品引发讨论、AI 编程工具继续抢开发者入口。这些应用看似离医疗很远，却共同说明一件事：AI 正在从通用聊天框拆分成具体行业、具体工作流和具体人群的产品。医疗 AI 的进展因此更值得关注，因为它既代表最高价值场景，也代表最严苛的落地标准。

接下来，医疗 AI 的关键问题不会是“模型会不会医学知识”，而是“谁能把医学知识安全地嵌入真实流程”。医生不会因为一个模型分数就交出判断权，医院也不会因为一次演示就重构系统。但如果 AI 能在急诊、科研、病历、影像和随访中持续证明自己，它就会从新技术变成医疗基础设施的一部分。

文章版权归作者所有，未经允许请勿转载。

THE END