国产算力跑通DeepSeek后训练,医疗AI和视频生成把竞争推向真实部署

DeepSeek-V4-Pro 全参数后训练被第三方团队在国产算力集群上跑通,是这批 AI 动态里最值得拆开的信号。它不像一次普通的模型发布,更像是在回答一个产业层面的关键问题:当模型越来越大、训练越来越贵、算力供应越来越受限时,大模型能力能不能在更多硬件体系上被复现、被优化、被持续迭代。

AI大模型后训练算力基础设施与GPU服务器集群
DeepSeek-V4-Pro 后训练跑通国产算力后,AI竞争正从模型发布走向训练框架、算力适配和真实部署。

这条消息和单机降服万亿巨模的 RL 后训练框架 Orbit、医学 AI 智能体 Ophiuchus-7B、德适 AI AutoVision 获批三类医疗器械、快手与港大视频生成加速框架 SURF 等进展放在一起看,会发现 AI 行业正在从“谁的模型参数更强”进入“谁能把训练、部署和专业场景真正跑通”的阶段。模型能力仍然重要,但更关键的是算力适配、训练效率、监管验证和真实业务价值。

国产算力进入后训练现场

深圳河套学院等团队联合华为,基于昇腾 910C 国产算力集群,完成 DeepSeek-V4-Pro 全参数后训练,并披露 MFU 稳定达到 34.9%,关键算子效率提升 14%。这件事的重点不是简单证明某个模型“能跑”,而是证明后训练这样的关键环节开始具备跨硬件体系落地的可能。对大模型产业来说,后训练决定模型能否更好对齐任务、工具、行业数据和安全要求,是模型从通用能力走向可用产品的核心工序。

过去很多企业谈国产算力,容易停留在替代采购或政策合规层面。但真正难的是工程细节:算子是否高效、训练是否稳定、通信是否顺畅、框架是否适配、模型质量是否能保持。DeepSeek-V4-Pro 这样的模型被第三方跑通全参数后训练,说明生态正在进入更硬的验证阶段。它不是 PPT 里的国产化,而是把模型、芯片、框架、集群调度和训练流程放到同一个压力场里测试。

这对企业用户也有现实意义。大模型应用越深入业务,越不能完全依赖单一供应链或单一云环境。金融、政务、制造、医疗、能源等行业往往对数据边界、部署环境和成本可控性有更高要求。如果后训练和推理能够在更多算力体系上稳定运行,企业就有机会在模型能力、部署位置、成本结构和合规要求之间做更灵活的组合,而不是被一种硬件或一个云平台锁死。

训练效率开始决定竞争半径

Sphere AI Lab 开源的 Orbit 框架,则把另一个问题推到台前:万亿参数模型的强化学习后训练能不能更便宜、更轻量地完成。它通过冻结低精度 base、只训练 adapter 的方式,让单台 8×B200 服务器完成万亿参数大模型的 RL 后训练,并试图解决训练和推理精度不一致的问题。这个方向很重要,因为强化学习后训练正在成为提升模型推理、工具调用、代码能力和复杂任务表现的关键方法。

如果每一次强化学习后训练都必须依赖庞大集群和极高预算,只有少数头部公司能够持续迭代,整个生态就会越来越集中。Orbit 这类框架的价值,在于把一部分训练门槛向下拉,让更多研究团队、垂直创业公司和企业实验室有机会围绕自己的任务数据做后训练。它未必立刻改变头部模型格局,但会扩大“能动手优化模型”的参与者范围。

训练效率的提升还会改变产品迭代节奏。企业真正落地 AI 时,往往不是一次性选定模型就结束,而是需要根据客服语料、代码仓库、医学影像、工业流程、内部知识库持续调整。后训练成本越低,迭代越频繁,模型越容易贴近真实场景。反过来,如果每次优化都昂贵且周期漫长,很多 AI 项目就会停在试点,难以进入规模化部署。

医疗 AI 走向可验证能力

医学 AI 也出现了更具体的突破。上海创智学院 LeapQuest 团队联合多校提出 think with images/videos 新范式,推出 Ophiuchus-7B 和 MedScope,称 7B 模型在医学任务中超过 OpenAI-o3 和 GPT-5。这个信息值得关注的地方,是小模型在专业场景中通过方法设计和数据组织获得强表现,而不是简单依靠更大的通用模型堆参数。

医疗场景对 AI 的要求天然更苛刻。医生和患者真正需要的不是“回答听起来专业”,而是模型能否知道该看哪里、怎样看、如何结合图像与视频证据形成判断。think with images/videos 的方向,正是让模型在医学影像和动态材料里建立更接近临床思维的观察路径。它提醒行业:专业 AI 的竞争不一定总是最大模型胜出,关键在于模型是否围绕任务结构重新设计。

德适研发的 AI AutoVision 染色体核型辅助诊断软件获得国家药监局第三类医疗器械注册证,则提供了另一种“可验证”的信号。医疗 AI 进入监管审批,意味着产品不只要在论文或演示中表现好,还要接受安全性、有效性、质量体系和临床应用边界的检验。对行业来说,这比单纯发布模型更接近商业化终点,因为只有过了合规和临床流程,AI 才能真正进入医院的日常工作。

这也解释了为什么医疗 AI 的商业化节奏看起来慢,但一旦跑通可能更有壁垒。模型参数、榜单成绩和体验 Demo 都可以快速更新,监管证照、临床数据、医院流程和医生信任却需要长期积累。未来医疗 AI 的竞争,很可能不只是模型公司之间的竞争,而是模型能力、医疗器械资质、医院渠道、专业数据和责任边界的综合竞争。

视频与多模态进入生产效率战

视频生成方向也在补工程短板。香港大学与快手可灵团队提出高分辨率视频生成加速框架 SURF,通过分阶段处理保留原模型生成质量,最高实现约 43 倍加速,并兼容多种基础模型。视频生成过去最容易被用户感知的问题,就是等待时间长、成本高、改一次太慢。只要速度上不去,创作者就很难像剪辑软件一样频繁试错。

SURF 的价值在于把高分辨率视频生成从“能生成”推向“能迭代”。对影视、广告、短剧、游戏素材和电商内容来说,生成质量只是第一步,真正的生产流程需要反复修改镜头、节奏、构图和细节。加速十几倍甚至几十倍,意味着创作者可以在同样时间里尝试更多版本,团队也更容易把 AI 视频纳入正常制作管线,而不是把它当成一次性炫技工具。

类似的趋势也出现在视觉设计和 3D 编辑领域。腾讯创意智能体 Miora 可以用一句话生成整套视觉方案,北大、港中文和上海 AI Lab 的 VGGT-Edit 将 3D 场景编辑提速到秒级。它们共同说明,多模态 AI 竞争正在从单点生成走向工作台化:用户不只想得到一张图、一段视频或一个模型,而是想在同一个流程里生成、修改、比较、复用并交付。

硬件和机器人补上落地想象

除了训练和软件,硬件端也在继续升温。星尘智能发布起售价 8.99 万元的人形机器人 T1,计划覆盖五大应用场景,并称今年产能可达上万台。这类消息的意义不在于人形机器人立刻进入每个家庭,而是价格和交付周期正在往更可讨论的区间靠近。当机器人从高价实验设备变成可批量交付的产品,具身智能才有更多真实数据和场景反馈。

机器人行业过去常被演示视频带节奏,但真正落地要看成本、耐用性、安全性、任务稳定度和售后体系。低价并不自动等于成熟,可它会推动更多场景试用,带来更多数据闭环。仓储、巡检、展厅、教育、轻服务业和科研机构可能会成为早期试验场,它们对通用智能的要求不完全相同,却都会考验机器人能否把感知、决策和执行稳定串起来。

与此同时,科大讯飞、蚂蚁等厂商推进 AI 眼镜,说明 AI 入口也在向随身设备延伸。眼镜、机器人、车载设备和手机端模型,本质上都在争夺同一件事:让 AI 从云端聊天框走进用户的物理现场。大模型如果只停留在网页里,它处理的是信息;当它进入硬件,它还要处理环境、传感器、动作和人的即时需求。

AI 竞争回到系统能力

把这些消息连起来看,AI 行业的主线正在变得更务实。DeepSeek-V4-Pro 后训练跑通国产算力,Orbit 降低万亿模型 RL 后训练门槛,医学 AI 强调图像视频推理和监管获批,视频生成框架追求高质量提速,机器人和眼镜寻找现场入口。它们都不只是单个模型能力展示,而是在把 AI 推向系统能力:能训练、能适配、能验证、能部署、能持续迭代。

这对普通用户和企业用户都有影响。普通用户会看到 AI 产品越来越贴近具体工具,比如编程、翻译、视频、健康管理、购物和办公;企业用户则会更关心底层能力是否可控,模型能否在自己的环境里优化,成本是否可持续,结果是否能被审计。AI 的下一步竞争,不会只靠一次发布会或一个榜单分出胜负,而要靠长期工程能力和场景交付。

如果说上一阶段的关键词是“模型变聪明”,现在更准确的关键词应该是“聪明如何被使用”。能把大模型放进国产算力、专业医疗、视频生产、机器人硬件和企业系统里的团队,会比只会展示参数的团队更接近商业价值。AI 行业没有降温,只是从热闹的能力展示,走向更难也更真实的基础设施和应用深水区。

© 版权声明
THE END
喜欢就支持一下吧
点赞12 分享