Qwen 3.7 Max 预览版亮相,国产模型竞赛延伸到GPU、Agent和电力基础设施

阿里通义千问推出 Qwen 3.7 系列预览模型,把国产大模型的节奏再次推快:文本与视觉能力继续冲榜,超大杯模型并行迭代,更新周期压到两三个月一个大版本。这个消息之所以值得放在最前面,不只是因为模型本身又强了一截,而是它和同日出现的国产 GPU 具身智能仿真平台、AMD 中国开发者大会、AI 云市场份额、电力并购与数据中心能源融资连在一起,勾出了一条更清晰的主线:AI 竞争已经不再是单个模型参数或榜单名次的较量,而是模型、算力、云、Agent、能源和真实交付能力的系统战。

Qwen 3.7 Max 预览版亮相,国产模型竞赛延伸到GPU、Agent和电力基础设施

这也是最近 AI 行业变化最明显的地方。模型厂商仍在发布更快、更强、更便宜的新版本,但真正影响企业和开发者决策的,往往是模型能不能稳定接入工作流、有没有足够算力支撑、调用成本能不能压下来、数据中心电力是否跟得上,以及 Agent 是否能从演示走向可靠交付。Qwen 3.7、摩尔线程 MT Lambda、AMD ROCm、阿里云 AI 云份额、NextEra 收购 Dominion、Agent Harness 综述和 RaaS 商业模式,表面看分散,放在一起看,其实都指向同一件事:AI 正在从“会回答问题”走向“能承担生产任务”。

Qwen 3.7 提速

Qwen 3.7 系列两款预览模型的亮相,延续了通义千问近一段时间的高频迭代策略。文本、视觉领域在 Arena 榜单上取得国产模型领先位置,只是外部可见的结果;更关键的是,Qwen3 系列之后的迭代被压缩到每两三个月一个大版本,这意味着模型研发已经进入持续工程化冲刺阶段,而不是靠一年一两次大发布维持声量。

对国内 AI 生态来说,这种节奏会直接改变开发者和企业的选型方式。过去很多团队担心国产模型能力追赶不稳定,需要在成本、效果和可控性之间反复权衡;现在如果模型能力持续刷新,且文本、视觉、多模态能力同步增强,更多应用就有机会把国产模型纳入主力方案。尤其是企业知识库、智能客服、办公助手、内容生产、视觉理解和 Agent 调用场景,模型更新越快,上层产品就越需要建立可替换、可评测、可回滚的接入架构。

国产 GPU 走向具身智能

摩尔线程发布的 MT Lambda 全栈国产具身智能仿真平台,是另一条重要线索。它打通“大模型训练—仿真模拟—端侧部署”链路,仿真吞吐效率提升约 30 倍,物理参数仿真准确度达到 99% 以上,并展示机器狗从仿真训练迁移到真实物理世界执行复杂动作。这类平台的意义,不只在于让机器人训练更快,而是在国产 GPU、仿真环境、端侧部署之间建立闭环。

具身智能的瓶颈一直不只是模型,也包括数据、仿真、传感器、执行器和部署成本。鲸跃动力拿到种子轮融资,主打“数据+模型+末端执行”的 Robo Labor;地平线前高管创办空间智能公司;多家机器人公司围绕通用具身大脑继续融资,这些消息放在一起说明,行业正在把机器人从科研演示推向工业、物流和高危重复作业。未来谁能更快形成可复用的仿真数据、训练平台和真实场景验证,谁就更容易把机器人能力变成标准化服务。

算力与电力成为底座

AMD 在中国举办 AI 开发者大会,苏姿丰带队展示 ROCm 与开源生态,并强调上海研发中心的重要性,这说明 GPU 生态竞争已经不只是硬件规格,而是开发工具链、框架兼容、生态合作和本地开发者支持的综合战。NVIDIA 仍然强势,但当 AI 工作负载越来越多样化,云厂商、模型厂商和企业客户都会关注替代算力方案是否能真正跑起来、跑得稳、跑得省。

更底层的变化发生在能源侧。NextEra Energy 以 670 亿美元收购 Dominion Energy,被视为 AI 数据中心电力需求爆发推动的公用事业巨额并购。能量桥科技融资研发预制化超导能源模块,目标是让数据中心输电损耗进一步降低。过去谈 AI 基础设施,重点常常是 GPU、网络和存储;现在电力容量、输电效率、园区选址和长期能源合同正在成为同等重要的约束。模型越大、调用越多、Agent 越常驻,电力就越像 AI 产业的“隐形参数”。

Agent 从工具变成岗位

Agent 方向同样出现了明显分化。一边是 Agent Harness Engineering 综述把执行环境、工具调用、上下文管理、观察、验证、记忆等环节拆成工程层,指出不改模型只优化 Harness 也可能带来数量级提升;另一边,企业开始把 AI 员工、RaaS 和带 SLA 的劳动合同作为商业包装,试图把 AI 从“按 token 计费”推进到“按结果交付”。

这对企业客户很现实。过去买 AI 服务,常见问题是模型看起来很强,但接进业务系统后不稳定、权限边界不清、输出难验收、出错责任难定义。现在 Sierra、零犀科技、Lucius 等公司探索按结果收费或按 Action 定价,本质是在把 AI 能力包装成可度量的业务单元。它要求模型足够强,也要求系统具备日志、权限、回滚、监控、评测和人工接管机制。没有这些底盘工程,Agent 很容易停留在演示阶段。

模型研究继续降本

底层模型研究也没有停。LLM 架构优化从 Gemma、Poolside、Zyphra 到 DeepSeek V4,围绕 KV 共享、压缩注意力、分层 Attention 预算等方向降低长上下文推理成本。DeepSeek V4 在 1M 上下文下把 FLOPs 压到更低水平,说明长上下文不再只是“能塞多少 token”,而是要解决存储、计算、速度和稳定性的综合成本。

伯克利等机构提出的 FST 快慢训练框架,尝试缓解持续学习中的灾难性遗忘;京东与中科院信工所提出 Self-Taught RLVR,让模型“自己教自己”;港中大、浙大关于 Agent 记忆的论文则提醒行业,当前很多 RAG 和向量存储并不等于真正记忆,只是更高级的备忘录。它们共同指向一个问题:模型要承担长期任务,就必须具备更可靠的学习、记忆和自我修正能力,否则 Agent 用久了反而可能越来越笨。

应用端继续扩散

应用层的热闹同样值得关注。ChatGPT Images 2.0 在印度 27 天生成超过 10 亿张图片,说明 AI 生图正在从创作者工具变成日常视觉表达方式;腾讯“吐司”让用户用自然语言生成 App,继续降低软件开发门槛;微信读书 Skill 把阅读痕迹变成可问答的知识索引,让个人数据从静态记录变成可调用资产。这些应用未必都能马上形成稳定商业模式,但它们会持续改变用户对软件的预期。

企业端则更看重可交付价值。阿里云在中国 AI 云市场占比 38.1%,显示云基础设施仍是模型落地的重要入口;Cursor 推出 Composer 2.5,用更低成本追赶高端编码模型体验;AnySearch 为 Agent 打通更多专业数据源,试图解决通用搜索覆盖不足的问题。未来 AI 应用竞争,很可能不再是谁单点功能最炫,而是谁能把模型、数据、权限、工具和成本整合成稳定工作流。

几个轻量信号

除了硬新闻,还有几条轻量但很能反映行业情绪的消息。世界模型 Agora-1 已经能多人联机玩 FPS 游戏,说明生成式世界不再只是单人探索视频,而开始尝试实时互动;TapNow 举办 36 小时 AI 动画黑客松,把动画制作周期从一年压缩到极短时间,虽然商业质量仍需验证,但创作流程正在被重写。

OpenAI 与马斯克诉讼的阶段性结果、Palantir 高管对大模型的尖锐表态、深圳 AI 硬件的疯狂试验,也都说明 AI 已经进入更复杂的社会阶段:有资本博弈,有路线争论,有硬件泡沫,也有真实需求。真正值得关注的不是哪家公司一句话最响,而是谁能在模型能力、工程底盘、商业交付和成本控制之间找到平衡。

行业进入系统战

综合来看,Qwen 3.7 的快速迭代是这批资讯里最醒目的模型信号,但它背后的变化更大:国产模型在提速,国产 GPU 与仿真平台在补链,云厂商在争夺 AI 入口,能源公司被数据中心需求推上牌桌,Agent 公司开始把“智能”包装成带责任边界的劳动服务。AI 竞争已经从单模型能力,扩展到从芯片到应用、从电力到工作流的全链路较量。

对普通企业和开发者来说,接下来更重要的不是追每一个榜单第一,而是建立可持续的 AI 技术栈:模型要能替换,数据要能治理,成本要能预测,输出要能验证,权限要能控制。谁能把这些基础能力搭好,谁就更容易在下一轮 AI 应用落地中吃到红利。AI 的故事还在继续,但主角已经不只是模型,而是围绕模型运转的整个系统。

© 版权声明
THE END
喜欢就支持一下吧
点赞8 分享
评论 抢沙发

请登录后发表评论

    暂无评论内容