Qwen 3.7 Max 预览版亮相，国产模型竞赛延伸到GPU、Agent和电力基础设施-速维云

阿里通义千问推出 Qwen 3.7 系列预览模型，把国产大模型的节奏再次推快：文本与视觉能力继续冲榜，超大杯模型并行迭代，更新周期压到两三个月一个大版本。这个消息之所以值得放在最前面，不只是因为模型本身又强了一截，而是它和同日出现的国产 GPU 具身智能仿真平台、AMD 中国开发者大会、AI 云市场份额、电力并购与数据中心能源融资连在一起，勾出了一条更清晰的主线：AI 竞争已经不再是单个模型参数或榜单名次的较量，而是模型、算力、云、Agent、能源和真实交付能力的系统战。

这也是最近 AI 行业变化最明显的地方。模型厂商仍在发布更快、更强、更便宜的新版本，但真正影响企业和开发者决策的，往往是模型能不能稳定接入工作流、有没有足够算力支撑、调用成本能不能压下来、数据中心电力是否跟得上，以及 Agent 是否能从演示走向可靠交付。Qwen 3.7、摩尔线程 MT Lambda、AMD ROCm、阿里云 AI 云份额、NextEra 收购 Dominion、Agent Harness 综述和 RaaS 商业模式，表面看分散，放在一起看，其实都指向同一件事：AI 正在从“会回答问题”走向“能承担生产任务”。

Qwen 3.7 提速

Qwen 3.7 系列两款预览模型的亮相，延续了通义千问近一段时间的高频迭代策略。文本、视觉领域在 Arena 榜单上取得国产模型领先位置，只是外部可见的结果；更关键的是，Qwen3 系列之后的迭代被压缩到每两三个月一个大版本，这意味着模型研发已经进入持续工程化冲刺阶段，而不是靠一年一两次大发布维持声量。

对国内 AI 生态来说，这种节奏会直接改变开发者和企业的选型方式。过去很多团队担心国产模型能力追赶不稳定，需要在成本、效果和可控性之间反复权衡；现在如果模型能力持续刷新，且文本、视觉、多模态能力同步增强，更多应用就有机会把国产模型纳入主力方案。尤其是企业知识库、智能客服、办公助手、内容生产、视觉理解和 Agent 调用场景，模型更新越快，上层产品就越需要建立可替换、可评测、可回滚的接入架构。

国产 GPU 走向具身智能

摩尔线程发布的 MT Lambda 全栈国产具身智能仿真平台，是另一条重要线索。它打通“大模型训练—仿真模拟—端侧部署”链路，仿真吞吐效率提升约 30 倍，物理参数仿真准确度达到 99% 以上，并展示机器狗从仿真训练迁移到真实物理世界执行复杂动作。这类平台的意义，不只在于让机器人训练更快，而是在国产 GPU、仿真环境、端侧部署之间建立闭环。

具身智能的瓶颈一直不只是模型，也包括数据、仿真、传感器、执行器和部署成本。鲸跃动力拿到种子轮融资，主打“数据+模型+末端执行”的 Robo Labor；地平线前高管创办空间智能公司；多家机器人公司围绕通用具身大脑继续融资，这些消息放在一起说明，行业正在把机器人从科研演示推向工业、物流和高危重复作业。未来谁能更快形成可复用的仿真数据、训练平台和真实场景验证，谁就更容易把机器人能力变成标准化服务。

算力与电力成为底座

AMD 在中国举办 AI 开发者大会，苏姿丰带队展示 ROCm 与开源生态，并强调上海研发中心的重要性，这说明 GPU 生态竞争已经不只是硬件规格，而是开发工具链、框架兼容、生态合作和本地开发者支持的综合战。NVIDIA 仍然强势，但当 AI 工作负载越来越多样化，云厂商、模型厂商和企业客户都会关注替代算力方案是否能真正跑起来、跑得稳、跑得省。

更底层的变化发生在能源侧。NextEra Energy 以 670 亿美元收购 Dominion Energy，被视为 AI 数据中心电力需求爆发推动的公用事业巨额并购。能量桥科技融资研发预制化超导能源模块，目标是让数据中心输电损耗进一步降低。过去谈 AI 基础设施，重点常常是 GPU、网络和存储；现在电力容量、输电效率、园区选址和长期能源合同正在成为同等重要的约束。模型越大、调用越多、Agent 越常驻，电力就越像 AI 产业的“隐形参数”。

Agent 从工具变成岗位

Agent 方向同样出现了明显分化。一边是 Agent Harness Engineering 综述把执行环境、工具调用、上下文管理、观察、验证、记忆等环节拆成工程层，指出不改模型只优化 Harness 也可能带来数量级提升；另一边，企业开始把 AI 员工、RaaS 和带 SLA 的劳动合同作为商业包装，试图把 AI 从“按 token 计费”推进到“按结果交付”。

这对企业客户很现实。过去买 AI 服务，常见问题是模型看起来很强，但接进业务系统后不稳定、权限边界不清、输出难验收、出错责任难定义。现在 Sierra、零犀科技、Lucius 等公司探索按结果收费或按 Action 定价，本质是在把 AI 能力包装成可度量的业务单元。它要求模型足够强，也要求系统具备日志、权限、回滚、监控、评测和人工接管机制。没有这些底盘工程，Agent 很容易停留在演示阶段。

模型研究继续降本

底层模型研究也没有停。LLM 架构优化从 Gemma、Poolside、Zyphra 到 DeepSeek V4，围绕 KV 共享、压缩注意力、分层 Attention 预算等方向降低长上下文推理成本。DeepSeek V4 在 1M 上下文下把 FLOPs 压到更低水平，说明长上下文不再只是“能塞多少 token”，而是要解决存储、计算、速度和稳定性的综合成本。

伯克利等机构提出的 FST 快慢训练框架，尝试缓解持续学习中的灾难性遗忘；京东与中科院信工所提出 Self-Taught RLVR，让模型“自己教自己”；港中大、浙大关于 Agent 记忆的论文则提醒行业，当前很多 RAG 和向量存储并不等于真正记忆，只是更高级的备忘录。它们共同指向一个问题：模型要承担长期任务，就必须具备更可靠的学习、记忆和自我修正能力，否则 Agent 用久了反而可能越来越笨。

应用端继续扩散

应用层的热闹同样值得关注。ChatGPT Images 2.0 在印度 27 天生成超过 10 亿张图片，说明 AI 生图正在从创作者工具变成日常视觉表达方式；腾讯“吐司”让用户用自然语言生成 App，继续降低软件开发门槛；微信读书 Skill 把阅读痕迹变成可问答的知识索引，让个人数据从静态记录变成可调用资产。这些应用未必都能马上形成稳定商业模式，但它们会持续改变用户对软件的预期。

企业端则更看重可交付价值。阿里云在中国 AI 云市场占比 38.1%，显示云基础设施仍是模型落地的重要入口；Cursor 推出 Composer 2.5，用更低成本追赶高端编码模型体验；AnySearch 为 Agent 打通更多专业数据源，试图解决通用搜索覆盖不足的问题。未来 AI 应用竞争，很可能不再是谁单点功能最炫，而是谁能把模型、数据、权限、工具和成本整合成稳定工作流。

几个轻量信号

除了硬新闻，还有几条轻量但很能反映行业情绪的消息。世界模型 Agora-1 已经能多人联机玩 FPS 游戏，说明生成式世界不再只是单人探索视频，而开始尝试实时互动；TapNow 举办 36 小时 AI 动画黑客松，把动画制作周期从一年压缩到极短时间，虽然商业质量仍需验证，但创作流程正在被重写。

OpenAI 与马斯克诉讼的阶段性结果、Palantir 高管对大模型的尖锐表态、深圳 AI 硬件的疯狂试验，也都说明 AI 已经进入更复杂的社会阶段：有资本博弈，有路线争论，有硬件泡沫，也有真实需求。真正值得关注的不是哪家公司一句话最响，而是谁能在模型能力、工程底盘、商业交付和成本控制之间找到平衡。

行业进入系统战

综合来看，Qwen 3.7 的快速迭代是这批资讯里最醒目的模型信号，但它背后的变化更大：国产模型在提速，国产 GPU 与仿真平台在补链，云厂商在争夺 AI 入口，能源公司被数据中心需求推上牌桌，Agent 公司开始把“智能”包装成带责任边界的劳动服务。AI 竞争已经从单模型能力，扩展到从芯片到应用、从电力到工作流的全链路较量。

对普通企业和开发者来说，接下来更重要的不是追每一个榜单第一，而是建立可持续的 AI 技术栈：模型要能替换，数据要能治理，成本要能预测，输出要能验证，权限要能控制。谁能把这些基础能力搭好，谁就更容易在下一轮 AI 应用落地中吃到红利。AI 的故事还在继续，但主角已经不只是模型，而是围绕模型运转的整个系统。

文章版权归作者所有，未经允许请勿转载。

THE END