Claude 锁定 AWS 算力，OpenAI 加码企业部署：AI 竞争正在从模型走向基础设施和工作流-速维云

Claude 的主动助手 Orbit 泄露、亚马逊为 Claude 锁定 5GW 算力、OpenAI 把企业部署单独做成公司，几条消息连在一起看，AI 竞争的重心正在发生明显转移：模型本身仍然重要，但真正决定下一阶段胜负的，开始变成算力长约、企业系统交付、主动工作流入口，以及能不能把大模型稳定放进真实业务里。

大模型竞争正在从单点模型能力延伸到云基础设施、算力调度和企业级交付。

Claude 走向主动工作流

testingcatalog 在 Anthropic 客户端中发现了尚未正式发布的主动助手 Orbit。它被描述为可以从 Gmail、Slack、GitHub 等工具中自动提取信息，再生成个性化工作简报的产品形态。这个方向和传统聊天机器人最大的不同，是它不再只等待用户输入问题，而是尝试提前理解用户的工作上下文，把散落在邮件、协作工具和代码平台里的信息整理成可行动的提示。

如果 Orbit 最终按类似形态推出，Claude 的定位就会从“回答问题的模型”进一步靠近“工作台里的协作者”。对企业用户来说，真正有价值的并不是让 AI 多写几段文字，而是让它知道今天有哪些项目变更、哪些邮件需要回应、哪些代码提交会影响发布节奏。主动助手的难点也在这里：它需要连接更多工具，需要处理权限边界，还要避免把噪声包装成提醒，打扰用户正常工作。

算力长约成为大模型底盘

Anthropic 与亚马逊签署十年期 AWS 算力协议，规模达到千亿美元级别，并锁定 5GW 算力用于 Claude 的训练和部署。与此同时，亚马逊对 Anthropic 的总投资最高可达 330 亿美元。这个信号很直接：头部模型公司的竞争，已经不是临时采购 GPU 或抢一批服务器就能解决，而是要把未来多年的基础设施提前绑定。

5GW 级别算力背后，代表的是数据中心、电力、芯片供应、网络互联和云平台调度能力的综合竞争。模型训练需要大规模集群，推理服务则需要更靠近用户、更稳定、更便宜的部署体系。谁能拿到长期、稳定、可扩展的云基础设施，谁就更容易支撑模型迭代、企业 SLA 和全球化服务。Claude 这次锁定 AWS，也让亚马逊在大模型基础设施牌桌上进一步站到台前。

企业部署不再只是接口调用

OpenAI 联合多家投资机构成立 The Deployment Company，融资规模超过 40 亿美元，估值约 100 亿美元，目标是帮助企业把 AI 接入自身业务系统，覆盖超过 2000 家企业客户。这个动作说明，企业 AI 的主战场并不只在模型 API 上，而是在模型进入内部流程之后的部署、权限、数据、审计、稳定性和组织协同。

很多企业已经验证过单点 AI 能力，但真正落地时会遇到更多工程问题：谁能访问哪些数据，输出结果如何留痕，模型调用如何计费，业务系统怎样改造，员工如何在现有工作流里使用 AI。The Deployment Company 的价值，正是把“模型能力”翻译成“企业可用的业务系统”。这也意味着下一阶段 AI 公司的竞争会更像云服务、咨询交付和软件平台的综合战，而不是单纯发布一个更强的模型。

长上下文与推理效率继续升温

Subquadratic 发布首个 1200 万 token 上下文模型 SubQ，基于新的 SSA 架构，在 100 万 token 场景中速度提升显著，成本仅为 Opus 的一小部分。长上下文一直被视为企业应用和复杂 Agent 的关键能力，因为真实业务资料往往不是几段短文本，而是大量合同、代码库、会议纪要、知识库和历史工单。

另一边，谷歌为 Gemma 4 推出 Multi-Token Prediction 推测解码架构，在不改变模型、不降低输出质量的情况下，让推理速度最高提升 3 倍，并按 Apache 2.0 协议开源。长上下文解决“看得多”的问题，推理提速解决“用得起、等得起”的问题。两条线合在一起，说明大模型竞争已经进入工程细节阶段：模型参数之外，架构、解码、缓存、部署和成本控制都在成为核心变量。

多模态生成开始拼价格和体验

Luma 开放统一图像模型 Uni-1.1 API，在 LMArena 图像生成榜单位列前列，并强调价格与延迟低于同类模型一半，文字渲染能力接近 GPT image 2。图像生成模型过去主要比画质、风格和提示词理解，现在 API 开放、延迟降低和价格下探，会让更多产品把图像能力嵌入实际流程里。

字节跳动开源多模态模型 Mamoda2.5，采用 MoE 与 DiT 架构，仅激活部分参数，却支持文生图、文生视频和视频编辑等任务，性能接近闭源产品。阿里也开源 PromptEcho，用冻结多模态大模型为文生图训练提供奖励信号。可以看到，多模态不再只是几个大厂封闭模型之间的较量，开源方法、训练奖励、推理成本和 API 生态都会影响开发者最终选择。

Agent 从电脑走向多端协同

TRAE SOLO 移动端和 Windows 桌面端上线，网页端、桌面端、移动端三端协同开放，支持语音讨论、飞书 CLI 接入、定时任务和多端任务处理。这类产品的意义在于把 Agent 从单一网页或 IDE 里解放出来，让用户可以在手机上发起任务，在桌面端跟进结果，再通过协作工具接入团队流程。

中国 4 人团队发布的开源项目 Multica，则把重点放在多 AI agent 协作层，支持人和多个 agent 一起完成任务，并已经获得大量 GitHub 关注。随着单个 Agent 能力变强，真正复杂的工作往往需要多个模型、多个工具和人类决策共同参与。编排层、协作层和任务状态管理，会成为 Agent 产品能否进入生产环境的关键。

机器人、医疗与娱乐应用继续扩散

AI 应用端也在快速扩散。Google DeepMind CEO Demis Hassabis 在访谈中强调，AI 最好的用途之一是改善人类健康，AlphaFold 已预测几乎所有已知蛋白质结构并免费开放，正在加速药物研发，并推动 AI 在基因研究、新材料等领域继续应用。医疗和科学发现仍然是 AI 最容易产生长期社会价值的方向之一。

机器人领域同样热闹。RoboScience 机器科学完成 10 亿元融资，将用于强化 VLOA 大模型和机器人本体；软银计划组建 Roze AI，用自主机器人协助建造数据中心；具身智能研究也开始强调触觉数据的重要性。娱乐侧，李飞飞联创的 Astrocade 完成 5600 万美元融资，试图让用户用自然语言快速生成可玩游戏。这些案例说明，AI 正从文本与代码工具，继续向医疗、机器人、游戏和内容创作等更复杂场景渗透。

商业化也带来新的分裂

OpenAI 向美国企业全量上线 ChatGPT 广告主平台，免费用户会看到广告，付费及未成年用户不会。这意味着 AI 产品的商业化路径正在分化：一部分用户通过订阅购买更干净、更稳定的体验，另一部分免费入口则可能逐步引入广告、推荐和商业内容。对于拥有巨大周活用户的产品来说，广告是变现捷径，但也会带来信任和体验上的新问题。

与此同时，围绕 OpenAI 的诉讼和内部历史也继续吸引关注，马斯克诉 OpenAI 案中，Brockman 的私人日记被公开，案件结果可能影响 OpenAI 的治理和资本计划。这些花边看似离技术较远，却反映出头部 AI 公司已经成为资本、监管、商业模式和公众舆论共同关注的对象。AI 行业不再只是实验室里的模型竞赛，而是一场横跨基础设施、企业软件、消费者产品和资本市场的长期竞争。