Claude 锁定 AWS 算力,OpenAI 加码企业部署:AI 竞争正在从模型走向基础设施和工作流

Claude 的主动助手 Orbit 泄露、亚马逊为 Claude 锁定 5GW 算力、OpenAI 把企业部署单独做成公司,几条消息连在一起看,AI 竞争的重心正在发生明显转移:模型本身仍然重要,但真正决定下一阶段胜负的,开始变成算力长约、企业系统交付、主动工作流入口,以及能不能把大模型稳定放进真实业务里。

云基础设施和AI算力芯片支撑大模型服务
大模型竞争正在从单点模型能力延伸到云基础设施、算力调度和企业级交付。

Claude 走向主动工作流

testingcatalog 在 Anthropic 客户端中发现了尚未正式发布的主动助手 Orbit。它被描述为可以从 Gmail、Slack、GitHub 等工具中自动提取信息,再生成个性化工作简报的产品形态。这个方向和传统聊天机器人最大的不同,是它不再只等待用户输入问题,而是尝试提前理解用户的工作上下文,把散落在邮件、协作工具和代码平台里的信息整理成可行动的提示。

如果 Orbit 最终按类似形态推出,Claude 的定位就会从“回答问题的模型”进一步靠近“工作台里的协作者”。对企业用户来说,真正有价值的并不是让 AI 多写几段文字,而是让它知道今天有哪些项目变更、哪些邮件需要回应、哪些代码提交会影响发布节奏。主动助手的难点也在这里:它需要连接更多工具,需要处理权限边界,还要避免把噪声包装成提醒,打扰用户正常工作。

算力长约成为大模型底盘

Anthropic 与亚马逊签署十年期 AWS 算力协议,规模达到千亿美元级别,并锁定 5GW 算力用于 Claude 的训练和部署。与此同时,亚马逊对 Anthropic 的总投资最高可达 330 亿美元。这个信号很直接:头部模型公司的竞争,已经不是临时采购 GPU 或抢一批服务器就能解决,而是要把未来多年的基础设施提前绑定。

5GW 级别算力背后,代表的是数据中心、电力、芯片供应、网络互联和云平台调度能力的综合竞争。模型训练需要大规模集群,推理服务则需要更靠近用户、更稳定、更便宜的部署体系。谁能拿到长期、稳定、可扩展的云基础设施,谁就更容易支撑模型迭代、企业 SLA 和全球化服务。Claude 这次锁定 AWS,也让亚马逊在大模型基础设施牌桌上进一步站到台前。

企业部署不再只是接口调用

OpenAI 联合多家投资机构成立 The Deployment Company,融资规模超过 40 亿美元,估值约 100 亿美元,目标是帮助企业把 AI 接入自身业务系统,覆盖超过 2000 家企业客户。这个动作说明,企业 AI 的主战场并不只在模型 API 上,而是在模型进入内部流程之后的部署、权限、数据、审计、稳定性和组织协同。

很多企业已经验证过单点 AI 能力,但真正落地时会遇到更多工程问题:谁能访问哪些数据,输出结果如何留痕,模型调用如何计费,业务系统怎样改造,员工如何在现有工作流里使用 AI。The Deployment Company 的价值,正是把“模型能力”翻译成“企业可用的业务系统”。这也意味着下一阶段 AI 公司的竞争会更像云服务、咨询交付和软件平台的综合战,而不是单纯发布一个更强的模型。

长上下文与推理效率继续升温

Subquadratic 发布首个 1200 万 token 上下文模型 SubQ,基于新的 SSA 架构,在 100 万 token 场景中速度提升显著,成本仅为 Opus 的一小部分。长上下文一直被视为企业应用和复杂 Agent 的关键能力,因为真实业务资料往往不是几段短文本,而是大量合同、代码库、会议纪要、知识库和历史工单。

另一边,谷歌为 Gemma 4 推出 Multi-Token Prediction 推测解码架构,在不改变模型、不降低输出质量的情况下,让推理速度最高提升 3 倍,并按 Apache 2.0 协议开源。长上下文解决“看得多”的问题,推理提速解决“用得起、等得起”的问题。两条线合在一起,说明大模型竞争已经进入工程细节阶段:模型参数之外,架构、解码、缓存、部署和成本控制都在成为核心变量。

多模态生成开始拼价格和体验

Luma 开放统一图像模型 Uni-1.1 API,在 LMArena 图像生成榜单位列前列,并强调价格与延迟低于同类模型一半,文字渲染能力接近 GPT image 2。图像生成模型过去主要比画质、风格和提示词理解,现在 API 开放、延迟降低和价格下探,会让更多产品把图像能力嵌入实际流程里。

字节跳动开源多模态模型 Mamoda2.5,采用 MoE 与 DiT 架构,仅激活部分参数,却支持文生图、文生视频和视频编辑等任务,性能接近闭源产品。阿里也开源 PromptEcho,用冻结多模态大模型为文生图训练提供奖励信号。可以看到,多模态不再只是几个大厂封闭模型之间的较量,开源方法、训练奖励、推理成本和 API 生态都会影响开发者最终选择。

Agent 从电脑走向多端协同

TRAE SOLO 移动端和 Windows 桌面端上线,网页端、桌面端、移动端三端协同开放,支持语音讨论、飞书 CLI 接入、定时任务和多端任务处理。这类产品的意义在于把 Agent 从单一网页或 IDE 里解放出来,让用户可以在手机上发起任务,在桌面端跟进结果,再通过协作工具接入团队流程。

中国 4 人团队发布的开源项目 Multica,则把重点放在多 AI agent 协作层,支持人和多个 agent 一起完成任务,并已经获得大量 GitHub 关注。随着单个 Agent 能力变强,真正复杂的工作往往需要多个模型、多个工具和人类决策共同参与。编排层、协作层和任务状态管理,会成为 Agent 产品能否进入生产环境的关键。

机器人、医疗与娱乐应用继续扩散

AI 应用端也在快速扩散。Google DeepMind CEO Demis Hassabis 在访谈中强调,AI 最好的用途之一是改善人类健康,AlphaFold 已预测几乎所有已知蛋白质结构并免费开放,正在加速药物研发,并推动 AI 在基因研究、新材料等领域继续应用。医疗和科学发现仍然是 AI 最容易产生长期社会价值的方向之一。

机器人领域同样热闹。RoboScience 机器科学完成 10 亿元融资,将用于强化 VLOA 大模型和机器人本体;软银计划组建 Roze AI,用自主机器人协助建造数据中心;具身智能研究也开始强调触觉数据的重要性。娱乐侧,李飞飞联创的 Astrocade 完成 5600 万美元融资,试图让用户用自然语言快速生成可玩游戏。这些案例说明,AI 正从文本与代码工具,继续向医疗、机器人、游戏和内容创作等更复杂场景渗透。

商业化也带来新的分裂

OpenAI 向美国企业全量上线 ChatGPT 广告主平台,免费用户会看到广告,付费及未成年用户不会。这意味着 AI 产品的商业化路径正在分化:一部分用户通过订阅购买更干净、更稳定的体验,另一部分免费入口则可能逐步引入广告、推荐和商业内容。对于拥有巨大周活用户的产品来说,广告是变现捷径,但也会带来信任和体验上的新问题。

与此同时,围绕 OpenAI 的诉讼和内部历史也继续吸引关注,马斯克诉 OpenAI 案中,Brockman 的私人日记被公开,案件结果可能影响 OpenAI 的治理和资本计划。这些花边看似离技术较远,却反映出头部 AI 公司已经成为资本、监管、商业模式和公众舆论共同关注的对象。AI 行业不再只是实验室里的模型竞赛,而是一场横跨基础设施、企业软件、消费者产品和资本市场的长期竞争。

接下来要看的不是单点发布

把这些消息放在一起,最值得关注的不是某一个模型单独变强,而是 AI 公司正在补齐从底层算力到上层应用的完整链条。Claude 需要 AWS 的长期算力来支撑模型和服务,OpenAI 需要部署公司把模型送进企业系统,Luma、字节和谷歌则在多模态、开源和推理效率上继续压低使用门槛。

对普通企业和开发者来说,选择 AI 能力时也要更务实:不要只看榜单分数,还要看接口稳定性、部署方式、数据安全、成本结构、团队工作流和后续维护。真正能留下来的 AI 产品,往往不是一次演示最惊艳的那个,而是能持续嵌入业务、降低成本、提高效率,并在复杂环境里稳定运行的那个。

© 版权声明
THE END
喜欢就支持一下吧
点赞15 分享
评论 抢沙发

请登录后发表评论

    暂无评论内容