Etched融资与LongCat-2.0之后,AI竞争重新回到芯片和推理成本

Etched 拿到 8 亿美元融资、估值升至 50 亿美元,并准备在夏天交付面向推理的 AI 芯片;另一边,美团 LongCat-2.0 把“纯国产芯片训练的万亿参数模型”推到台前。两条消息放在一起看,AI 竞争正在从“谁发布了更强模型”继续向底层延伸:芯片能不能供得上、训练能不能摆脱单一路径、推理成本能不能压下来,正在变成模型公司、云厂商和企业用户共同关心的问题。

这并不意味着模型能力不重要,而是模型能力越来越依赖更完整的算力工程。一个新模型想要真正变成产品,需要训练集群、推理芯片、调度系统、价格策略、开发者工具和行业场景一起配合。Etched、LongCat-2.0、LoopCoder v2、JetSpec、SandboxAQ 上架 Google Cloud 等资讯共同指向一个变化:AI 的下一轮竞争,不只发生在排行榜上,也发生在芯片、成本和落地路径里。

芯片融资升温

Etched 的融资之所以值得关注,不只是金额大。它把市场的注意力重新拉回“专用推理芯片”这件事上。训练阶段决定模型能不能长出来,推理阶段决定模型能不能被大规模使用。随着企业把 AI 接进客服、代码、搜索、办公、研发和内容生产,推理请求会变得更高频、更碎片化,也更敏感于延迟和成本。

通用 GPU 在 AI 爆发中扮演了核心角色,但当模型调用量继续扩大,专用芯片的吸引力会更强。它不一定要取代所有 GPU,而是可能在固定模型、固定任务、高并发推理场景里提供更好的单位成本。Etched 已经完成首次流片,并披露订单需求达到 10 亿美元,这说明客户不是只在听故事,而是开始为下一阶段的推理基础设施提前下注。

投资方名单同样释放了信号。辛顿、李飞飞、台积电等名字出现在同一家公司背后,代表产业界对“推理成本瓶颈”的判断正在趋同。大模型能力提升之后,真正决定商业化规模的往往不是单次演示有多惊艳,而是每天数亿次调用能不能稳定、便宜、可控地跑起来。芯片公司如果能解决这道题,就会进入模型公司和云服务商的核心供应链。

国产算力训练

美团 LongCat-2.0 的看点在于,它把国产算力训练和万亿参数模型放在了同一个叙事里。公开信息显示,LongCat-2.0 总参数达到 1.6 万亿,支持 100 万 token 上下文,面向代码和 Agent 场景,并强调采用国产芯片训练。这类消息对行业的意义,远不止某一家互联网公司多了一个模型。

过去,很多人讨论国产模型时,重点放在参数规模、榜单成绩和价格上;但当训练底座也被拿出来讲,说明模型竞争已经进入供应链层面。算力来源是否多元、训练框架能否适配不同芯片、集群稳定性如何、故障恢复和通信效率能不能撑住大规模训练,都会直接影响模型迭代速度。

AI推理芯片与电路板特写
推理芯片与国产算力训练正在把 AI 竞争推向更底层的基础设施环节。

对国内企业来说,国产算力训练还意味着更强的交付确定性。不是每个行业客户都只关心模型参数,他们还会关心数据部署、长期可用性、价格波动和合规边界。若模型训练和推理都能在更多硬件路径上运行,企业就更容易把 AI 纳入长期预算,而不是只把它当作一个随时可能涨价或受限的外部服务。

推理效率成硬指标

芯片之外,算法层面的效率优化也在加速。阶跃星辰团队提出 JetSpec,在部分场景中让大模型解码速度最高提升近 10 倍;北航等团队发布 LoopCoder v2,发现小模型在合适循环次数下可以取得越级表现,在 SWE-bench Verified 上从 43.0 提升到 64.4。这些动态说明,行业并不是只靠堆硬件解决问题。

推理效率正在变成硬指标。企业使用 AI 时,真正关心的是一个任务完成需要多少时间、多少 token、多少服务器资源,以及失败后要不要人工返工。模型更大当然可能带来更强能力,但如果每次调用都太慢、太贵、不可控,就很难嵌进高频业务流程。JetSpec、循环推理、小模型增强、多模型协作,本质上都是在回答同一个问题:怎样用更少资源完成足够好的任务。

这也会改变模型产品的定价逻辑。DeepSeek 准备引入峰谷定价,ZenMux 把主流模型价格拉到同一水平做真实消耗实验,Google AI Studio 的免费额度讨论也让开发者重新计算调用账本。未来企业不会只看“哪个模型最聪明”,还会看“同样预算能跑多少任务”“高峰期会不会被成本打爆”“缓存、批处理、路由和降级机制是否成熟”。

科学 AI 上云

算力和效率的另一条落地线,是科学 AI。SandboxAQ 的科学 AI 模型上架 Google Cloud,面向新药研发、半导体和材料开发,代表云平台正在把高门槛行业模型打包给更多企业使用。科学计算、分子模拟、材料筛选这类任务,本来就对算力、模型可靠性和工作流集成有很高要求,不能只靠一个聊天窗口解决。

这条线与 Etched、LongCat-2.0 形成呼应。芯片和云基础设施提供底座,科学 AI 提供高价值场景。如果 AI 能在药物候选物筛选、材料性质预测、半导体研发流程中缩短试错链路,企业愿意为可靠算力和专用模型付费的意愿会更强。相比泛娱乐应用,科学 AI 的商业价值更难被短期流量衡量,但一旦进入研发链路,粘性和门槛都更高。

从云厂商角度看,科学 AI 也是算力商业化的重要出口。训练大模型消耗巨大,但长期收入来自持续推理和行业工作流。把科学模型放到 Google Cloud 这类平台上,意味着客户可以围绕数据、权限、实验流程和计算资源建立完整链路,而不是单独购买一个离线模型。这会让 AI 基础设施从“卖算力”逐步走向“卖可用的行业能力”。

应用侧继续扩散

底层竞争升温的同时,应用侧并没有停下。腾讯企业微信内测 AI Agent“大圆”,可以总结群聊、生成文档、制作表格和起草邮件;深圳 Sengine 用 AI 生成可编辑、可交互的 3D 空间,面向家装、电商、游戏和具身智能训练;跨维智能完成超 10 亿元融资,继续推进物理 AI 和人形机器人落地。这些消息说明,AI 的需求端仍在扩散。

但应用越多,底层压力越明显。办公 Agent 会带来海量低延迟请求,3D 世界生成需要多模态模型和图形资产管线,机器人训练依赖物理数据和仿真环境,企业部署还需要稳定的权限、审计和数据隔离。没有更便宜的推理、更可靠的训练底座和更成熟的云端调度,这些应用很容易停留在演示阶段。

这也是为什么芯片、国产算力、模型效率和行业应用不能分开看。AI 产品的表层是一个个工具,深层却是算力如何被组织、成本如何被摊薄、模型如何被部署到真实业务中。未来用户看到的可能只是一个办公助手、一段生成式视频或一个机器人动作,但背后跑的是芯片、模型、数据和工程系统组成的长链条。

竞争回到底座

综合这些重点资讯,AI 行业正在从“模型能力单点爆发”进入“底座能力系统竞争”。Etched 代表推理芯片路线继续获得资本支持,LongCat-2.0 代表国产算力训练进入更大模型叙事,JetSpec 和 LoopCoder v2 代表效率优化仍有算法空间,SandboxAQ 上云则代表高价值行业场景开始被云平台产品化。

对开发者和企业用户来说,接下来评估 AI 服务时,需要多问几个问题:模型是否稳定迭代,推理价格是否可预期,底层算力是否有替代方案,服务商能否提供部署、数据和评估工具,应用是否真的进入业务流程。单次回答惊艳已经不足以构成长期优势,真正的护城河会体现在成本、可靠性、生态和交付能力上。

这也是本轮 AI 竞争最现实的一面。模型发布会能制造热度,但企业采购和产业落地最终会回到账本:同样的任务,谁更快、谁更稳、谁更便宜、谁能在供应链波动中持续交付。芯片和算力重新站到舞台中央,说明 AI 正在从软件奇迹变成一场更复杂的工业竞争。

© 版权声明
THE END
喜欢就支持一下吧
点赞6 分享
评论 抢沙发

请登录后发表评论

    暂无评论内容