排序
SubQ拉长上下文,Gemma提速三倍:大模型竞争转向工程化效率
SubQ 将上下文推到 1200 万 token,Gemma 4 通过推测解码提升推理速度,Agent 协作层和 AI 应用继续升温,AI 竞争正在从模型榜单转向工程化效率。
OpenAI押注企业部署,Claude锁定算力:AI竞争转向基础设施和交付能力
OpenAI把企业部署推到台前,Claude锁定长期算力资源,模型效率、主动助手和多模态API同步升温,AI竞争正在从模型榜单走向企业交付和基础设施能力。
GPT-5.5下沉免费入口,AI竞争从模型升级打到语音、广告和企业部署
OpenAI把GPT-5.5 Instant推向免费入口,并公开实时语音架构;与此同时,企业部署、算力长约、推理效率和多模态应用一起升温,AI竞争正在从模型能力转向系统交付。
亚马逊锁定 Claude 万亿算力,AI 竞争正式进入基础设施长约时代
Anthropic 与亚马逊把 Claude 的下一阶段押在了一份极重的基础设施长约上:十年、AWS、5GW 算力,以及最高数百亿美元级别的投资承诺。这条消息比单次模型更新更值得注意,因为它说明大模型竞争...
1200万上下文模型亮相,大模型竞赛开始从参数转向效率
SubQ 的出现,把大模型竞争里一个长期被忽视的问题重新推到了台前:上下文窗口越做越长之后,真正决定可用性的,已经不只是“能塞多少 token”,而是长文本读写、推理速度和调用成本能不能一起...








