大模型 第3页
SubQ拉长上下文,Gemma提速三倍:大模型竞争转向工程化效率-速维云

SubQ拉长上下文,Gemma提速三倍:大模型竞争转向工程化效率

SubQ 将上下文推到 1200 万 token,Gemma 4 通过推测解码提升推理速度,Agent 协作层和 AI 应用继续升温,AI 竞争正在从模型榜单转向工程化效率。
svyun的头像-速维云svyun5天前
02313
OpenAI押注企业部署,Claude锁定算力:AI竞争转向基础设施和交付能力-速维云

OpenAI押注企业部署,Claude锁定算力:AI竞争转向基础设施和交付能力

OpenAI把企业部署推到台前,Claude锁定长期算力资源,模型效率、主动助手和多模态API同步升温,AI竞争正在从模型榜单走向企业交付和基础设施能力。
svyun的头像-速维云svyun13天前
04013
GPT-5.5下沉免费入口,AI竞争从模型升级打到语音、广告和企业部署-速维云

GPT-5.5下沉免费入口,AI竞争从模型升级打到语音、广告和企业部署

OpenAI把GPT-5.5 Instant推向免费入口,并公开实时语音架构;与此同时,企业部署、算力长约、推理效率和多模态应用一起升温,AI竞争正在从模型能力转向系统交付。
svyun的头像-速维云svyun昨天
02612
OpenAI深入企业现场,AI竞争从模型榜单转向系统交付-速维云

OpenAI深入企业现场,AI竞争从模型榜单转向系统交付

OpenAI加码企业部署,Claude主动工作流、长上下文、推理提速和多模态API同步升温,AI竞争正在从模型榜单转向系统交付。
svyun的头像-速维云svyun20小时前
04312
亚马逊锁定 Claude 万亿算力,AI 竞争正式进入基础设施长约时代-速维云

亚马逊锁定 Claude 万亿算力,AI 竞争正式进入基础设施长约时代

Anthropic 与亚马逊把 Claude 的下一阶段押在了一份极重的基础设施长约上:十年、AWS、5GW 算力,以及最高数百亿美元级别的投资承诺。这条消息比单次模型更新更值得注意,因为它说明大模型竞争...
svyun的头像-速维云svyun15天前
03112
1200万上下文模型亮相,大模型竞赛开始从参数转向效率-速维云

1200万上下文模型亮相,大模型竞赛开始从参数转向效率

SubQ 的出现,把大模型竞争里一个长期被忽视的问题重新推到了台前:上下文窗口越做越长之后,真正决定可用性的,已经不只是“能塞多少 token”,而是长文本读写、推理速度和调用成本能不能一起...
svyun的头像-速维云svyun15天前
03812