Agent 第4页
Anthropic反超OpenAI,AI竞争从模型发布打到企业交付和基础设施-速维云

Anthropic反超OpenAI,AI竞争从模型发布打到企业交付和基础设施

Anthropic企业市占率反超OpenAI,Google、Kimi、国产GPU、Cerebras和Agent产品变化共同显示,AI竞争正在从单一模型发布转向企业交付、基础设施和工作流入口。
svyun的头像-速维云svyun13天前
04710
1200万上下文与Gemma提速同场出现,AI竞争开始转向效率和系统交付-速维云

1200万上下文与Gemma提速同场出现,AI竞争开始转向效率和系统交付

SubQ长上下文、Gemma推理提速、Claude算力长约与企业部署加速共同指向一个变化:AI竞争正在从单点模型能力转向效率、基础设施和系统交付。
svyun的头像-速维云svyun13天前
0268
Claude锁定5GW算力,AI竞争从模型能力转向基础设施和工作流入口-速维云

Claude锁定5GW算力,AI竞争从模型能力转向基础设施和工作流入口

Claude锁定AWS长期算力,长上下文、推理提速、主动助手和AI应用层融资同步推进,AI竞争正在从模型能力走向基础设施、效率和真实工作流。
svyun的头像-速维云svyun14天前
04610
OpenAI把Cerebras推向350亿美元IPO,AI竞争从模型打到算力供应链-速维云

OpenAI把Cerebras推向350亿美元IPO,AI竞争从模型打到算力供应链

Cerebras重启IPO并获OpenAI采购协议支持,AI竞争正从模型能力延伸到芯片、数据中心、Agent应用与算力供应链。
svyun的头像-速维云svyun16天前
02410
1200万上下文与Gemma提速同台出现,大模型开始拼效率和入口-速维云

1200万上下文与Gemma提速同台出现,大模型开始拼效率和入口

SubQ把上下文窗口拉到1200万token,谷歌让Gemma 4推理最高提速3倍,Luma、TRAE SOLO和多Agent工具也同步推进。大模型竞争正在从参数和榜单,转向效率、成本、入口和真实落地能力。
svyun的头像-速维云svyun16天前
02611
1200万上下文模型亮相,大模型竞赛开始从参数转向效率-速维云

1200万上下文模型亮相,大模型竞赛开始从参数转向效率

SubQ 的出现,把大模型竞争里一个长期被忽视的问题重新推到了台前:上下文窗口越做越长之后,真正决定可用性的,已经不只是“能塞多少 token”,而是长文本读写、推理速度和调用成本能不能一起...
svyun的头像-速维云svyun20天前
03812