推理效率共2篇
算力不够只是表象:AI公司开始把战场搬到GPU利用率和端侧模型-速维云

算力不够只是表象:AI公司开始把战场搬到GPU利用率和端侧模型

DeepSeek DSpark推理加速、GPU利用率讨论、端侧多模态模型与本地小模型共同指向同一个变化:AI竞争正在从堆参数走向效率工程。
svyun的头像-速维云svyun23小时前
409
1200万上下文与Gemma提速同场出现,大模型不只是在抢算力-速维云

1200万上下文与Gemma提速同场出现,大模型不只是在抢算力

SubQ长上下文、Gemma推理提速、Claude算力长约与Agent工具升温,显示AI竞争正在转向效率、基础设施和真实工作流。
svyun的头像-速维云svyun45天前
0399