推理效率-速维云

算力不够只是表象：AI公司开始把战场搬到GPU利用率和端侧模型-速维云

算力不够只是表象：AI公司开始把战场搬到GPU利用率和端侧模型

DeepSeek DSpark推理加速、GPU利用率讨论、端侧多模态模型与本地小模型共同指向同一个变化：AI竞争正在从堆参数走向效率工程。

svyun23小时前

409

1200万上下文与Gemma提速同场出现，大模型不只是在抢算力-速维云

1200万上下文与Gemma提速同场出现，大模型不只是在抢算力

SubQ长上下文、Gemma推理提速、Claude算力长约与Agent工具升温，显示AI竞争正在转向效率、基础设施和真实工作流。

svyun45天前

0399