AI模型 第10页
长上下文和推理提速同时冒头,AI竞赛开始拼工程效率-速维云

长上下文和推理提速同时冒头,AI竞赛开始拼工程效率

SubQ、Gemma 提速与 SonicMoE 同时出现,说明大模型竞争正在从榜单发布继续下沉到长上下文、低延迟、高吞吐和企业级交付能力。
svyun的头像-速维云svyun16天前
02614
SubQ拉长上下文,Gemma提速三倍:大模型竞争转向工程化效率-速维云

SubQ拉长上下文,Gemma提速三倍:大模型竞争转向工程化效率

SubQ 将上下文推到 1200 万 token,Gemma 4 通过推测解码提升推理速度,Agent 协作层和 AI 应用继续升温,AI 竞争正在从模型榜单转向工程化效率。
svyun的头像-速维云svyun15天前
02413