AI架构共1篇
1200万上下文模型亮相,大模型竞赛开始从参数转向效率-速维云

1200万上下文模型亮相,大模型竞赛开始从参数转向效率

SubQ 的出现,把大模型竞争里一个长期被忽视的问题重新推到了台前:上下文窗口越做越长之后,真正决定可用性的,已经不只是“能塞多少 token”,而是长文本读写、推理速度和调用成本能不能一起...
svyun的头像-速维云svyun8小时前
03712