模型架构共1篇
SubQ把上下文拉到1200万后,模型架构竞争开始绕开Transformer-速维云

SubQ把上下文拉到1200万后,模型架构竞争开始绕开Transformer

SubQ 把上下文窗口推到 1200 万 token 后,长上下文模型竞争从参数展示转向架构效率、企业知识库和代码仓库真实工作流。
svyun的头像-速维云svyun13小时前
2211