大模型 第7页
SubQ拉长上下文,Gemma提速三倍:AI竞争开始转向工程化效率-速维云

SubQ拉长上下文,Gemma提速三倍:AI竞争开始转向工程化效率

SubQ把上下文推向1200万token,Gemma 4通过推测解码提速,多模态API和Agent协作层同步推进,AI竞争从模型榜单转向推理效率、基础设施和工程化落地。
svyun的头像-速维云svyun14天前
04414
OpenAI押注企业部署,Claude锁定算力:AI竞争转向基础设施和交付能力-速维云

OpenAI押注企业部署,Claude锁定算力:AI竞争转向基础设施和交付能力

OpenAI把企业部署推到台前,Claude锁定长期算力资源,模型效率、主动助手和多模态API同步升温,AI竞争正在从模型榜单走向企业交付和基础设施能力。
svyun的头像-速维云svyun13天前
04013
1200万上下文与Gemma提速同台出现,大模型开始拼效率和入口-速维云

1200万上下文与Gemma提速同台出现,大模型开始拼效率和入口

SubQ把上下文窗口拉到1200万token,谷歌让Gemma 4推理最高提速3倍,Luma、TRAE SOLO和多Agent工具也同步推进。大模型竞争正在从参数和榜单,转向效率、成本、入口和真实落地能力。
svyun的头像-速维云svyun11天前
02611
哈佛急诊研究刷新医疗AI坐标,模型竞争开始转向真实部署-速维云

哈佛急诊研究刷新医疗AI坐标,模型竞争开始转向真实部署

哈佛急诊诊断研究显示,大模型正在进入更高价值的真实应用场景。与此同时,企业部署、算力长约、模型提速、多模态和机器人融资共同说明,AI竞争正从单点能力转向系统交付。
svyun的头像-速维云svyun9天前
02915
Claude押下AWS长约,OpenAI升级免费入口:AI竞争继续向算力、工作流和效率下沉-速维云

Claude押下AWS长约,OpenAI升级免费入口:AI竞争继续向算力、工作流和效率下沉

Claude绑定AWS算力长约,OpenAI升级免费入口,AI竞争从模型发布转向云基础设施、企业部署、Agent工作流和推理效率。
svyun的头像-速维云svyun9天前
0446