AI模型 第9页
长上下文和推理提速同时冒头,AI竞赛开始拼工程效率-速维云

长上下文和推理提速同时冒头,AI竞赛开始拼工程效率

SubQ、Gemma 提速与 SonicMoE 同时出现,说明大模型竞争正在从榜单发布继续下沉到长上下文、低延迟、高吞吐和企业级交付能力。
svyun的头像-速维云svyun16天前
02614
DeepSeek登顶调用榜,Qwen闯入编程前列:开发者入口正在被中国模型重排-速维云

DeepSeek登顶调用榜,Qwen闯入编程前列:开发者入口正在被中国模型重排

DeepSeek V4-Flash 登上 OpenRouter 全球调用榜,Qwen3.7-Max 闯入编程模型前列,Keye-VL、多模态推理、低价 API 与应用生成工具共同推动开发者入口重排。
svyun的头像-速维云svyun5天前
2510
SubQ拉长上下文,Gemma提速三倍:大模型竞争转向工程化效率-速维云

SubQ拉长上下文,Gemma提速三倍:大模型竞争转向工程化效率

SubQ 将上下文推到 1200 万 token,Gemma 4 通过推测解码提升推理速度,Agent 协作层和 AI 应用继续升温,AI 竞争正在从模型榜单转向工程化效率。
svyun的头像-速维云svyun15天前
02413
OpenRouter融资后,AI模型入口争夺进入基础设施战-速维云

OpenRouter融资后,AI模型入口争夺进入基础设施战

OpenRouter 完成 1.13 亿美元 B 轮融资,英伟达等跟投,让模型聚合平台从开发者工具走向 AI 基础设施核心位置。模型路由、GPU云基础设施、合规边界和真实业务验证,正在成为 AI 应用竞争的新焦...
svyun的头像-速维云svyun5天前
02411
Qwen3.7 Max与真武M890同台亮相,国产AI竞争打到模型、芯片和Agent底座-速维云

Qwen3.7 Max与真武M890同台亮相,国产AI竞争打到模型、芯片和Agent底座

Qwen3.7 Max、真武M890、DeepSeek Code传闻与多类AI应用同场升温,显示AI竞争正在从单点模型能力转向模型、算力、Agent底座和真实产品交付。
svyun的头像-速维云svyun11天前
02415
大模型开始装进手机和手表,端侧AI入口战真正升温-速维云

大模型开始装进手机和手表,端侧AI入口战真正升温

三值大模型、AI耳机、XR眼镜和真实办公Agent评测同时出现,说明AI竞争正在从云端模型扩展到端侧设备、硬件入口和工程化落地。
svyun的头像-速维云svyun7天前
02313