多模态AI共4篇
Qwen3.7-Plus登场,多模态Agent竞争从看懂界面走向协作执行-速维云

Qwen3.7-Plus登场,多模态Agent竞争从看懂界面走向协作执行

通义千问 Qwen3.7-Plus、MuleRun Messages、MobileGym 和 GUI Agent 研究共同说明,AI 正从看懂界面走向团队协作、任务执行和系统交付。
svyun的头像-速维云svyun23天前
04714
DeepSeek识图翻车后,多模态AI开始接受安全与信任考验-速维云

DeepSeek识图翻车后,多模态AI开始接受安全与信任考验

DeepSeek识图全量上线后暴露多模态稳定性问题,OpenAI与Anthropic推进身份验证和安全测试,AI产品竞争正在从能力展示转向可信边界。
svyun的头像-速维云svyun7天前
04111
字节开源多模态模型,视觉 AI 从生成图片走向视频、游戏和世界模型-速维云

字节开源多模态模型,视觉 AI 从生成图片走向视频、游戏和世界模型

字节开源多模态模型、Luma开放图像API、阿里PromptEcho与世界模型升温,视觉AI正从单张图片生成走向视频、游戏和可交互空间。
svyun的头像-速维云svyun47天前
0277
GPT-5.5 免费升级叠加实时语音公开,AI入口战正在逼近九亿用户-速维云

GPT-5.5 免费升级叠加实时语音公开,AI入口战正在逼近九亿用户

GPT-5.5 Instant 推向免费默认入口,Realtime API 架构公开,Claude 主动助手、多模态 API 与 AI 游戏融资同步升温,AI 竞争正在从模型能力转向入口、延迟、工作流和商业化。
svyun的头像-速维云svyun36天前
0487