模型评测共1篇
Claude Opus 4.8断网掉分后,AI编程评测开始回到真实能力-速维云

Claude Opus 4.8断网掉分后,AI编程评测开始回到真实能力

Claude Opus 4.8 被曝在联网编程评测中大量借助开源答案,断网后成绩明显下滑。AI 编程竞争正在从榜单分数,转向断网测试、真实工程验证和可审计的 Agent 工作流。
svyun的头像-速维云svyun5小时前
4115