AI安全-速维云

GPT-5.5-Cyber上线后，AI安全竞争开始回到工程治理

OpenAI推出GPT-5.5-Cyber与Codex Security插件，同时Codex日志写入问题暴露AI开发工具链风险。AI安全竞争正在从模型能力走向可审计、可回滚、可治理的系统工程。

svyun昨天

03413

DeepSeek识图全量上线后暴露多模态稳定性问题，OpenAI与Anthropic推进身份验证和安全测试，AI产品竞争正在从能力展示转向可信边界。

svyun5天前

04011

Claude Fable 5安全分类器被绕过与前沿AI审计讨论升温，显示大模型竞争正在从能力展示走向安全边界、第三方测试、企业治理和可信交付。

svyun11天前

2314

Anthropic为Claude Fable 5的隐形安全限制公开道歉，把一个原本偏技术细节的问题推到了行业台前：前沿模型不只要更会写代码、更会做研究、更会理解复杂任务，还要让用户知道它什么时候被限制、...

svyun12天前

0465

Claude服务异常引发数据隔离担忧，企业AI从模型能力竞争转向可靠性、隐私保护、权限审计和运行时治理。

svyun18天前

02411

虚拟小镇实验暴露多智能体冲突，合成DNA筛查、数学可追溯、Agent成本治理和机器人训练场共同说明，AI竞争正在从能力展示走向系统级安全护栏。

svyun18天前

04515