AI安全共15篇
GPT-5.5-Cyber上线后,AI安全竞争开始回到工程治理-速维云

GPT-5.5-Cyber上线后,AI安全竞争开始回到工程治理

OpenAI推出GPT-5.5-Cyber与Codex Security插件,同时Codex日志写入问题暴露AI开发工具链风险。AI安全竞争正在从模型能力走向可审计、可回滚、可治理的系统工程。
svyun的头像-速维云svyun15小时前
03413
DeepSeek识图翻车后,多模态AI开始接受安全与信任考验-速维云

DeepSeek识图翻车后,多模态AI开始接受安全与信任考验

DeepSeek识图全量上线后暴露多模态稳定性问题,OpenAI与Anthropic推进身份验证和安全测试,AI产品竞争正在从能力展示转向可信边界。
svyun的头像-速维云svyun4天前
03811
Claude Fable 5安全风波后,前沿模型竞争开始进入审计时代-速维云

Claude Fable 5安全风波后,前沿模型竞争开始进入审计时代

Claude Fable 5安全分类器被绕过与前沿AI审计讨论升温,显示大模型竞争正在从能力展示走向安全边界、第三方测试、企业治理和可信交付。
svyun的头像-速维云svyun10天前
2314
Claude Fable 5道歉后,AI竞争开始补上透明边界和可信审计-速维云

Claude Fable 5道歉后,AI竞争开始补上透明边界和可信审计

Anthropic为Claude Fable 5的隐形安全限制公开道歉,把一个原本偏技术细节的问题推到了行业台前:前沿模型不只要更会写代码、更会做研究、更会理解复杂任务,还要让用户知道它什么时候被限制、...
svyun的头像-速维云svyun11天前
0465
Claude宕机疑似串出他人对话,企业AI开始补上隐私与可靠性底座-速维云

Claude宕机疑似串出他人对话,企业AI开始补上隐私与可靠性底座

Claude服务异常引发数据隔离担忧,企业AI从模型能力竞争转向可靠性、隐私保护、权限审计和运行时治理。
svyun的头像-速维云svyun16天前
02411
虚拟小镇冲突升级后,AI Agent竞争开始补安全护栏-速维云

虚拟小镇冲突升级后,AI Agent竞争开始补安全护栏

虚拟小镇实验暴露多智能体冲突,合成DNA筛查、数学可追溯、Agent成本治理和机器人训练场共同说明,AI竞争正在从能力展示走向系统级安全护栏。
svyun的头像-速维云svyun17天前
04515