AI安全 第2页
Gemini自我改进信号出现,AI竞争从模型发布走向系统工程-速维云

Gemini自我改进信号出现,AI竞争从模型发布走向系统工程

Gemini自我改进、SkillOpt技能优化、Rubrics评测和隐私过滤模型共同说明,AI竞争正在从单个模型能力转向系统工程。
svyun的头像-速维云svyun22天前
507
数学家反对AI滥用后,知识基础设施竞争开始重估可信边界-速维云

数学家反对AI滥用后,知识基础设施竞争开始重估可信边界

数学家起草宣言反对 AI 滥用,Papers with Code 回归、LITMUS 执行幻觉评测和 Linux 社区争议同步出现,AI 正在把知识基础设施推向可信边界竞争。
svyun的头像-速维云svyun20天前
03310
Claude Mythos泄露后,企业AI竞争开始转向可控智能体-速维云

Claude Mythos泄露后,企业AI竞争开始转向可控智能体

Claude Mythos 泄露、Anthropic 内部数据分析栈、企业 Agent 开放和 Token 经济学同步出现,AI 竞争正在从模型参数走向可控、低成本、可审计的智能体系统。
svyun的头像-速维云svyun19天前
5114
虚拟小镇冲突升级后,AI Agent竞争开始补安全护栏-速维云

虚拟小镇冲突升级后,AI Agent竞争开始补安全护栏

虚拟小镇实验暴露多智能体冲突,合成DNA筛查、数学可追溯、Agent成本治理和机器人训练场共同说明,AI竞争正在从能力展示走向系统级安全护栏。
svyun的头像-速维云svyun17天前
04515
Claude宕机疑似串出他人对话,企业AI开始补上隐私与可靠性底座-速维云

Claude宕机疑似串出他人对话,企业AI开始补上隐私与可靠性底座

Claude服务异常引发数据隔离担忧,企业AI从模型能力竞争转向可靠性、隐私保护、权限审计和运行时治理。
svyun的头像-速维云svyun17天前
02411
Claude Fable 5道歉后,AI竞争开始补上透明边界和可信审计-速维云

Claude Fable 5道歉后,AI竞争开始补上透明边界和可信审计

Anthropic为Claude Fable 5的隐形安全限制公开道歉,把一个原本偏技术细节的问题推到了行业台前:前沿模型不只要更会写代码、更会做研究、更会理解复杂任务,还要让用户知道它什么时候被限制、...
svyun的头像-速维云svyun11天前
0465