← 返回专题列表
讨论 2026-06-11

专题 | 能力与安全的天平:DiffusionGemma、Amodei万字长文与Fable护栏争议

GoogleDiffusionGemmaAnthropicDario AmodeiAI安全AI政策扩散模型网络安全

当Google用扩散模型把文本生成速度提升4倍、当Anthropic CEO呼吁建立”能跟上AI速度”的监管机构、当白帽安全研究者发现最强大的AI模型把他们拒之门外——AI行业正在经历一场关于”能力与安全”的集体焦虑。

Google DiffusionGemma:放弃自回归,文本生成进入”并行时代”

2026年6月10日,Google在官方博客发布了实验性开源模型DiffusionGemma——这是首个把”文本扩散”范式带进主流大模型的正式产品。

与所有自回归LLM逐个token从左到右生成不同,DiffusionGemma采用并行去噪方式,一次性生成256个token的文本块。模型基于Gemma 4家族构建,26B参数MoE架构,推理时仅激活3.8B参数,Apache 2.0许可证开源。

性能方面,DiffusionGemma在专用GPU上实现了最高4倍推理加速——单块NVIDIA H100可达1000+ tokens/秒,RTX 5090也能达到700+ tokens/秒。更重要的是,它的双向注意力机制为代码补全、行内编辑、数学图结构生成等非线性任务带来了自回归模型天然不具备的优势。

Google还展示了Unsloth微调DiffusionGemma解数独的案例——这一任务对自回归模型极为困难,因为每个token都依赖后续token的约束,而扩散模型的并行生成和自校正机制使其天然适合这类问题。

AI Pulse 观点: DiffusionGemma不是”又一个更快的LLM”,它代表的是一种根本性的范式转移。自回归生成就像打字机——一个字一个字地敲;扩散生成就像印刷机——一整页同时印出来。虽然当前输出质量不如标准Gemma 4,但这种范式一旦成熟,将彻底改变本地AI交互体验的延迟瓶颈。对于需要实时响应的应用场景(IDE内联补全、语音对话、实时翻译),扩散模型可能是比自回归更优的工程选择。

Dario Amodei万字长文:AI在指数级增长,但政治体制是”霍比特人节奏”

同一天,Anthropic CEO Dario Amodei在个人博客发布了题为《Policy on the AI Exponential》的政策长文。文章以《指环王》中树须(Treebeard)的寓言开篇——霍比特人试图说服一棵说话极慢的树人去拯救森林,但树人光是打招呼就要花一整天。

Amodei的核心论点是:AI正以指数速度前进,四年间从”勉强能写一行代码”到”能写大部分代码”;但政策制定以年为单位运转。“在国会可能花上几年才能采取行动的时间里,AI可以从一个有趣的玩具变成整个数据中心的天才国度。”

文章系统阐述了五个需要重新构想的政策领域:

  1. 监管与公共安全——呼吁建立专门、持续学习、足够快的AI监管机构
  2. 宏观经济与税收政策——应对AI可能带来的大规模就业冲击
  3. 加速AI的正面影响——让AI能力评估结果”本身也可被AI实时审计”
  4. 国家与公民自由的平衡——在利用AI提升政府能力的同时保护个人权利
  5. 确保民主国家的领导地位——在地缘政治层面应对AI竞争

伴随这篇长文,Anthropic同步发布了两份政策文件:前沿模型测试立法提案和就业 displacement 政策框架,并表示将为后者提供”大量资金支持”。

AI Pulse 观点: 这是Anthropic管理层首次在Mythos/Fable争议之后系统阐述”监管为什么必须追上AI”的整套框架。值得注意的是,Amodei明确承认”这些早期行动至少落后AI进展一年”——这来自一家AI公司CEO的自白,比任何外部批评都更有说服力。文章提出的”让AI能力评估本身也可被AI实时审计”是一个极具前瞻性的概念:如果人类监管者跟不上AI的发展速度,那么也许只有AI才能审计AI。但这也带来了一个递归问题——谁来审计审计者?

Fable护栏争议:安全研究者集体抗议——“80%的研究价值被封在拒答里”

就在Amodei发布政策长文的同一天,Anthropic发布的Fable 5模型陷入了另一场争议。

Fable 5是Anthropic Mythos级模型的”公开受限版”,定位为公众可访问的Claude最强模型。然而,多位白帽安全研究者在X和Reddit上集中抗议:Fable的护栏过于严格,拒绝了几乎所有与网络安全相关的请求,甚至包括”阅读一篇博客文章”这样 innocuous 的任务。

IBM X-Force的安全研究者Valentina “Chompie” Palmiotti直言:“Fable拒绝任何可能与网络相关的请求。即使是 innocuous 的任务比如阅读博客文章也不行。”

当用户的prompt触发护栏时,Fable会暂停对话并提示”安全措施将此消息标记为网络安全或生物学话题”。Reddit上的开发者反馈,Fable在网络安全审计、漏洞复现、攻防演练PoC生成等场景下几乎完全不可用。

这一事件与Amodei的政策长文形成了讽刺性的对照:一边在政策层面呼吁”监管速度要跟上AI”,一边在产品层面把护栏继续收紧,以至于合法的学术研究都无法进行。

AI Pulse 观点: Fable护栏争议揭示了一个结构性困境:安全护栏的设计初衷是防止AI被滥用(开发恶意软件、开发生物武器等),但当护栏过于严格时,它同时也在阻止合法的安全研究——而安全研究恰恰是防御网络攻击的第一道防线。这不是一个”松”或”紧”的二元选择,而是一个需要更精细化分级访问控制的工程问题。Mythos级的安全重定向机制(Fable自动将敏感查询重定向至Opus 4.8)是一个有趣的尝试,但如果重定向后的模型同样拒绝回答,那么这种机制就只是多了一层拒绝。对于网络安全行业而言,这意味着最需要AI辅助防御的研究者,恰恰是被AI护栏挡在门外的人。

三条线索的共同命题:能力与安全的剪刀差

把这三件事放在一起看,一个清晰的行业图景浮现出来:

能力在加速:Google DiffusionGemma代表了一种全新的生成范式,把文本推理速度提升4倍;Claude Fable 5在SWE-Bench Pro上以80.3%碾压GPT-5.5的58.6%。AI的能力增长不是线性的,而是指数级的。

安全在收紧:Anthropic为Mythos级模型实施30天数据保留和人工审查政策;Fable的护栏被研究者们认为”过于严格”;Amodei在长文中承认AI风险(尤其是网络安全和生物风险)“将以月为单位关闭窗口”。

治理在追赶:Amodei呼吁建立专门、持续学习的AI监管机构;Anthropic发布了前沿模型测试立法提案;但正如Amodei自己所言,这些行动”至少落后AI进展一年”。

AI Pulse 观点: 这三条线索共同指向一个核心矛盾:AI的能力增长和安全框架之间的”剪刀差”正在扩大。能力增长的速度远超安全框架的构建速度,而安全框架的收紧又反过来限制了合法的研究和应用。这种矛盾不会因为任何单方面的”松”或”紧”而解决——它需要一种全新的治理范式。也许Amodei提出的”AI审计AI”是一个方向,也许DiffusionGemma代表的并行范式会带来新的安全挑战(毕竟它不再是一个token一个token地可控生成)。无论如何,2026年6月的这个时间点,AI行业正在集体面对一个无法回避的问题:当我们造出越来越强大的工具时,我们准备好如何安全地使用它了吗?