周报 2026 年第 24 周

AI Pulse 周报 | 2026-W24

AnthropicClaude Fable 5OpenAIGoogleMetaSpaceXIPOKPMGAI监管Claude CodeMicrosoftApple智源大会

# 本周聚焦：AI 监管风暴席卷行业——Anthropic 模型被强制下线，Google 被判担责，SpaceX 敲响上市钟声

> 从海量 AI 资讯中提取真正有价值的信号

---

本周 AI 行业经历了堪称"监管风暴"的一周。美国政府以国家安全为由，强制 Anthropic 下线了刚刚发布的 Claude Fable 5 和 Mythos 5 两款旗舰模型，原因是发现有方法可以绕过其安全限制。OpenAI 同时面临多州总检察长调查。德国慕尼黑法院作出里程碑式裁决，判定 Google 需为其 AI Overviews 功能生成的虚假信息承担法律责任。Meta 则因北京方面的监管压力，被迫撤回 20 亿美元的 Manus 收购。与此同时，SpaceX 正式 IPO，马斯克远程敲钟引发市场热议。AI 行业正在经历从"自由发展"到"强监管"的历史性转折。

这是一个 AI 行业在技术狂奔与监管约束之间寻找平衡的关键周。

---

## 美国政府强制下线 Anthropic Claude Fable 5：国家安全与 AI 能力的碰撞

6 月 12 日，Anthropic 发布博客声明，宣布应美国政府出口管制指令，即刻下线 Claude Fable 5 和 Mythos 5 两款模型。Anthropic 表示："政府认为其已发现了一种绕过或'越狱'Fable 5 的方法。"该指令要求 Anthropic 暂停所有"外国国民"对这两款模型的访问权限。

据 The Decoder 报道，亚马逊 CEO 安迪·贾西（Andy Jassy）及其他五家科技公司高管据报曾向特朗普政府警告 Fable 模型的安全漏洞，即使亚马逊本身就是 Anthropic 的最大投资者之一。在数小时内，白宫便通过出口管制指令强制将模型下线。

此前，Claude Fable 5 在 FrontierMath 最难题型上达到 88% 的准确率，大幅领先 GPT-5.5 的约 75%，较年初 Opus 4.5 不足 10% 的成绩实现了飞跃式提升。

> **AI Pulse 观点：** 这是 AI 行业史上首次由政府强制指令导致模型下线，其深远影响远超单一事件。首先，它确立了一个危险先例：政府可以通过出口管制机制即时干预商业 AI 产品的可用性，而非通过传统的立法或监管流程。其次，亚马逊既是 Anthropic 的最大投资者又是举报者，这一矛盾角色揭示了 AI 行业"竞合关系"的复杂性——即使是同一阵营的玩家，在安全问题上的利益也不一致。最后，Fable 5 被下线的时间点恰逢其在数学能力上取得突破性进展，这不禁让人联想到：政府担心的究竟是安全漏洞，还是 AI 能力进步过快？

来源：[WIRED](https://www.wired.com/story/anthropic-says-us-government-ordered-it-to-shut-down-mythos-models/) | [The Decoder](https://the-decoder.com/amazon-and-five-other-companies-reportedly-triggered-the-government-crackdown-on-anthropics-fable-model/) | [The Decoder](https://the-decoder.com/claude-fable-5-outpaces-gpt-5-5-by-13-points-on-frontiermaths-toughest-problems/)

---

## OpenAI 面临多州总检察长调查

6 月 13 日，TechCrunch 报道 OpenAI 正面临来自多个州总检察长的调查。虽然具体涉及哪些州尚不清楚，但调查范围涵盖 OpenAI 的广告政策、健康数据处理等多个方面。

> **AI Pulse 观点：** 州级调查的兴起是美国 AI 监管格局碎片化的重要信号。在联邦层面，特朗普政府的行政令采取了相对宽松的"自愿提交"模式；但在州层面，总检察长们正在主动出击。OpenAI 的广告政策（特别是 ChatGPT 推广中的透明度问题）和健康数据处理（用户通过 ChatGPT 输入的医疗信息如何被使用）是两个高度敏感的领域。一旦多个州形成联合调查态势，OpenAI 可能面临比联邦监管更具约束力的法律后果。这也预示着 AI 公司的合规成本将大幅上升。

来源：[TechCrunch](https://techcrunch.com/2026/06/13/openai-faces-investigation-from-state-attorneys-general/)

---

## 德国法院里程碑式裁决：Google 需为 AI Overviews 虚假信息承担法律责任

6 月 13 日，WIRED 报道德国慕尼黑地方法院作出初步裁决，判定 Google 对其 AI Overviews 功能生成的一系列虚假陈述承担法律责任。法院认为，设计、训练、运营和管理 AI 系统的公司必须为其生成回复所造成的任何损害承担法律责任，并要求 Google 防止错误或不准确信息的传播。

> **AI Pulse 观点：** 这一裁决的里程碑意义在于：它首次确立了 AI 系统输出内容的法律责任归属。此前，科技公司普遍依赖"避风港"原则（类似于 DMCA 的第 230 条保护），主张自己只是平台而非内容发布者。慕尼黑法院的裁决直接打破了这一逻辑——如果你设计、训练并运营了生成内容的 AI 系统，你就是内容的责任方。这一判例如果被其他欧洲法院甚至美国法院采纳，将彻底改变搜索引擎和 AI 聊天机器人的运营模式。Google 可能需要为 AI Overviews 的每条回答承担事实核查义务，这在技术上和成本上都是巨大的挑战。

来源：[WIRED](https://www.wired.com/story/a-court-has-ruled-that-google-is-liable-for-false-statements-generated-by-ai-overviews/)

---

## Meta 被迫撤回 20 亿美元 Manus 收购

6 月 13 日，TechCrunch 报道 Meta 开始拆除其 20 亿美元的 Manus 收购交易，原因是北京方面要求逆转该交易。Manus 此前被 Meta 收购，旨在增强其 AI 智能体能力。

> **AI Pulse 观点：** Meta 撤回 Manus 收购反映了中美 AI 博弈的又一个维度。Manus 作为一家有中国背景的 AI 智能体公司，其被 Meta 收购触及了中国的数据安全和 AI 技术出口红线。北京方面的干预表明，中国正在收紧对 AI 技术和人才外流的管控。对于 Meta 来说，20 亿美元的沉没成本只是表面损失，更深层次的影响是：Meta 在 AI 智能体领域的布局被迫推迟，而 Manus 的技术和团队可能无法再为其所用。在中美 AI 脱钩的背景下，跨国 AI 并购的难度将越来越大。

来源：[TechCrunch](https://techcrunch.com/2026/06/13/meta-reportedly-moves-to-unwind-2b-manus-deal-after-beijings-demand/)

---

## KPMG AI 报告因伪造案例被撤回

6 月 13 日，TechCrunch 和 The Decoder 报道 KPMG 撤回了一份关于 AI 在商业中应用的报告，原因是该报告包含了伪造的案例研究，涉及瑞银（UBS）、英国国民保健署（NHS）等组织。GPTZero CEO 田天（Edward Tian）帮助发现了这些错误，并警告"二次幻觉"现象——来自知名咨询公司的虚假主张在未经核实的情况下广泛传播。

> **AI Pulse 观点：** KPMG 事件揭示了 AI 行业一个危险的循环：咨询公司使用 AI 生成报告来推销 AI 服务，而报告中的内容本身就是 AI 幻觉的产物。这不仅是"AI 编造事实"的问题，更是"可信机构放大 AI 幻觉"的问题。当 KPMG 这样的四大会计师事务所发布包含伪造案例的报告时，客户和投资者会将其视为经过尽职调查的可靠信息。"二次幻觉"这个概念值得关注——它描述的是一旦虚假信息通过权威渠道发布，就会被后续的引用和分析不断放大，最终形成虚假共识。对于 AI 行业来说，建立内容真实性验证机制已不再是一个可选项，而是必须。

来源：[TechCrunch](https://techcrunch.com/2026/06/13/kpmg-pulls-report-on-ai-usage-due-to-apparent-hallucinations/) | [The Decoder](https://the-decoder.com/kpmg-fabricated-ai-case-studies-in-a-report-designed-to-sell-clients-on-ai-adoption/)

---

## SpaceX 正式 IPO：马斯克远程敲钟

6 月 12 日，SpaceX 正式在纳斯达克上市，马斯克远程敲钟时穿上了黄仁勋的标志性皮衣，SpaceX 员工则集体穿上绿色鞋子以示庆祝。据 WIRED 报道，SpaceX 的 IPO 是科技行业年度最受关注的事件之一，但其估值和上市后表现仍存在不确定性。

SpaceX 旗下拥有 SpaceXAI 实验室，其 IPO 被视为 AI 相关超级公司首次公开上市的重要里程碑。

> **AI Pulse 观点：** SpaceX IPO 的意义不仅在于太空探索领域——其旗下的 SpaceXAI 实验室使其成为一家"AI+航天"的双重叙事公司。马斯克穿黄仁勋皮衣敲钟是一个精妙的符号：它暗示 SpaceX 的估值逻辑与 NVIDIA 的 AI 算力叙事紧密相连。SpaceX 的 Starlink 卫星互联网需要大量 AI 能力进行轨道管理和信号处理，而其 AI 实验室也在开发大模型。上市后，SpaceX 将有更多资金和透明度来推进其 AI 布局，这可能成为继 Anthropic 和 OpenAI 之后，AI 行业的第三个超级玩家进入公开市场。

来源：[TechCrunch](https://techcrunch.com/2026/06/12/spacex-ipo-live-updates-on-everything-you-need-to-know/) | [WIRED](https://www.wired.com/story/you-probably-wont-get-rich-off-the-spacex-ipo/) | [量子位](https://www.qbitai.com/2026/06/435339.html)

---

## Google DeepMind 警告：当数百万 AI 智能体开始交互时会发生什么？

6 月 11 日，MIT Technology Review 报道 Google DeepMind 正在呼吁更多科学家研究多智能体系统的风险。DeepMind 认为，当数百万 AI 智能体开始在现实世界中相互作用时，可能出现不可预测的涌现行为，而目前的研究远不足以应对这一挑战。

> **AI Pulse 观点：** DeepMind 的警告指向了一个被低估的 AI 安全维度：单个 AI 模型的安全性与多 AI 系统交互的安全性是完全不同的问题。就像单个蜜蜂的行为可预测，但蜂群的行为会出现涌现特性一样，数百万 AI 智能体在金融、交通、供应链等关键基础设施中交互时，可能出现设计者无法预见的级联效应。这不仅是技术问题，更是社会学和经济学问题。DeepMind 呼吁更多科学家（而非仅工程师）参与研究，说明他们已经意识到这超出了纯技术范畴。对于正在部署 AI Agent 的企业来说，这提醒我们：单个 Agent 的测试通过不代表系统级安全。

来源：[MIT Technology Review](https://www.technologyreview.com/2026/06/11/1138794/google-deepmind-is-worried-about-what-happens-when-millions-of-agents-start-to-interact/)

---

## Claude Fable 5 在 FrontierMath 上超越 GPT-5.5 达 13 个百分点

6 月 13 日，The Decoder 报道 Claude Fable 5 在 FrontierMath 最难题型上达到 88% 的准确率，大幅领先 GPT-5.5 的约 75%。这是一个巨大飞跃——年初时 Opus 4.5 在该题型上的成绩还不到 10%。AI 数学能力的进步速度正在加速。

> **AI Pulse 观点：** FrontierMath 被广泛认为是最具挑战性的数学推理基准测试，涵盖代数、数论、组合数学等高等数学领域。Fable 5 达到 88% 的准确率意味着它已经能够解决绝大多数专业数学家才能处理的问题。从 Opus 4.5 的不足 10% 到 Fable 5 的 88%，这一进步幅度远超摩尔定律的速率。然而讽刺的是，正是这款在数学能力上取得突破性进展的模型，因为安全问题被美国政府强制下线。这提出了一个根本性问题：当 AI 的能力进步速度远超安全研究速度时，我们是否应该在部署前设置"能力阈值"——即当模型在某个领域的能力超过某个水平时，自动触发更严格的安全审查？

来源：[The Decoder](https://the-decoder.com/claude-fable-5-outpaces-gpt-5-5-by-13-points-on-frontiermaths-toughest-problems/) | [量子位](https://www.qbitai.com/2026/06/434774.html)

---

## Microsoft SkillOpt：用一份 Markdown 文件让 GPT-5.5 提升 23 分

6 月 13 日，The Decoder 报道微软与三所中国大学合作开发了 SkillOpt，该方法利用传统模型训练的原理优化 AI 智能体的指令文档。仅需一份 Markdown 文件即可在程序性任务上将 GPT-5.5 提升约 23 个百分点，且同一文件可跨模型迁移。

> **AI Pulse 观点：** SkillOpt 的巧妙之处在于它绕过了传统的模型微调路径。不需要重新训练模型、不需要额外的 GPU 算力、不需要修改模型权重——只需优化指令文档（Prompt），就能带来相当于一次小型微调的性能提升。这说明当前大模型的能力远未被其默认 Prompt 充分释放，指令工程（Instruction Engineering）正在从"艺术"走向"科学"。对于企业来说，这意味着在不增加推理成本的情况下，通过优化指令即可获得显著的性能提升，ROI 极高。

来源：[The Decoder](https://the-decoder.com/microsofts-skillopt-boosts-gpt-5-5-by-using-nothing-but-a-trained-markdown-file/)

---

## Google Gemini-SQL2 在 text-to-SQL 基准测试中大幅领先

6 月 13 日，The Decoder 报道 Google Research 的 Gemini-SQL2 在 BIRD 基准测试中以 80.04% 的准确率登顶 text-to-SQL 领域，大幅领先 OpenAI 和 Anthropic 的模型。该模型基于 Gemini 3.1 Pro 构建，Google 表示该技术将改善其数据服务中的自然语言功能。

> **AI Pulse 观点：** text-to-SQL 是企业 AI 应用的核心场景之一——让非技术人员通过自然语言查询数据库。Gemini-SQL2 在 BIRD 基准上达到 80% 以上的准确率，意味着它已经可以处理大多数真实的业务查询场景。Google 将其整合到数据服务中，将直接威胁到 Snowflake、Databricks 等数据分析平台的自然语言查询功能。对于企业来说，这意味着 Google Workspace 的用户将能直接用自然语言操作 BigQuery，大幅降低数据分析的门槛。

来源：[The Decoder](https://the-decoder.com/google-researchs-gemini-sql2-tops-text-to-sql-benchmarks-by-a-wide-margin/)

---

## AI 编程智能体的盲点：找到文件却找不到关键代码行

6 月 14 日，The Decoder 报道一项新研究显示，AI 编程智能体（如 Claude Code 和 Codex）能够可靠地找到正确的文件，但会错过其中大部分关键代码行。新的 SWE-Explore 基准首次将代码搜索与实际修复分开测试，结果表明：缺乏足够的上下文，即使最好的修复也会失败。

> **AI Pulse 观点：** 这项研究揭示了当前 AI 编程工具的一个根本性限制：它们擅长"在哪里找"（文件级定位），但不够擅长"找什么"（行级精确识别）。这对于依赖 AI 编程工具的企业来说是一个重要提醒——AI 编程助手在简单任务上表现优异，但在涉及复杂代码库、多文件依赖关系的场景下，其"找到关键代码行"的能力仍然是瓶颈。SWE-Explore 基准的提出本身就是一个进步：它将编程任务分解为"搜索"和"修复"两个子任务，分别评估，这有助于更精确地诊断和改进 AI 编程工具的能力短板。

来源：[The Decoder](https://the-decoder.com/ai-coding-agents-find-the-right-file-but-miss-the-exact-lines-that-matter-study-shows/)

---

## Apple iOS 27 相机 AI：用 AI 赋予用户"超能力"

6 月 11 日，WIRED 报道 Apple 相机负责人 Jon McCormack 在接受采访时表示，AI 可以赋予用户"超能力"。iOS 27 的新照片应用将引入生成式 AI 功能，包括擦除人物、移动人物位置、甚至向场景中添加新对象。McCormack 强调 Apple 不会"为了 AI 而使用 AI"。

> **AI Pulse 观点：** Apple 在 AI 摄影上的态度一直比较克制，但 iOS 27 的生成式 AI 功能标志着 Apple 在这一领域的重大迈进。关键在于 Apple 的独特定位：它强调"不是为了 AI 而 AI"，而是在用户明确需要的场景下提供 AI 增强。这与 Google 和 Samsung 更激进的 AI 摄影功能形成对比。Apple 的核心优势在于其隐私保护承诺——所有 AI 处理在设备端完成，照片不会被上传到云端进行分析。这在当前对 AI 生成内容真实性的担忧日益增加的大环境下，是一个差异化优势。

来源：[WIRED](https://www.wired.com/story/apple-camera-chief-thinks-ai-can-give-you-superpowers/)

---

## Meta 员工强烈反对扎克伯格的 AI 黑客松计划

6 月 12 日，WIRED 报道 Meta 员工对扎克伯格提出的全公司 AI 黑客松计划表示强烈不满。据 WIRED 审查的内部讨论和消息来源，Meta 的新 AI 部门运营混乱，高管和员工都对公司的 AI 战略感到困扰。

> **AI Pulse 观点：** Meta 内部的 AI 战略混乱反映了大公司在 AI 转型中的典型困境。扎克伯格将大量资源投入 AI，但组织层面的整合和执行存在显著问题。员工的不满不仅仅是"不喜欢黑客松"——更深层的原因是 Meta 在 AI 方向上的频繁调整和优先级摇摆。在 Google DeepMind 和 Anthropic 等竞争对手稳步推进 AI 能力的同时，Meta 如果无法有效整合其 AI 资源（包括 LLaMA 开源生态、AI 硬件投资和内部 AI 产品），可能错失 AI 行业的下一个增长窗口。

来源：[WIRED](https://www.wired.com/story/meta-employees-absolutely-hate-mark-zuckerbergs-hackathon-idea/) | [WIRED](https://www.wired.com/story/mark-zuckerberg-meta-employee-meeting-interrupt-ai/)

---

## 其他值得关注的

- **2026 智源大会开幕**：推动 AI、物理世界和生命科学"三体互动"。来源：[量子位](https://www.qbitai.com/2026/06/435394.html)
- **HuggingFace CEO 力荐 HRM 模型**：Bengio 团队押注，1500 美元训出的 HRM 模型引发关注。来源：[量子位](https://www.qbitai.com/2026/06/435483.html)
- **Jiuwen Symbiosis**：Agent 终于长出了身体——华为开源的具身智能体平台背后的思考与实践。来源：[量子位](https://www.qbitai.com/2026/06/435455.html)
- **微软 CEO 纳德拉承认自己也是"Token 最大化者"**："这很上瘾"。来源：[The Decoder](https://the-decoder.com/microsoft-ceo-satya-nadella-admits-hes-a-token-maxer-too-its-addictive/)
- **"Count Anything"新 AI 模型发布**：精确计数能力，比听起来更难。来源：[The Decoder](https://the-decoder.com/new-ai-model-called-count-anything-does-exactly-what-it-says-and-thats-harder-than-it-sounds/)
- **印度就 Anthropic 事件辩论 AI 未来**：科技领袖讨论 Anthropic 事件是否是印度 AI 雄心的警钟。来源：[TechCrunch](https://techcrunch.com/2026/06/13/as-anthropic-suspends-access-to-new-models-india-debates-its-ai-future/)
- **千里智驾收购毫米波雷达公司**：强化自动驾驶感知能力。来源：[量子位](https://www.qbitai.com/2026/06/435196.html)

---

## 一句话总结

美国政府以国家安全为由强制 Anthropic 下线 Fable 5 和 Mythos 5 模型开启 AI 强监管新纪元，德国法院裁定 Google 需为 AI 生成内容担责树立法律先例，OpenAI 面临多州调查、Meta 被迫撤回 Manus 收购、KPMG AI 报告因伪造被撤回——AI 行业在技术狂奔的同时正遭遇前所未有的监管和法律挑战；与此同时，Claude Fable 5 在数学能力上飞跃至 88% 准确率、SpaceX 正式 IPO、Microsoft SkillOpt 用指令优化实现性能跃升，技术突破与监管约束的碰撞正在定义 AI 行业的新格局。

本周聚焦：AI 监管风暴席卷行业——Anthropic 模型被强制下线，Google 被判担责，SpaceX 敲响上市钟声

从海量 AI 资讯中提取真正有价值的信号

本周 AI 行业经历了堪称”监管风暴”的一周。美国政府以国家安全为由，强制 Anthropic 下线了刚刚发布的 Claude Fable 5 和 Mythos 5 两款旗舰模型，原因是发现有方法可以绕过其安全限制。OpenAI 同时面临多州总检察长调查。德国慕尼黑法院作出里程碑式裁决，判定 Google 需为其 AI Overviews 功能生成的虚假信息承担法律责任。Meta 则因北京方面的监管压力，被迫撤回 20 亿美元的 Manus 收购。与此同时，SpaceX 正式 IPO，马斯克远程敲钟引发市场热议。AI 行业正在经历从”自由发展”到”强监管”的历史性转折。

这是一个 AI 行业在技术狂奔与监管约束之间寻找平衡的关键周。

美国政府强制下线 Anthropic Claude Fable 5：国家安全与 AI 能力的碰撞

6 月 12 日，Anthropic 发布博客声明，宣布应美国政府出口管制指令，即刻下线 Claude Fable 5 和 Mythos 5 两款模型。Anthropic 表示：“政府认为其已发现了一种绕过或’越狱’Fable 5 的方法。“该指令要求 Anthropic 暂停所有”外国国民”对这两款模型的访问权限。

此前，Claude Fable 5 在 FrontierMath 最难题型上达到 88% 的准确率，大幅领先 GPT-5.5 的约 75%，较年初 Opus 4.5 不足 10% 的成绩实现了飞跃式提升。

AI Pulse 观点： 这是 AI 行业史上首次由政府强制指令导致模型下线，其深远影响远超单一事件。首先，它确立了一个危险先例：政府可以通过出口管制机制即时干预商业 AI 产品的可用性，而非通过传统的立法或监管流程。其次，亚马逊既是 Anthropic 的最大投资者又是举报者，这一矛盾角色揭示了 AI 行业”竞合关系”的复杂性——即使是同一阵营的玩家，在安全问题上的利益也不一致。最后，Fable 5 被下线的时间点恰逢其在数学能力上取得突破性进展，这不禁让人联想到：政府担心的究竟是安全漏洞，还是 AI 能力进步过快？

来源：WIRED | The Decoder | The Decoder

OpenAI 面临多州总检察长调查

AI Pulse 观点： 州级调查的兴起是美国 AI 监管格局碎片化的重要信号。在联邦层面，特朗普政府的行政令采取了相对宽松的”自愿提交”模式；但在州层面，总检察长们正在主动出击。OpenAI 的广告政策（特别是 ChatGPT 推广中的透明度问题）和健康数据处理（用户通过 ChatGPT 输入的医疗信息如何被使用）是两个高度敏感的领域。一旦多个州形成联合调查态势，OpenAI 可能面临比联邦监管更具约束力的法律后果。这也预示着 AI 公司的合规成本将大幅上升。

来源：TechCrunch

德国法院里程碑式裁决：Google 需为 AI Overviews 虚假信息承担法律责任

AI Pulse 观点： 这一裁决的里程碑意义在于：它首次确立了 AI 系统输出内容的法律责任归属。此前，科技公司普遍依赖”避风港”原则（类似于 DMCA 的第 230 条保护），主张自己只是平台而非内容发布者。慕尼黑法院的裁决直接打破了这一逻辑——如果你设计、训练并运营了生成内容的 AI 系统，你就是内容的责任方。这一判例如果被其他欧洲法院甚至美国法院采纳，将彻底改变搜索引擎和 AI 聊天机器人的运营模式。Google 可能需要为 AI Overviews 的每条回答承担事实核查义务，这在技术上和成本上都是巨大的挑战。

来源：WIRED

Meta 被迫撤回 20 亿美元 Manus 收购

AI Pulse 观点： Meta 撤回 Manus 收购反映了中美 AI 博弈的又一个维度。Manus 作为一家有中国背景的 AI 智能体公司，其被 Meta 收购触及了中国的数据安全和 AI 技术出口红线。北京方面的干预表明，中国正在收紧对 AI 技术和人才外流的管控。对于 Meta 来说，20 亿美元的沉没成本只是表面损失，更深层次的影响是：Meta 在 AI 智能体领域的布局被迫推迟，而 Manus 的技术和团队可能无法再为其所用。在中美 AI 脱钩的背景下，跨国 AI 并购的难度将越来越大。

来源：TechCrunch

KPMG AI 报告因伪造案例被撤回

6 月 13 日，TechCrunch 和 The Decoder 报道 KPMG 撤回了一份关于 AI 在商业中应用的报告，原因是该报告包含了伪造的案例研究，涉及瑞银（UBS）、英国国民保健署（NHS）等组织。GPTZero CEO 田天（Edward Tian）帮助发现了这些错误，并警告”二次幻觉”现象——来自知名咨询公司的虚假主张在未经核实的情况下广泛传播。

AI Pulse 观点： KPMG 事件揭示了 AI 行业一个危险的循环：咨询公司使用 AI 生成报告来推销 AI 服务，而报告中的内容本身就是 AI 幻觉的产物。这不仅是”AI 编造事实”的问题，更是”可信机构放大 AI 幻觉”的问题。当 KPMG 这样的四大会计师事务所发布包含伪造案例的报告时，客户和投资者会将其视为经过尽职调查的可靠信息。“二次幻觉”这个概念值得关注——它描述的是一旦虚假信息通过权威渠道发布，就会被后续的引用和分析不断放大，最终形成虚假共识。对于 AI 行业来说，建立内容真实性验证机制已不再是一个可选项，而是必须。

来源：TechCrunch | The Decoder

SpaceX 正式 IPO：马斯克远程敲钟

SpaceX 旗下拥有 SpaceXAI 实验室，其 IPO 被视为 AI 相关超级公司首次公开上市的重要里程碑。

AI Pulse 观点： SpaceX IPO 的意义不仅在于太空探索领域——其旗下的 SpaceXAI 实验室使其成为一家”AI+航天”的双重叙事公司。马斯克穿黄仁勋皮衣敲钟是一个精妙的符号：它暗示 SpaceX 的估值逻辑与 NVIDIA 的 AI 算力叙事紧密相连。SpaceX 的 Starlink 卫星互联网需要大量 AI 能力进行轨道管理和信号处理，而其 AI 实验室也在开发大模型。上市后，SpaceX 将有更多资金和透明度来推进其 AI 布局，这可能成为继 Anthropic 和 OpenAI 之后，AI 行业的第三个超级玩家进入公开市场。

来源：TechCrunch | WIRED | 量子位

Google DeepMind 警告：当数百万 AI 智能体开始交互时会发生什么？

AI Pulse 观点： DeepMind 的警告指向了一个被低估的 AI 安全维度：单个 AI 模型的安全性与多 AI 系统交互的安全性是完全不同的问题。就像单个蜜蜂的行为可预测，但蜂群的行为会出现涌现特性一样，数百万 AI 智能体在金融、交通、供应链等关键基础设施中交互时，可能出现设计者无法预见的级联效应。这不仅是技术问题，更是社会学和经济学问题。DeepMind 呼吁更多科学家（而非仅工程师）参与研究，说明他们已经意识到这超出了纯技术范畴。对于正在部署 AI Agent 的企业来说，这提醒我们：单个 Agent 的测试通过不代表系统级安全。

来源：MIT Technology Review

Claude Fable 5 在 FrontierMath 上超越 GPT-5.5 达 13 个百分点

AI Pulse 观点： FrontierMath 被广泛认为是最具挑战性的数学推理基准测试，涵盖代数、数论、组合数学等高等数学领域。Fable 5 达到 88% 的准确率意味着它已经能够解决绝大多数专业数学家才能处理的问题。从 Opus 4.5 的不足 10% 到 Fable 5 的 88%，这一进步幅度远超摩尔定律的速率。然而讽刺的是，正是这款在数学能力上取得突破性进展的模型，因为安全问题被美国政府强制下线。这提出了一个根本性问题：当 AI 的能力进步速度远超安全研究速度时，我们是否应该在部署前设置”能力阈值”——即当模型在某个领域的能力超过某个水平时，自动触发更严格的安全审查？

来源：The Decoder | 量子位

Microsoft SkillOpt：用一份 Markdown 文件让 GPT-5.5 提升 23 分

AI Pulse 观点： SkillOpt 的巧妙之处在于它绕过了传统的模型微调路径。不需要重新训练模型、不需要额外的 GPU 算力、不需要修改模型权重——只需优化指令文档（Prompt），就能带来相当于一次小型微调的性能提升。这说明当前大模型的能力远未被其默认 Prompt 充分释放，指令工程（Instruction Engineering）正在从”艺术”走向”科学”。对于企业来说，这意味着在不增加推理成本的情况下，通过优化指令即可获得显著的性能提升，ROI 极高。

来源：The Decoder

Google Gemini-SQL2 在 text-to-SQL 基准测试中大幅领先

AI Pulse 观点： text-to-SQL 是企业 AI 应用的核心场景之一——让非技术人员通过自然语言查询数据库。Gemini-SQL2 在 BIRD 基准上达到 80% 以上的准确率，意味着它已经可以处理大多数真实的业务查询场景。Google 将其整合到数据服务中，将直接威胁到 Snowflake、Databricks 等数据分析平台的自然语言查询功能。对于企业来说，这意味着 Google Workspace 的用户将能直接用自然语言操作 BigQuery，大幅降低数据分析的门槛。

来源：The Decoder

AI 编程智能体的盲点：找到文件却找不到关键代码行

AI Pulse 观点： 这项研究揭示了当前 AI 编程工具的一个根本性限制：它们擅长”在哪里找”（文件级定位），但不够擅长”找什么”（行级精确识别）。这对于依赖 AI 编程工具的企业来说是一个重要提醒——AI 编程助手在简单任务上表现优异，但在涉及复杂代码库、多文件依赖关系的场景下，其”找到关键代码行”的能力仍然是瓶颈。SWE-Explore 基准的提出本身就是一个进步：它将编程任务分解为”搜索”和”修复”两个子任务，分别评估，这有助于更精确地诊断和改进 AI 编程工具的能力短板。

来源：The Decoder

Apple iOS 27 相机 AI：用 AI 赋予用户”超能力”

6 月 11 日，WIRED 报道 Apple 相机负责人 Jon McCormack 在接受采访时表示，AI 可以赋予用户”超能力”。iOS 27 的新照片应用将引入生成式 AI 功能，包括擦除人物、移动人物位置、甚至向场景中添加新对象。McCormack 强调 Apple 不会”为了 AI 而使用 AI”。

AI Pulse 观点： Apple 在 AI 摄影上的态度一直比较克制，但 iOS 27 的生成式 AI 功能标志着 Apple 在这一领域的重大迈进。关键在于 Apple 的独特定位：它强调”不是为了 AI 而 AI”，而是在用户明确需要的场景下提供 AI 增强。这与 Google 和 Samsung 更激进的 AI 摄影功能形成对比。Apple 的核心优势在于其隐私保护承诺——所有 AI 处理在设备端完成，照片不会被上传到云端进行分析。这在当前对 AI 生成内容真实性的担忧日益增加的大环境下，是一个差异化优势。

来源：WIRED

Meta 员工强烈反对扎克伯格的 AI 黑客松计划

AI Pulse 观点： Meta 内部的 AI 战略混乱反映了大公司在 AI 转型中的典型困境。扎克伯格将大量资源投入 AI，但组织层面的整合和执行存在显著问题。员工的不满不仅仅是”不喜欢黑客松”——更深层的原因是 Meta 在 AI 方向上的频繁调整和优先级摇摆。在 Google DeepMind 和 Anthropic 等竞争对手稳步推进 AI 能力的同时，Meta 如果无法有效整合其 AI 资源（包括 LLaMA 开源生态、AI 硬件投资和内部 AI 产品），可能错失 AI 行业的下一个增长窗口。

来源：WIRED | WIRED

其他值得关注的

2026 智源大会开幕：推动 AI、物理世界和生命科学”三体互动”。来源：量子位
HuggingFace CEO 力荐 HRM 模型：Bengio 团队押注，1500 美元训出的 HRM 模型引发关注。来源：量子位
Jiuwen Symbiosis：Agent 终于长出了身体——华为开源的具身智能体平台背后的思考与实践。来源：量子位
微软 CEO 纳德拉承认自己也是”Token 最大化者”：“这很上瘾”。来源：The Decoder
“Count Anything”新 AI 模型发布：精确计数能力，比听起来更难。来源：The Decoder
印度就 Anthropic 事件辩论 AI 未来：科技领袖讨论 Anthropic 事件是否是印度 AI 雄心的警钟。来源：TechCrunch
千里智驾收购毫米波雷达公司：强化自动驾驶感知能力。来源：量子位