周报 2026 年第 22 周

AI Pulse 周报 | 2026-W22

AnthropicOpenAIMetaMicrosoftNVIDIADeepMindCognitionMistralAI Agent估值Claude

# 本周聚焦：Anthropic 逼近万亿美金，AI Agent 从编程走向操作系统，Claude 解出世纪数学难题

> 从海量 AI 资讯中提取真正有价值的信号

---

这一周 AI 行业的信息量再次爆炸。Anthropic 完成 650 亿美元 H 轮融资，估值逼近万亿美元——这是 AI 创业史上最大规模的单笔融资。Claude Opus 4.8 正式发布，在多数基准测试中超越 GPT-5.5，且快速模式便宜 3 倍。OpenAI 的 Codex 现在可以自主操作 Windows 电脑，从编程助手进化为操作系统级别的 Agent。Claude Mythos 据报解出了 OpenAI 的 landmark Erdős 数学难题。Meta 的内部备忘录泄露，揭示了 AI 吊坠、超级感知眼镜和企业可穿戴设备的完整战略。

这是一个"Agent 原生"加速到来的一周。

---

## Anthropic 完成 650 亿美元 H 轮融资，估值逼近万亿美元

5 月 28 日，The Decoder 报道 Anthropic 在 H 轮融资中筹集了 650 亿美元，估值逼近万亿美元大关。

这是 AI 创业史上最大规模的单笔融资之一。Anthropic 凭借 Claude 系列模型在企业市场的强劲表现，吸引了全球顶级资本的持续加注。

> **AI Pulse 观点：** 650 亿美元的单轮融资规模，超越了历史上几乎所有科技公司的单轮融资记录。这说明资本市场对 Anthropic 在 Claude 生态中的定位有着极高预期。万亿估值意味着 Anthropic 已经进入了与 Google、Meta、Microsoft 同等量级的讨论范围。但高估值也带来了高期待——Anthropic 需要在接下来的 12-18 个月内证明其商业化能力足以支撑这个数字。

来源：[The Decoder](https://the-decoder.com/claude-company-anthropic-nears-a-trillion-dollar-valuation-after-raising-65-billion-in-series-h/)

---

## Anthropic 发布 Claude Opus 4.8：多数基准超越 GPT-5.5，快速模式便宜 3 倍

5 月 28 日，The Decoder 和 VentureBeat 报道 Anthropic 发布 Claude Opus 4.8，被官方描述为"适度但切实的改进"，在多数基准测试中超越 GPT-5.5，同时快速模式价格便宜 3 倍。

Opus 4.8 的定位很有趣——不是革命性的跳跃，而是稳定的、可感知的提升，同时大幅降低成本。

> **AI Pulse 观点：** 在 Claude Mythos 已经占据性能制高点的情况下，Opus 4.8 的发布策略非常务实：不追求"最强"的叙事，而是提供"够用且便宜"的选择。快速模式便宜 3 倍意味着企业用户可以以更低的成本部署 Claude 能力。这可能是 Anthropic 应对 DeepSeek 等低价竞争者的差异化回应——不是拼绝对低价，而是拼"性价比"。

来源：[The Decoder](https://the-decoder.com/anthropic-ships-claude-opus-4-8-as-a-modest-but-tangible-improvement-that-tops-gpt-5-5-in-most-benchmarks/) | [VentureBeat](https://venturebeat.com/technology/anthropics-claude-opus-4-8-is-here-with-3x-cheaper-fast-mode-and-near-mythos-level-alignment/)

---

## Sam Altman 和 Dario Amodei 撤回 AI 末日预测

5 月 27 日，The Decoder 报道 OpenAI CEO Sam Altman 和 Anthropic CEO Dario Amodei 都撤回或淡化了他们此前关于 AI 导致大规模失业的预测。

两位顶级 AI 公司 CEO 的态度转变，反映了对 AI 替代人类速度和时间线的重新评估。

> **AI Pulse 观点：** 这是一个有趣的信号。此前 AI 领袖们普遍持"AI 将取代大量工作"的末日叙事，现在他们开始回调。这可能是因为实际企业部署数据显示 AI 的替代速度比预期慢，也可能是因为政治和社会压力的结果。但更可能的解释是：他们发现 AI 更像是"能力放大器"而非"工作替代品"——这与我们在 Agent 领域看到的趋势一致，AI 正在扩展人类的能力边界，而非简单地替代。

来源：[The Decoder](https://the-decoder.com/sam-altman-and-dario-amodei-walk-back-their-ai-job-apocalypse-predictions/)

---

## OpenAI Codex 可自主操作 Windows 电脑，自动猎杀 bug 和测试应用

5 月 30 日，The Decoder 报道 OpenAI 的 Codex 现在可以自主操作 Windows 电脑，独立猎杀 bug 和测试应用。

Codex 从编程助手进化为操作系统级别的自主 Agent——它不再只是生成代码，而是可以像人类一样在操作系统中执行任务。

> **AI Pulse 观点：** 这是 AI Agent 从"工具"走向"同事"的关键一步。当 AI 可以自主操作整个操作系统时，它的角色就从"你让它写什么就写什么"的代码生成器，变成了"你自己去看、自己去修"的自主工程师。这意味着 AI 在软件工程中的渗透率将进一步加速。但同时也带来了新的安全问题：一个拥有操作系统级访问权的 AI Agent，其权限边界和安全护栏需要重新定义。

来源：[The Decoder](https://the-decoder.com/openais-codex-can-now-operate-your-windows-pc-autonomously-hunting-bugs-and-testing-apps-on-its-own/)

---

## Meta 泄露备忘录曝光：AI 吊坠、超级感知眼镜与企业可穿戴设备战略

5 月 30 日，The Decoder 和 TechCrunch 报道 Meta 的一份内部备忘录泄露，揭示了公司在 AI 吊坠（AI pendant）、超级感知眼镜（supersensing glasses）和企业可穿戴设备方面的完整战略。

Zuckerberg 终于给之前海量的 AI 硬件投资标上了价格——Meta 正在全面押注 AI 可穿戴设备。

> **AI Pulse 观点：** Meta 的战略野心很大：从 pendant（可能是类似 Rabbit R1 或 Humane Pin 的独立 AI 设备）到 supersensing glasses（远超 Google AI 眼镜的能力），再到企业级可穿戴设备。这说明 Meta 认为 AI 的下一个交互入口不在手机、不在电脑，而在"穿戴在身上"的设备。但 Meta 之前在硬件领域（如 Ray-Ban Stories、Portal）有过失败经验，这次能否成功取决于 AI 能力是否足以支撑全新的交互范式。

来源：[The Decoder](https://the-decoder.com/metas-leaked-memo-reveals-ai-pendant-supersensing-glasses-and-enterprise-wearables-strategy/) | [TechCrunch](https://techcrunch.com/2026/05/30/meta-is-reportedly-developing-an-ai-pendant/)

---

## Microsoft 与 NVIDIA 联手打造 AI PC：运行真正的 Agent 而非 Copilot

5 月 30 日，The Decoder 报道 Microsoft 和 NVIDIA 正在合作开发 AI PC，这种 PC 将运行真正的自主 Agent，而非现有的 Copilot 助手。

这标志着 Microsoft 对 AI PC 的定位发生了根本性转变——从"辅助工具"升级为"自主执行者"。

> **AI Pulse 观点：** Copilot 的本质是"你问它答"，而真正的 Agent 是"给它目标，它自己完成"。如果 Microsoft 和 NVIDIA 联手把这种能力集成到 PC 硬件层面，那将是一次平台级的变革。NVIDIA 提供本地推理算力，Microsoft 提供 Agent 框架和操作系统集成——这是一个完整的本地 AI Agent 栈。这也意味着 AI Agent 的部署将从云端加速向边缘延伸。

来源：[The Decoder](https://the-decoder.com/microsoft-and-nvidia-reportedly-team-up-on-ai-pcs-that-run-actual-agents-instead-of-copilot/)

---

## Claude Mythos 据报解出 OpenAI landmark Erdős 数学难题

5 月 26 日，The Decoder 报道 Claude Mythos 据报以"简洁优美的证明"解出了 OpenAI 提出的 landmark Erdős 数学难题。

如果属实，这是 AI 在纯数学推理领域的又一个里程碑式突破。

> **AI Pulse 观点：** Erdős 问题是组合数学中的经典难题，OpenAI 曾将其作为测试 AI 数学推理能力的 benchmark。Claude Mythos 能以"简洁优美的证明"解出，说明其推理能力已经超越了"暴力搜索 + 模式匹配"的阶段，进入了"真正理解数学结构"的层面。结合之前 DeepMind 的 AlphaProof Nexus 也以几百美元的成本解出了数十年的数学难题，2026 年正在成为 AI 数学能力的爆发年。

来源：[The Decoder](https://the-decoder.com/claude-mythos-reportedly-solves-openais-landmark-erdos-problem-with-a-cute-simple-proof/)

---

## Cognition（Devin 母公司）估值不到 9 个月翻倍至 260 亿美元

5 月 27 日，The Decoder 报道 AI 编程 Agent Devin 的母公司 Cognition 在不到 9 个月内估值翻倍至 260 亿美元。

这是 AI Agent 赛道最耀眼的明星公司之一。Devin 作为首批引发广泛关注的自主编程 Agent，已经证明了市场愿意为"AI 程序员"支付巨额溢价。

> **AI Pulse 观点：** 9 个月估值翻倍，说明 AI Agent 在编程领域的商业化进展远超市场预期。但 260 亿美元的估值也意味着 Cognition 需要在产品化和收入增长上给出令人信服的表现。随着 OpenAI Codex、Claude Code 等竞品的快速迭代，Devin 的先发优势能否持续是一个关键问题。

来源：[The Decoder](https://the-decoder.com/ai-coding-agent-devin-maker-cognition-more-than-doubles-its-valuation-to-26-billion-in-under-nine-months/)

---

## Mistral 将 LeChat 更名为 Vibe，押注全功能工作 Agent

5 月 28 日，The Decoder 和 VentureBeat 报道 Mistral AI 将 LeChat 更名为 Vibe，并宣布向工业 AI 领域扩展，同时宣布数据中心扩展计划以挑战 OpenAI。

这标志着 Mistral 从"开源模型公司"向"全栈 AI Agent 平台"的战略转型。

> **AI Pulse 观点：** "Vibe"这个名字很有意思——它暗示的是一种自然、直觉式的工作体验，而非传统的"聊天机器人"。Mistral 的战略非常清晰：在模型层保持开源竞争力，在应用层通过 Vibe 打造企业级 Agent 平台，同时通过自建数据中心降低对芯片供应链的依赖。这是一个"三条腿走路"的策略，在欧洲 AI 主权叙事下尤其有吸引力。

来源：[The Decoder](https://the-decoder.com/mistral-rebrands-lechat-as-vibe-betting-its-chatbots-future-is-as-a-full-blown-work-agent/) | [VentureBeat](https://venturebeat.com/technology/mistral-ai-launches-vibe-expands-into-industrial-ai-and-announces-data-center-push-to-challenge-openai/)

---

## 一家公司单月在 Claude 上花费 5 亿美元，因未能设置用量上限

5 月 29 日，The Decoder 报道一家公司在未能设置 AI 用量上限的情况下，单月在 Claude 上花费了 5 亿美元。

这个数字令人震惊——它暴露了企业 AI 部署中的一个关键问题：成本管控。

> **AI Pulse 观点：** 5 亿美元一个月的 AI 账单，说明企业在采用 AI Agent 时面临的"成本失控"风险是真实存在的。当 AI Agent 开始自主执行任务（如编程、数据分析、客户交互），用量会呈指数级增长。这催生了一个新的市场需求：AI 用量管理和成本优化。Pinterest 同期报道通过砍掉前沿模型的视觉层节省了 90% 的 AI 成本，说明优化空间巨大。

来源：[The Decoder](https://the-decoder.com/one-company-reportedly-spent-500-million-on-claude-in-one-month-after-failing-to-cap-ai-usage/)

---

## DeepMind AlphaProof Nexus 以几百美元成本解出数十年数学难题

5 月 27 日，The Decoder 报道 Google DeepMind 的 AlphaProof Nexus 以仅几百美元的成本解出了困扰数学界数十年的难题。

这是 AI 在数学推理领域的又一个突破性进展，且成本极低。

> **AI Pulse 观点：** "几百美元"这个数字比"解出难题"本身更值得关注。它意味着 AI 解决数学问题的成本已经低到可以被广泛使用的程度。这不是一个实验室里的炫技，而是可以量产的数学推理能力。结合 Claude Mythos 解出 Erdős 问题的消息，AI 数学推理正在从"能做一些"走向"能做很多"。

来源：[The Decoder](https://the-decoder.com/google-deepminds-alphaproof-nexus-solves-decades-old-math-problems-for-a-few-hundred-dollars/)

---

## Robinhood 允许 AI Agent 自主交易股票和刷卡消费

5 月 27 日，The Decoder 报道 Robinhood 允许 AI Agent 为客户自主交易股票和进行信用卡消费。

这是 AI Agent 进入金融领域的重要一步——从"辅助决策"到"自主执行"。

> **AI Pulse 观点：** 让 AI Agent 自主交易股票和消费，这是一个巨大的信任门槛。Robinhood 此举意味着他们认为 AI Agent 的决策质量已经可以独立承担金融后果。但这也带来了新的监管问题：当 AI Agent 自主交易导致亏损，责任归谁？这是金融科技领域必须回答的问题。

来源：[The Decoder](https://the-decoder.com/robinhood-lets-ai-agents-trade-shares-and-make-credit-card-purchases-for-customers/)

---

## 其他值得关注的

- **YouTube 本月开始自动标记 AI 生成视频**。来源：[The Decoder](https://the-decoder.com/youtube-will-try-to-automatically-flag-ai-videos-starting-this-month/)
- **SoftBank 计划在法国投资 750 亿欧元建设 AI 数据中心**。来源：[The Decoder](https://the-decoder.com/softbank-plans-75-billion-euro-ai-data-center-buildout-in-france/)
- **Google 推出可本地运行 Gemma 3 的小型开发板**。来源：[The Decoder](https://the-decoder.com/google-launches-a-tiny-board-that-runs-gemma-3-locally/)
- **Salesforce 声称 AI Agent 将 231 天的迁移缩短到 13 天，且事故更少**。来源：[The Decoder](https://the-decoder.com/salesforce-claims-ai-agents-cut-a-231-day-migration-to-13-days-with-fewer-incidents/)
- **OpenAI 免费开放生命科学 AI 模型，帮助各国政府为下一次大流行做准备**。来源：[The Decoder](https://the-decoder.com/openai-is-giving-away-its-life-sciences-ai-model-to-help-governments-prepare-for-the-next-pandemic/)
- **Pinterest 通过砍掉前沿模型的视觉层将 AI 成本降低 90%**。来源：[VentureBeat](https://venturebeat.com/orchestration/pinterest-cut-ai-costs-90-by-gutting-a-frontier-models-vision-layer/)
- **VentureBeat 报道 AI Agent 的瓶颈不是模型性能而是权限管理**。来源：[VentureBeat](https://venturebeat.com/orchestration/the-ai-agent-bottleneck-isnt-model-performance-its-permissions/)
- **VentureBeat 报道 MeMo 的记忆模型让团队无需重新训练即可升级 LLM，性能提升 26%**。来源：[VentureBeat](https://venturebeat.com/orchestration/memo-memory-model-teams-upgrade-llm-without-retraining)
- **StepFun 发布 Step 3.7 Flash：198B MoE 视觉语言模型，面向编程 Agent 和搜索工作流**。来源：[Marktechpost](https://www.marktechpost.com/2026/05/29/stepfun-releases-step-3-7-flash-a-198b-moe-vision-language-model-for-coding-agents-and-search-workflows/)
- **Genesis AI 发布 Nyx、Quadrants 和 Genesis World 1.0 物理平台，用于可扩展的机器人基础模型评估**。来源：[Marktechpost](https://www.marktechpost.com/2026/05/30/genesis-ai-releases-nyx-quadrants-and-genesis-world-1-0-physics-platform-for-scalable-robotics-foundation-model-evaluation/)
- **中国据报要求顶尖 AI 研究人员出境前需获得许可**。来源：[The Decoder](https://the-decoder.com/china-reportedly-now-requires-top-ai-researchers-to-get-permission-before-leaving-the-country/)
- **4nm！比亚迪自研 AI 芯片**：制程对齐英伟达，算力拉爆特斯拉。来源：[量子位](https://www.qbitai.com/2026/05/426557.html)
- **复旦系团队出品机器人原生世界动作模型**：首创时空一体架构。来源：[量子位](https://www.qbitai.com/2026/05/426984.html)

---

## 一句话总结

Anthropic 以 650 亿美元融资逼近万亿估值，Claude Opus 4.8 和 Mythos 双线推进，OpenAI Codex 进化为操作系统级 Agent，Meta 和 Microsoft 分别在硬件和本地 AI PC 上押注未来。AI Agent 正在从"编程辅助"走向"自主执行"，从"云端"走向"边缘"，从"工具"走向"同事"。

本周聚焦：Anthropic 逼近万亿美金，AI Agent 从编程走向操作系统，Claude 解出世纪数学难题

从海量 AI 资讯中提取真正有价值的信号

这是一个”Agent 原生”加速到来的一周。

Anthropic 完成 650 亿美元 H 轮融资，估值逼近万亿美元

5 月 28 日，The Decoder 报道 Anthropic 在 H 轮融资中筹集了 650 亿美元，估值逼近万亿美元大关。

这是 AI 创业史上最大规模的单笔融资之一。Anthropic 凭借 Claude 系列模型在企业市场的强劲表现，吸引了全球顶级资本的持续加注。

AI Pulse 观点： 650 亿美元的单轮融资规模，超越了历史上几乎所有科技公司的单轮融资记录。这说明资本市场对 Anthropic 在 Claude 生态中的定位有着极高预期。万亿估值意味着 Anthropic 已经进入了与 Google、Meta、Microsoft 同等量级的讨论范围。但高估值也带来了高期待——Anthropic 需要在接下来的 12-18 个月内证明其商业化能力足以支撑这个数字。

来源：The Decoder

Anthropic 发布 Claude Opus 4.8：多数基准超越 GPT-5.5，快速模式便宜 3 倍

5 月 28 日，The Decoder 和 VentureBeat 报道 Anthropic 发布 Claude Opus 4.8，被官方描述为”适度但切实的改进”，在多数基准测试中超越 GPT-5.5，同时快速模式价格便宜 3 倍。

Opus 4.8 的定位很有趣——不是革命性的跳跃，而是稳定的、可感知的提升，同时大幅降低成本。

AI Pulse 观点： 在 Claude Mythos 已经占据性能制高点的情况下，Opus 4.8 的发布策略非常务实：不追求”最强”的叙事，而是提供”够用且便宜”的选择。快速模式便宜 3 倍意味着企业用户可以以更低的成本部署 Claude 能力。这可能是 Anthropic 应对 DeepSeek 等低价竞争者的差异化回应——不是拼绝对低价，而是拼”性价比”。

来源：The Decoder | VentureBeat

Sam Altman 和 Dario Amodei 撤回 AI 末日预测

5 月 27 日，The Decoder 报道 OpenAI CEO Sam Altman 和 Anthropic CEO Dario Amodei 都撤回或淡化了他们此前关于 AI 导致大规模失业的预测。

两位顶级 AI 公司 CEO 的态度转变，反映了对 AI 替代人类速度和时间线的重新评估。

AI Pulse 观点： 这是一个有趣的信号。此前 AI 领袖们普遍持”AI 将取代大量工作”的末日叙事，现在他们开始回调。这可能是因为实际企业部署数据显示 AI 的替代速度比预期慢，也可能是因为政治和社会压力的结果。但更可能的解释是：他们发现 AI 更像是”能力放大器”而非”工作替代品”——这与我们在 Agent 领域看到的趋势一致，AI 正在扩展人类的能力边界，而非简单地替代。

来源：The Decoder

OpenAI Codex 可自主操作 Windows 电脑，自动猎杀 bug 和测试应用

5 月 30 日，The Decoder 报道 OpenAI 的 Codex 现在可以自主操作 Windows 电脑，独立猎杀 bug 和测试应用。

Codex 从编程助手进化为操作系统级别的自主 Agent——它不再只是生成代码，而是可以像人类一样在操作系统中执行任务。

AI Pulse 观点： 这是 AI Agent 从”工具”走向”同事”的关键一步。当 AI 可以自主操作整个操作系统时，它的角色就从”你让它写什么就写什么”的代码生成器，变成了”你自己去看、自己去修”的自主工程师。这意味着 AI 在软件工程中的渗透率将进一步加速。但同时也带来了新的安全问题：一个拥有操作系统级访问权的 AI Agent，其权限边界和安全护栏需要重新定义。

来源：The Decoder

Meta 泄露备忘录曝光：AI 吊坠、超级感知眼镜与企业可穿戴设备战略

Zuckerberg 终于给之前海量的 AI 硬件投资标上了价格——Meta 正在全面押注 AI 可穿戴设备。

AI Pulse 观点： Meta 的战略野心很大：从 pendant（可能是类似 Rabbit R1 或 Humane Pin 的独立 AI 设备）到 supersensing glasses（远超 Google AI 眼镜的能力），再到企业级可穿戴设备。这说明 Meta 认为 AI 的下一个交互入口不在手机、不在电脑，而在”穿戴在身上”的设备。但 Meta 之前在硬件领域（如 Ray-Ban Stories、Portal）有过失败经验，这次能否成功取决于 AI 能力是否足以支撑全新的交互范式。

来源：The Decoder | TechCrunch

Microsoft 与 NVIDIA 联手打造 AI PC：运行真正的 Agent 而非 Copilot

5 月 30 日，The Decoder 报道 Microsoft 和 NVIDIA 正在合作开发 AI PC，这种 PC 将运行真正的自主 Agent，而非现有的 Copilot 助手。

这标志着 Microsoft 对 AI PC 的定位发生了根本性转变——从”辅助工具”升级为”自主执行者”。

AI Pulse 观点： Copilot 的本质是”你问它答”，而真正的 Agent 是”给它目标，它自己完成”。如果 Microsoft 和 NVIDIA 联手把这种能力集成到 PC 硬件层面，那将是一次平台级的变革。NVIDIA 提供本地推理算力，Microsoft 提供 Agent 框架和操作系统集成——这是一个完整的本地 AI Agent 栈。这也意味着 AI Agent 的部署将从云端加速向边缘延伸。

来源：The Decoder

Claude Mythos 据报解出 OpenAI landmark Erdős 数学难题

5 月 26 日，The Decoder 报道 Claude Mythos 据报以”简洁优美的证明”解出了 OpenAI 提出的 landmark Erdős 数学难题。

如果属实，这是 AI 在纯数学推理领域的又一个里程碑式突破。

AI Pulse 观点： Erdős 问题是组合数学中的经典难题，OpenAI 曾将其作为测试 AI 数学推理能力的 benchmark。Claude Mythos 能以”简洁优美的证明”解出，说明其推理能力已经超越了”暴力搜索 + 模式匹配”的阶段，进入了”真正理解数学结构”的层面。结合之前 DeepMind 的 AlphaProof Nexus 也以几百美元的成本解出了数十年的数学难题，2026 年正在成为 AI 数学能力的爆发年。

来源：The Decoder

Cognition（Devin 母公司）估值不到 9 个月翻倍至 260 亿美元

5 月 27 日，The Decoder 报道 AI 编程 Agent Devin 的母公司 Cognition 在不到 9 个月内估值翻倍至 260 亿美元。

这是 AI Agent 赛道最耀眼的明星公司之一。Devin 作为首批引发广泛关注的自主编程 Agent，已经证明了市场愿意为”AI 程序员”支付巨额溢价。

AI Pulse 观点： 9 个月估值翻倍，说明 AI Agent 在编程领域的商业化进展远超市场预期。但 260 亿美元的估值也意味着 Cognition 需要在产品化和收入增长上给出令人信服的表现。随着 OpenAI Codex、Claude Code 等竞品的快速迭代，Devin 的先发优势能否持续是一个关键问题。

来源：The Decoder

Mistral 将 LeChat 更名为 Vibe，押注全功能工作 Agent

5 月 28 日，The Decoder 和 VentureBeat 报道 Mistral AI 将 LeChat 更名为 Vibe，并宣布向工业 AI 领域扩展，同时宣布数据中心扩展计划以挑战 OpenAI。

这标志着 Mistral 从”开源模型公司”向”全栈 AI Agent 平台”的战略转型。

AI Pulse 观点： “Vibe”这个名字很有意思——它暗示的是一种自然、直觉式的工作体验，而非传统的”聊天机器人”。Mistral 的战略非常清晰：在模型层保持开源竞争力，在应用层通过 Vibe 打造企业级 Agent 平台，同时通过自建数据中心降低对芯片供应链的依赖。这是一个”三条腿走路”的策略，在欧洲 AI 主权叙事下尤其有吸引力。

来源：The Decoder | VentureBeat

一家公司单月在 Claude 上花费 5 亿美元，因未能设置用量上限

5 月 29 日，The Decoder 报道一家公司在未能设置 AI 用量上限的情况下，单月在 Claude 上花费了 5 亿美元。

这个数字令人震惊——它暴露了企业 AI 部署中的一个关键问题：成本管控。

AI Pulse 观点： 5 亿美元一个月的 AI 账单，说明企业在采用 AI Agent 时面临的”成本失控”风险是真实存在的。当 AI Agent 开始自主执行任务（如编程、数据分析、客户交互），用量会呈指数级增长。这催生了一个新的市场需求：AI 用量管理和成本优化。Pinterest 同期报道通过砍掉前沿模型的视觉层节省了 90% 的 AI 成本，说明优化空间巨大。

来源：The Decoder

DeepMind AlphaProof Nexus 以几百美元成本解出数十年数学难题

5 月 27 日，The Decoder 报道 Google DeepMind 的 AlphaProof Nexus 以仅几百美元的成本解出了困扰数学界数十年的难题。

这是 AI 在数学推理领域的又一个突破性进展，且成本极低。

AI Pulse 观点： “几百美元”这个数字比”解出难题”本身更值得关注。它意味着 AI 解决数学问题的成本已经低到可以被广泛使用的程度。这不是一个实验室里的炫技，而是可以量产的数学推理能力。结合 Claude Mythos 解出 Erdős 问题的消息，AI 数学推理正在从”能做一些”走向”能做很多”。

来源：The Decoder

Robinhood 允许 AI Agent 自主交易股票和刷卡消费

5 月 27 日，The Decoder 报道 Robinhood 允许 AI Agent 为客户自主交易股票和进行信用卡消费。

这是 AI Agent 进入金融领域的重要一步——从”辅助决策”到”自主执行”。

AI Pulse 观点： 让 AI Agent 自主交易股票和消费，这是一个巨大的信任门槛。Robinhood 此举意味着他们认为 AI Agent 的决策质量已经可以独立承担金融后果。但这也带来了新的监管问题：当 AI Agent 自主交易导致亏损，责任归谁？这是金融科技领域必须回答的问题。

来源：The Decoder

其他值得关注的

YouTube 本月开始自动标记 AI 生成视频。来源：The Decoder
SoftBank 计划在法国投资 750 亿欧元建设 AI 数据中心。来源：The Decoder
Google 推出可本地运行 Gemma 3 的小型开发板。来源：The Decoder
Salesforce 声称 AI Agent 将 231 天的迁移缩短到 13 天，且事故更少。来源：The Decoder
OpenAI 免费开放生命科学 AI 模型，帮助各国政府为下一次大流行做准备。来源：The Decoder
Pinterest 通过砍掉前沿模型的视觉层将 AI 成本降低 90%。来源：VentureBeat
VentureBeat 报道 AI Agent 的瓶颈不是模型性能而是权限管理。来源：VentureBeat
VentureBeat 报道 MeMo 的记忆模型让团队无需重新训练即可升级 LLM，性能提升 26%。来源：VentureBeat
StepFun 发布 Step 3.7 Flash：198B MoE 视觉语言模型，面向编程 Agent 和搜索工作流。来源：Marktechpost
Genesis AI 发布 Nyx、Quadrants 和 Genesis World 1.0 物理平台，用于可扩展的机器人基础模型评估。来源：Marktechpost
中国据报要求顶尖 AI 研究人员出境前需获得许可。来源：The Decoder
4nm！比亚迪自研 AI 芯片：制程对齐英伟达，算力拉爆特斯拉。来源：量子位
复旦系团队出品机器人原生世界动作模型：首创时空一体架构。来源：量子位

一句话总结

Anthropic 以 650 亿美元融资逼近万亿估值，Claude Opus 4.8 和 Mythos 双线推进，OpenAI Codex 进化为操作系统级 Agent，Meta 和 Microsoft 分别在硬件和本地 AI PC 上押注未来。AI Agent 正在从”编程辅助”走向”自主执行”，从”云端”走向”边缘”，从”工具”走向”同事”。