返回列表
周报 2026 年第 22 周

AI Pulse 周报 | 2026-W22

AnthropicOpenAIMetaMicrosoftNVIDIADeepMindCognitionMistralAI Agent估值Claude

本周聚焦:Anthropic 逼近万亿美金,AI Agent 从编程走向操作系统,Claude 解出世纪数学难题

从海量 AI 资讯中提取真正有价值的信号


这一周 AI 行业的信息量再次爆炸。Anthropic 完成 650 亿美元 H 轮融资,估值逼近万亿美元——这是 AI 创业史上最大规模的单笔融资。Claude Opus 4.8 正式发布,在多数基准测试中超越 GPT-5.5,且快速模式便宜 3 倍。OpenAI 的 Codex 现在可以自主操作 Windows 电脑,从编程助手进化为操作系统级别的 Agent。Claude Mythos 据报解出了 OpenAI 的 landmark Erdős 数学难题。Meta 的内部备忘录泄露,揭示了 AI 吊坠、超级感知眼镜和企业可穿戴设备的完整战略。

这是一个”Agent 原生”加速到来的一周。


Anthropic 完成 650 亿美元 H 轮融资,估值逼近万亿美元

5 月 28 日,The Decoder 报道 Anthropic 在 H 轮融资中筹集了 650 亿美元,估值逼近万亿美元大关。

这是 AI 创业史上最大规模的单笔融资之一。Anthropic 凭借 Claude 系列模型在企业市场的强劲表现,吸引了全球顶级资本的持续加注。

AI Pulse 观点: 650 亿美元的单轮融资规模,超越了历史上几乎所有科技公司的单轮融资记录。这说明资本市场对 Anthropic 在 Claude 生态中的定位有着极高预期。万亿估值意味着 Anthropic 已经进入了与 Google、Meta、Microsoft 同等量级的讨论范围。但高估值也带来了高期待——Anthropic 需要在接下来的 12-18 个月内证明其商业化能力足以支撑这个数字。

来源:The Decoder


Anthropic 发布 Claude Opus 4.8:多数基准超越 GPT-5.5,快速模式便宜 3 倍

5 月 28 日,The Decoder 和 VentureBeat 报道 Anthropic 发布 Claude Opus 4.8,被官方描述为”适度但切实的改进”,在多数基准测试中超越 GPT-5.5,同时快速模式价格便宜 3 倍。

Opus 4.8 的定位很有趣——不是革命性的跳跃,而是稳定的、可感知的提升,同时大幅降低成本。

AI Pulse 观点: 在 Claude Mythos 已经占据性能制高点的情况下,Opus 4.8 的发布策略非常务实:不追求”最强”的叙事,而是提供”够用且便宜”的选择。快速模式便宜 3 倍意味着企业用户可以以更低的成本部署 Claude 能力。这可能是 Anthropic 应对 DeepSeek 等低价竞争者的差异化回应——不是拼绝对低价,而是拼”性价比”。

来源:The Decoder | VentureBeat


Sam Altman 和 Dario Amodei 撤回 AI 末日预测

5 月 27 日,The Decoder 报道 OpenAI CEO Sam Altman 和 Anthropic CEO Dario Amodei 都撤回或淡化了他们此前关于 AI 导致大规模失业的预测。

两位顶级 AI 公司 CEO 的态度转变,反映了对 AI 替代人类速度和时间线的重新评估。

AI Pulse 观点: 这是一个有趣的信号。此前 AI 领袖们普遍持”AI 将取代大量工作”的末日叙事,现在他们开始回调。这可能是因为实际企业部署数据显示 AI 的替代速度比预期慢,也可能是因为政治和社会压力的结果。但更可能的解释是:他们发现 AI 更像是”能力放大器”而非”工作替代品”——这与我们在 Agent 领域看到的趋势一致,AI 正在扩展人类的能力边界,而非简单地替代。

来源:The Decoder


OpenAI Codex 可自主操作 Windows 电脑,自动猎杀 bug 和测试应用

5 月 30 日,The Decoder 报道 OpenAI 的 Codex 现在可以自主操作 Windows 电脑,独立猎杀 bug 和测试应用。

Codex 从编程助手进化为操作系统级别的自主 Agent——它不再只是生成代码,而是可以像人类一样在操作系统中执行任务。

AI Pulse 观点: 这是 AI Agent 从”工具”走向”同事”的关键一步。当 AI 可以自主操作整个操作系统时,它的角色就从”你让它写什么就写什么”的代码生成器,变成了”你自己去看、自己去修”的自主工程师。这意味着 AI 在软件工程中的渗透率将进一步加速。但同时也带来了新的安全问题:一个拥有操作系统级访问权的 AI Agent,其权限边界和安全护栏需要重新定义。

来源:The Decoder


Meta 泄露备忘录曝光:AI 吊坠、超级感知眼镜与企业可穿戴设备战略

5 月 30 日,The Decoder 和 TechCrunch 报道 Meta 的一份内部备忘录泄露,揭示了公司在 AI 吊坠(AI pendant)、超级感知眼镜(supersensing glasses)和企业可穿戴设备方面的完整战略。

Zuckerberg 终于给之前海量的 AI 硬件投资标上了价格——Meta 正在全面押注 AI 可穿戴设备。

AI Pulse 观点: Meta 的战略野心很大:从 pendant(可能是类似 Rabbit R1 或 Humane Pin 的独立 AI 设备)到 supersensing glasses(远超 Google AI 眼镜的能力),再到企业级可穿戴设备。这说明 Meta 认为 AI 的下一个交互入口不在手机、不在电脑,而在”穿戴在身上”的设备。但 Meta 之前在硬件领域(如 Ray-Ban Stories、Portal)有过失败经验,这次能否成功取决于 AI 能力是否足以支撑全新的交互范式。

来源:The Decoder | TechCrunch


Microsoft 与 NVIDIA 联手打造 AI PC:运行真正的 Agent 而非 Copilot

5 月 30 日,The Decoder 报道 Microsoft 和 NVIDIA 正在合作开发 AI PC,这种 PC 将运行真正的自主 Agent,而非现有的 Copilot 助手。

这标志着 Microsoft 对 AI PC 的定位发生了根本性转变——从”辅助工具”升级为”自主执行者”。

AI Pulse 观点: Copilot 的本质是”你问它答”,而真正的 Agent 是”给它目标,它自己完成”。如果 Microsoft 和 NVIDIA 联手把这种能力集成到 PC 硬件层面,那将是一次平台级的变革。NVIDIA 提供本地推理算力,Microsoft 提供 Agent 框架和操作系统集成——这是一个完整的本地 AI Agent 栈。这也意味着 AI Agent 的部署将从云端加速向边缘延伸。

来源:The Decoder


Claude Mythos 据报解出 OpenAI landmark Erdős 数学难题

5 月 26 日,The Decoder 报道 Claude Mythos 据报以”简洁优美的证明”解出了 OpenAI 提出的 landmark Erdős 数学难题。

如果属实,这是 AI 在纯数学推理领域的又一个里程碑式突破。

AI Pulse 观点: Erdős 问题是组合数学中的经典难题,OpenAI 曾将其作为测试 AI 数学推理能力的 benchmark。Claude Mythos 能以”简洁优美的证明”解出,说明其推理能力已经超越了”暴力搜索 + 模式匹配”的阶段,进入了”真正理解数学结构”的层面。结合之前 DeepMind 的 AlphaProof Nexus 也以几百美元的成本解出了数十年的数学难题,2026 年正在成为 AI 数学能力的爆发年。

来源:The Decoder


Cognition(Devin 母公司)估值不到 9 个月翻倍至 260 亿美元

5 月 27 日,The Decoder 报道 AI 编程 Agent Devin 的母公司 Cognition 在不到 9 个月内估值翻倍至 260 亿美元。

这是 AI Agent 赛道最耀眼的明星公司之一。Devin 作为首批引发广泛关注的自主编程 Agent,已经证明了市场愿意为”AI 程序员”支付巨额溢价。

AI Pulse 观点: 9 个月估值翻倍,说明 AI Agent 在编程领域的商业化进展远超市场预期。但 260 亿美元的估值也意味着 Cognition 需要在产品化和收入增长上给出令人信服的表现。随着 OpenAI Codex、Claude Code 等竞品的快速迭代,Devin 的先发优势能否持续是一个关键问题。

来源:The Decoder


Mistral 将 LeChat 更名为 Vibe,押注全功能工作 Agent

5 月 28 日,The Decoder 和 VentureBeat 报道 Mistral AI 将 LeChat 更名为 Vibe,并宣布向工业 AI 领域扩展,同时宣布数据中心扩展计划以挑战 OpenAI。

这标志着 Mistral 从”开源模型公司”向”全栈 AI Agent 平台”的战略转型。

AI Pulse 观点: “Vibe”这个名字很有意思——它暗示的是一种自然、直觉式的工作体验,而非传统的”聊天机器人”。Mistral 的战略非常清晰:在模型层保持开源竞争力,在应用层通过 Vibe 打造企业级 Agent 平台,同时通过自建数据中心降低对芯片供应链的依赖。这是一个”三条腿走路”的策略,在欧洲 AI 主权叙事下尤其有吸引力。

来源:The Decoder | VentureBeat


一家公司单月在 Claude 上花费 5 亿美元,因未能设置用量上限

5 月 29 日,The Decoder 报道一家公司在未能设置 AI 用量上限的情况下,单月在 Claude 上花费了 5 亿美元。

这个数字令人震惊——它暴露了企业 AI 部署中的一个关键问题:成本管控。

AI Pulse 观点: 5 亿美元一个月的 AI 账单,说明企业在采用 AI Agent 时面临的”成本失控”风险是真实存在的。当 AI Agent 开始自主执行任务(如编程、数据分析、客户交互),用量会呈指数级增长。这催生了一个新的市场需求:AI 用量管理和成本优化。Pinterest 同期报道通过砍掉前沿模型的视觉层节省了 90% 的 AI 成本,说明优化空间巨大。

来源:The Decoder


DeepMind AlphaProof Nexus 以几百美元成本解出数十年数学难题

5 月 27 日,The Decoder 报道 Google DeepMind 的 AlphaProof Nexus 以仅几百美元的成本解出了困扰数学界数十年的难题。

这是 AI 在数学推理领域的又一个突破性进展,且成本极低。

AI Pulse 观点: “几百美元”这个数字比”解出难题”本身更值得关注。它意味着 AI 解决数学问题的成本已经低到可以被广泛使用的程度。这不是一个实验室里的炫技,而是可以量产的数学推理能力。结合 Claude Mythos 解出 Erdős 问题的消息,AI 数学推理正在从”能做一些”走向”能做很多”。

来源:The Decoder


Robinhood 允许 AI Agent 自主交易股票和刷卡消费

5 月 27 日,The Decoder 报道 Robinhood 允许 AI Agent 为客户自主交易股票和进行信用卡消费。

这是 AI Agent 进入金融领域的重要一步——从”辅助决策”到”自主执行”。

AI Pulse 观点: 让 AI Agent 自主交易股票和消费,这是一个巨大的信任门槛。Robinhood 此举意味着他们认为 AI Agent 的决策质量已经可以独立承担金融后果。但这也带来了新的监管问题:当 AI Agent 自主交易导致亏损,责任归谁?这是金融科技领域必须回答的问题。

来源:The Decoder


其他值得关注的


一句话总结

Anthropic 以 650 亿美元融资逼近万亿估值,Claude Opus 4.8 和 Mythos 双线推进,OpenAI Codex 进化为操作系统级 Agent,Meta 和 Microsoft 分别在硬件和本地 AI PC 上押注未来。AI Agent 正在从”编程辅助”走向”自主执行”,从”云端”走向”边缘”,从”工具”走向”同事”。