本周聚焦:Anthropic 逼近万亿美金,AI Agent 从编程走向操作系统,Claude 解出世纪数学难题
从海量 AI 资讯中提取真正有价值的信号
这一周 AI 行业的信息量再次爆炸。Anthropic 完成 650 亿美元 H 轮融资,估值逼近万亿美元——这是 AI 创业史上最大规模的单笔融资。Claude Opus 4.8 正式发布,在多数基准测试中超越 GPT-5.5,且快速模式便宜 3 倍。OpenAI 的 Codex 现在可以自主操作 Windows 电脑,从编程助手进化为操作系统级别的 Agent。Claude Mythos 据报解出了 OpenAI 的 landmark Erdős 数学难题。Meta 的内部备忘录泄露,揭示了 AI 吊坠、超级感知眼镜和企业可穿戴设备的完整战略。
这是一个”Agent 原生”加速到来的一周。
Anthropic 完成 650 亿美元 H 轮融资,估值逼近万亿美元
5 月 28 日,The Decoder 报道 Anthropic 在 H 轮融资中筹集了 650 亿美元,估值逼近万亿美元大关。
这是 AI 创业史上最大规模的单笔融资之一。Anthropic 凭借 Claude 系列模型在企业市场的强劲表现,吸引了全球顶级资本的持续加注。
AI Pulse 观点: 650 亿美元的单轮融资规模,超越了历史上几乎所有科技公司的单轮融资记录。这说明资本市场对 Anthropic 在 Claude 生态中的定位有着极高预期。万亿估值意味着 Anthropic 已经进入了与 Google、Meta、Microsoft 同等量级的讨论范围。但高估值也带来了高期待——Anthropic 需要在接下来的 12-18 个月内证明其商业化能力足以支撑这个数字。
来源:The Decoder
Anthropic 发布 Claude Opus 4.8:多数基准超越 GPT-5.5,快速模式便宜 3 倍
5 月 28 日,The Decoder 和 VentureBeat 报道 Anthropic 发布 Claude Opus 4.8,被官方描述为”适度但切实的改进”,在多数基准测试中超越 GPT-5.5,同时快速模式价格便宜 3 倍。
Opus 4.8 的定位很有趣——不是革命性的跳跃,而是稳定的、可感知的提升,同时大幅降低成本。
AI Pulse 观点: 在 Claude Mythos 已经占据性能制高点的情况下,Opus 4.8 的发布策略非常务实:不追求”最强”的叙事,而是提供”够用且便宜”的选择。快速模式便宜 3 倍意味着企业用户可以以更低的成本部署 Claude 能力。这可能是 Anthropic 应对 DeepSeek 等低价竞争者的差异化回应——不是拼绝对低价,而是拼”性价比”。
来源:The Decoder | VentureBeat
Sam Altman 和 Dario Amodei 撤回 AI 末日预测
5 月 27 日,The Decoder 报道 OpenAI CEO Sam Altman 和 Anthropic CEO Dario Amodei 都撤回或淡化了他们此前关于 AI 导致大规模失业的预测。
两位顶级 AI 公司 CEO 的态度转变,反映了对 AI 替代人类速度和时间线的重新评估。
AI Pulse 观点: 这是一个有趣的信号。此前 AI 领袖们普遍持”AI 将取代大量工作”的末日叙事,现在他们开始回调。这可能是因为实际企业部署数据显示 AI 的替代速度比预期慢,也可能是因为政治和社会压力的结果。但更可能的解释是:他们发现 AI 更像是”能力放大器”而非”工作替代品”——这与我们在 Agent 领域看到的趋势一致,AI 正在扩展人类的能力边界,而非简单地替代。
来源:The Decoder
OpenAI Codex 可自主操作 Windows 电脑,自动猎杀 bug 和测试应用
5 月 30 日,The Decoder 报道 OpenAI 的 Codex 现在可以自主操作 Windows 电脑,独立猎杀 bug 和测试应用。
Codex 从编程助手进化为操作系统级别的自主 Agent——它不再只是生成代码,而是可以像人类一样在操作系统中执行任务。
AI Pulse 观点: 这是 AI Agent 从”工具”走向”同事”的关键一步。当 AI 可以自主操作整个操作系统时,它的角色就从”你让它写什么就写什么”的代码生成器,变成了”你自己去看、自己去修”的自主工程师。这意味着 AI 在软件工程中的渗透率将进一步加速。但同时也带来了新的安全问题:一个拥有操作系统级访问权的 AI Agent,其权限边界和安全护栏需要重新定义。
来源:The Decoder
Meta 泄露备忘录曝光:AI 吊坠、超级感知眼镜与企业可穿戴设备战略
5 月 30 日,The Decoder 和 TechCrunch 报道 Meta 的一份内部备忘录泄露,揭示了公司在 AI 吊坠(AI pendant)、超级感知眼镜(supersensing glasses)和企业可穿戴设备方面的完整战略。
Zuckerberg 终于给之前海量的 AI 硬件投资标上了价格——Meta 正在全面押注 AI 可穿戴设备。
AI Pulse 观点: Meta 的战略野心很大:从 pendant(可能是类似 Rabbit R1 或 Humane Pin 的独立 AI 设备)到 supersensing glasses(远超 Google AI 眼镜的能力),再到企业级可穿戴设备。这说明 Meta 认为 AI 的下一个交互入口不在手机、不在电脑,而在”穿戴在身上”的设备。但 Meta 之前在硬件领域(如 Ray-Ban Stories、Portal)有过失败经验,这次能否成功取决于 AI 能力是否足以支撑全新的交互范式。
来源:The Decoder | TechCrunch
Microsoft 与 NVIDIA 联手打造 AI PC:运行真正的 Agent 而非 Copilot
5 月 30 日,The Decoder 报道 Microsoft 和 NVIDIA 正在合作开发 AI PC,这种 PC 将运行真正的自主 Agent,而非现有的 Copilot 助手。
这标志着 Microsoft 对 AI PC 的定位发生了根本性转变——从”辅助工具”升级为”自主执行者”。
AI Pulse 观点: Copilot 的本质是”你问它答”,而真正的 Agent 是”给它目标,它自己完成”。如果 Microsoft 和 NVIDIA 联手把这种能力集成到 PC 硬件层面,那将是一次平台级的变革。NVIDIA 提供本地推理算力,Microsoft 提供 Agent 框架和操作系统集成——这是一个完整的本地 AI Agent 栈。这也意味着 AI Agent 的部署将从云端加速向边缘延伸。
来源:The Decoder
Claude Mythos 据报解出 OpenAI landmark Erdős 数学难题
5 月 26 日,The Decoder 报道 Claude Mythos 据报以”简洁优美的证明”解出了 OpenAI 提出的 landmark Erdős 数学难题。
如果属实,这是 AI 在纯数学推理领域的又一个里程碑式突破。
AI Pulse 观点: Erdős 问题是组合数学中的经典难题,OpenAI 曾将其作为测试 AI 数学推理能力的 benchmark。Claude Mythos 能以”简洁优美的证明”解出,说明其推理能力已经超越了”暴力搜索 + 模式匹配”的阶段,进入了”真正理解数学结构”的层面。结合之前 DeepMind 的 AlphaProof Nexus 也以几百美元的成本解出了数十年的数学难题,2026 年正在成为 AI 数学能力的爆发年。
来源:The Decoder
Cognition(Devin 母公司)估值不到 9 个月翻倍至 260 亿美元
5 月 27 日,The Decoder 报道 AI 编程 Agent Devin 的母公司 Cognition 在不到 9 个月内估值翻倍至 260 亿美元。
这是 AI Agent 赛道最耀眼的明星公司之一。Devin 作为首批引发广泛关注的自主编程 Agent,已经证明了市场愿意为”AI 程序员”支付巨额溢价。
AI Pulse 观点: 9 个月估值翻倍,说明 AI Agent 在编程领域的商业化进展远超市场预期。但 260 亿美元的估值也意味着 Cognition 需要在产品化和收入增长上给出令人信服的表现。随着 OpenAI Codex、Claude Code 等竞品的快速迭代,Devin 的先发优势能否持续是一个关键问题。
来源:The Decoder
Mistral 将 LeChat 更名为 Vibe,押注全功能工作 Agent
5 月 28 日,The Decoder 和 VentureBeat 报道 Mistral AI 将 LeChat 更名为 Vibe,并宣布向工业 AI 领域扩展,同时宣布数据中心扩展计划以挑战 OpenAI。
这标志着 Mistral 从”开源模型公司”向”全栈 AI Agent 平台”的战略转型。
AI Pulse 观点: “Vibe”这个名字很有意思——它暗示的是一种自然、直觉式的工作体验,而非传统的”聊天机器人”。Mistral 的战略非常清晰:在模型层保持开源竞争力,在应用层通过 Vibe 打造企业级 Agent 平台,同时通过自建数据中心降低对芯片供应链的依赖。这是一个”三条腿走路”的策略,在欧洲 AI 主权叙事下尤其有吸引力。
来源:The Decoder | VentureBeat
一家公司单月在 Claude 上花费 5 亿美元,因未能设置用量上限
5 月 29 日,The Decoder 报道一家公司在未能设置 AI 用量上限的情况下,单月在 Claude 上花费了 5 亿美元。
这个数字令人震惊——它暴露了企业 AI 部署中的一个关键问题:成本管控。
AI Pulse 观点: 5 亿美元一个月的 AI 账单,说明企业在采用 AI Agent 时面临的”成本失控”风险是真实存在的。当 AI Agent 开始自主执行任务(如编程、数据分析、客户交互),用量会呈指数级增长。这催生了一个新的市场需求:AI 用量管理和成本优化。Pinterest 同期报道通过砍掉前沿模型的视觉层节省了 90% 的 AI 成本,说明优化空间巨大。
来源:The Decoder
DeepMind AlphaProof Nexus 以几百美元成本解出数十年数学难题
5 月 27 日,The Decoder 报道 Google DeepMind 的 AlphaProof Nexus 以仅几百美元的成本解出了困扰数学界数十年的难题。
这是 AI 在数学推理领域的又一个突破性进展,且成本极低。
AI Pulse 观点: “几百美元”这个数字比”解出难题”本身更值得关注。它意味着 AI 解决数学问题的成本已经低到可以被广泛使用的程度。这不是一个实验室里的炫技,而是可以量产的数学推理能力。结合 Claude Mythos 解出 Erdős 问题的消息,AI 数学推理正在从”能做一些”走向”能做很多”。
来源:The Decoder
Robinhood 允许 AI Agent 自主交易股票和刷卡消费
5 月 27 日,The Decoder 报道 Robinhood 允许 AI Agent 为客户自主交易股票和进行信用卡消费。
这是 AI Agent 进入金融领域的重要一步——从”辅助决策”到”自主执行”。
AI Pulse 观点: 让 AI Agent 自主交易股票和消费,这是一个巨大的信任门槛。Robinhood 此举意味着他们认为 AI Agent 的决策质量已经可以独立承担金融后果。但这也带来了新的监管问题:当 AI Agent 自主交易导致亏损,责任归谁?这是金融科技领域必须回答的问题。
来源:The Decoder
其他值得关注的
- YouTube 本月开始自动标记 AI 生成视频。来源:The Decoder
- SoftBank 计划在法国投资 750 亿欧元建设 AI 数据中心。来源:The Decoder
- Google 推出可本地运行 Gemma 3 的小型开发板。来源:The Decoder
- Salesforce 声称 AI Agent 将 231 天的迁移缩短到 13 天,且事故更少。来源:The Decoder
- OpenAI 免费开放生命科学 AI 模型,帮助各国政府为下一次大流行做准备。来源:The Decoder
- Pinterest 通过砍掉前沿模型的视觉层将 AI 成本降低 90%。来源:VentureBeat
- VentureBeat 报道 AI Agent 的瓶颈不是模型性能而是权限管理。来源:VentureBeat
- VentureBeat 报道 MeMo 的记忆模型让团队无需重新训练即可升级 LLM,性能提升 26%。来源:VentureBeat
- StepFun 发布 Step 3.7 Flash:198B MoE 视觉语言模型,面向编程 Agent 和搜索工作流。来源:Marktechpost
- Genesis AI 发布 Nyx、Quadrants 和 Genesis World 1.0 物理平台,用于可扩展的机器人基础模型评估。来源:Marktechpost
- 中国据报要求顶尖 AI 研究人员出境前需获得许可。来源:The Decoder
- 4nm!比亚迪自研 AI 芯片:制程对齐英伟达,算力拉爆特斯拉。来源:量子位
- 复旦系团队出品机器人原生世界动作模型:首创时空一体架构。来源:量子位
一句话总结
Anthropic 以 650 亿美元融资逼近万亿估值,Claude Opus 4.8 和 Mythos 双线推进,OpenAI Codex 进化为操作系统级 Agent,Meta 和 Microsoft 分别在硬件和本地 AI PC 上押注未来。AI Agent 正在从”编程辅助”走向”自主执行”,从”云端”走向”边缘”,从”工具”走向”同事”。