日报 2026 年 6 月 1 日

AI Pulse 日报 | 2026-06-01

AIAI投资AI编程具身智能AI伦理AI基础设施

## 1. Cognition AI完成超10亿美元新融资，投后估值达260亿美元

据彭博社报道，Devin背后的Cognition AI完成超过10亿美元新融资，投后估值达到260亿美元，成为全球AI编程赛道估值最高的公司。本轮融资由Lux Capital、General Catalyst和8VC共同领投，Ribbit Capital、Atreides Management、Founders Fund等参投。距离上一轮102亿美元估值仅过去8个多月，Cognition的估值已涨至原来的2.5倍。三位华人创始人合计拥有5枚国际信息学奥林匹克金牌，从短租房里搭建出"全球首位AI软件工程师"Devin的雏形。

> **AI Pulse 观点：** 260亿美元的估值意味着市场正在将AI编程助手定位为未来软件工程的基础设施，而非仅仅是效率工具。Lux Capital、General Catalyst和8VC的联袂领投，分别代表了硬科技基础设施、企业流程转型和政府级部署三重叙事，预示着AI Agent正从开发者工具向企业级平台演进。

**来源：** [36氪，2026年6月1日](https://www.36kr.com/p/3832666443276289)

## 2. 阿里"上货"与字节"练功"：中国大厂AI战略路线分化

5月最后一周，两件相邻发生的事揭示了中国大厂的两种AI路线。阿里千问App与淘宝全面打通，读取40亿商品库和20年购物数据，同时蚂蚁AI支付用户数破亿，成为全球首个支付笔数与用户数双双破亿的AI原生支付产品。字节方面，即梦AI的Seedance 2.0在视频模型评测中登顶，2026年资本开支上限达4700亿元人民币，若环境理想可冲1000亿美元。

> **AI Pulse 观点：** 阿里在做AI时代的"水电煤"和"零售收银台"，强调快速集成和商业化落地；字节在做AI时代的"诺贝尔实验室"，追求基础研究突破和基础设施的长期投入。两种路线并无绝对优劣，但代表了AI产业化过程中"应用驱动"与"技术驱动"的经典分野。

**来源：** [36氪，2026年5月31日](https://www.36kr.com/p/3832960755507456)

## 3. 开源编程语言Zig向AI代码说"不"：创建者称AI辅助贡献是"垃圾"

开源现代编程语言Zig明确禁止提交AI辅助生成的代码。Zig创建者兼首席开发者Andrew Kelley在JetBrains播客中将AI辅助贡献称为"垃圾"，指出这些贡献占用了有限的代码审查时间，拖慢了整个团队的节奏。Kelley强调，对Zig来说"传帮带"本身就是项目核心使命，而AI贡献反而适得其反。值得注意的是，Zig的衍生项目Bun（被Anthropic收购）则拥抱AI，其创建者近日使用Claude Code将Bun从Zig移植到了Rust。

> **AI Pulse 观点：** Zig的立场引发了关于AI代码生成质量与开发者成长之间平衡的深层讨论。在Claude Code、OpenAI Codex等工具席卷硅谷的背景下，Zig代表了另一种声音——代码审查不仅是质量保证，更是人才培养的过程。这提醒我们，AI编程工具的广泛采用可能带来的隐性成本：当AI替代了学习过程，开发者社区的长期健康发展是否会受到影响？

**来源：** [36氪/机器之心，2026年5月31日](https://www.36kr.com/p/3832633186952833)

## 4. 宇树科技科创板上会：机器人正成为半导体下一个超级终端

2026年6月1日，宇树科技迎来科创板IPO上会。表面看是机器人公司的资本市场节点，但对半导体产业而言，具身智能正在打破传统范式——不再满足于从现有芯片目录中选型，而是围绕运动控制、毫秒级实时响应、极致低功耗、多传感器融合等刚性需求，倒逼芯片与电子元器件方案重新设计。宇树将具身智能明确拆分为"大脑"（感知与决策）和"小脑"（运动控制），对应两种完全不同的芯片技术路径。

> **AI Pulse 观点：** 机器人成为半导体"超级终端"的判断具有前瞻性。继手机、汽车、服务器之后，具身智能有望成为驱动芯片创新的第四大终端。地平线、寒武纪、黑芝麻在"大脑"赛道的算力竞赛，以及瑞萨、瑞芯微在"小脑"赛道的精密控制布局，预示着一条全新的半导体增长曲线正在形成。

**来源：** [36氪，2026年5月31日](https://www.36kr.com/p/3832629304780423)

## 5. Anthropic禁止面试中使用AI工具：要看候选人"真实思考能力"

据Bloomberg Businessweek报道，Anthropic在招聘中明确禁止候选人在现场面试期间使用AI工具，除非另有说明。Anthropic的面试多达五轮，其中包括被称为"文化面试"的环节，候选人需要回答关于价值观、世界观和伦理困境的问题。Anthropic认为，文化面试比一般公司更为严苛，未通过该环节几乎意味着被淘汰。目前Anthropic和OpenAI正在批量制造数十位千万富翁，最高薪资可达85万美元加股权补偿。

> **AI Pulse 观点：** Anthropic的政策反映了一个有趣的悖论：一家致力于构建最先进AI的公司，却在招聘中禁止使用AI。这表明在评估核心人才时，独立思考能力和文化契合度仍然无法被AI替代。随着AI工具在软件开发和日常工作中的普及，如何区分"使用AI的能力"和"独立思考的能力"将成为招聘领域的新挑战。

**来源：** [The Decoder, 2026年5月31日](https://the-decoder.com/anthropic-bans-ai-tools-during-job-interviews-to-see-how-candidates-actually-think/)

## 6. 研究发现AI搜索代理倾向于确认已知信息而非真正搜索

哈尔滨工业大学和小红书研究人员发现，GPT-5.4、Gemini 3.1 Pro、Claude Sonnet 4.6等前沿模型在BrowseComp基准测试中的高分，并不反映其真正的搜索能力。研究揭示了一种"内在知识依赖"（IKD）现象：模型主要依赖训练中吸收的内部知识，而非实际搜索。当研究人员移除搜索索引中的支持文档后，所有模型的表现反而比完全没有工具访问时更差——MiniMax M2.5从44.5%暴跌至8.0%。

> **AI Pulse 观点：** 这项研究揭示了AI搜索代理的一个根本性缺陷：搜索行为往往不是在探索新知，而是在为已有假设寻找佐证。当搜索结果与模型内部知识冲突时，模型更倾向于忽略证据。这对AI搜索产品的可靠性提出了严峻挑战，也意味着需要开发更好的"知识超越"基准测试来真正衡量搜索能力。

**来源：** [The Decoder, 2026年5月31日](https://the-decoder.com/ai-search-agents-often-confirm-what-they-already-know-instead-of-actually-researching-the-web/)

## 7. Anthropic研究：社会科学领域男性使用AI编程助手频率是女性两倍以上

Anthropic的一项研究发现，在社会科学研究的AI编程助手使用中，男性使用频率是女性的两倍以上。这一差距揭示了AI工具采用中的性别分化现象，可能对未来AI技能的分布和职业机会产生深远影响。

> **AI Pulse 观点：** AI工具使用中的性别差距如果持续扩大，可能加剧技术领域的现有不平等。早期采用AI编程工具的群体将在效率和能力上获得更大优势，这要求教育机构和企业在AI工具推广中关注包容性和公平性。

**来源：** [The Decoder, 2026年5月31日](https://the-decoder.com/anthropic-study-finds-men-use-ai-coding-agents-more-than-twice-as-often-as-women-in-social-science-research/)

## 8. 大规模研究：让AI聊天机器人更有用会削弱其模拟人类行为的能力

一项大规模研究发现，对AI聊天机器人进行"有帮助性"优化后，其模拟人类行为的能力会显著下降。研究指出，当模型被训练得更乐于助人、更顺从时，它们生成多样化、接近真实人类反应的能力就会减弱。

> **AI Pulse 观点：** 这一发现揭示了AI对齐（alignment）研究中的核心张力：有用性与真实性之间存在权衡。如果目标是让AI在模拟对话、心理研究或社会实验中更准确地反映人类行为，过度优化"有帮助性"可能适得其反。这对AI在社会科学和人机交互研究中的应用具有重要启示。

**来源：** [The Decoder, 2026年5月30日](https://the-decoder.com/making-ai-chatbots-helpful-weakens-their-ability-to-simulate-human-behavior-large-scale-study-finds/)

## 其他动态

- **OpenAI Codex** 现已支持自主操作Windows PC，可独立进行bug搜索和应用测试（The Decoder, 5月31日）
- **微软与英伟达** 据报正合作开发AI PC，将运行真正的AI代理而非Copilot助手（The Decoder, 5月31日）

1. Cognition AI完成超10亿美元新融资，投后估值达260亿美元

AI Pulse 观点： 260亿美元的估值意味着市场正在将AI编程助手定位为未来软件工程的基础设施，而非仅仅是效率工具。Lux Capital、General Catalyst和8VC的联袂领投，分别代表了硬科技基础设施、企业流程转型和政府级部署三重叙事，预示着AI Agent正从开发者工具向企业级平台演进。

来源： 36氪，2026年6月1日

2. 阿里”上货”与字节”练功”：中国大厂AI战略路线分化

AI Pulse 观点： 阿里在做AI时代的”水电煤”和”零售收银台”，强调快速集成和商业化落地；字节在做AI时代的”诺贝尔实验室”，追求基础研究突破和基础设施的长期投入。两种路线并无绝对优劣，但代表了AI产业化过程中”应用驱动”与”技术驱动”的经典分野。

来源： 36氪，2026年5月31日

3. 开源编程语言Zig向AI代码说”不”：创建者称AI辅助贡献是”垃圾”

开源现代编程语言Zig明确禁止提交AI辅助生成的代码。Zig创建者兼首席开发者Andrew Kelley在JetBrains播客中将AI辅助贡献称为”垃圾”，指出这些贡献占用了有限的代码审查时间，拖慢了整个团队的节奏。Kelley强调，对Zig来说”传帮带”本身就是项目核心使命，而AI贡献反而适得其反。值得注意的是，Zig的衍生项目Bun（被Anthropic收购）则拥抱AI，其创建者近日使用Claude Code将Bun从Zig移植到了Rust。

AI Pulse 观点： Zig的立场引发了关于AI代码生成质量与开发者成长之间平衡的深层讨论。在Claude Code、OpenAI Codex等工具席卷硅谷的背景下，Zig代表了另一种声音——代码审查不仅是质量保证，更是人才培养的过程。这提醒我们，AI编程工具的广泛采用可能带来的隐性成本：当AI替代了学习过程，开发者社区的长期健康发展是否会受到影响？

来源： 36氪/机器之心，2026年5月31日

4. 宇树科技科创板上会：机器人正成为半导体下一个超级终端

2026年6月1日，宇树科技迎来科创板IPO上会。表面看是机器人公司的资本市场节点，但对半导体产业而言，具身智能正在打破传统范式——不再满足于从现有芯片目录中选型，而是围绕运动控制、毫秒级实时响应、极致低功耗、多传感器融合等刚性需求，倒逼芯片与电子元器件方案重新设计。宇树将具身智能明确拆分为”大脑”（感知与决策）和”小脑”（运动控制），对应两种完全不同的芯片技术路径。

AI Pulse 观点： 机器人成为半导体”超级终端”的判断具有前瞻性。继手机、汽车、服务器之后，具身智能有望成为驱动芯片创新的第四大终端。地平线、寒武纪、黑芝麻在”大脑”赛道的算力竞赛，以及瑞萨、瑞芯微在”小脑”赛道的精密控制布局，预示着一条全新的半导体增长曲线正在形成。

来源： 36氪，2026年5月31日

5. Anthropic禁止面试中使用AI工具：要看候选人”真实思考能力”

据Bloomberg Businessweek报道，Anthropic在招聘中明确禁止候选人在现场面试期间使用AI工具，除非另有说明。Anthropic的面试多达五轮，其中包括被称为”文化面试”的环节，候选人需要回答关于价值观、世界观和伦理困境的问题。Anthropic认为，文化面试比一般公司更为严苛，未通过该环节几乎意味着被淘汰。目前Anthropic和OpenAI正在批量制造数十位千万富翁，最高薪资可达85万美元加股权补偿。

AI Pulse 观点： Anthropic的政策反映了一个有趣的悖论：一家致力于构建最先进AI的公司，却在招聘中禁止使用AI。这表明在评估核心人才时，独立思考能力和文化契合度仍然无法被AI替代。随着AI工具在软件开发和日常工作中的普及，如何区分”使用AI的能力”和”独立思考的能力”将成为招聘领域的新挑战。

来源： The Decoder, 2026年5月31日

6. 研究发现AI搜索代理倾向于确认已知信息而非真正搜索

哈尔滨工业大学和小红书研究人员发现，GPT-5.4、Gemini 3.1 Pro、Claude Sonnet 4.6等前沿模型在BrowseComp基准测试中的高分，并不反映其真正的搜索能力。研究揭示了一种”内在知识依赖”（IKD）现象：模型主要依赖训练中吸收的内部知识，而非实际搜索。当研究人员移除搜索索引中的支持文档后，所有模型的表现反而比完全没有工具访问时更差——MiniMax M2.5从44.5%暴跌至8.0%。

AI Pulse 观点： 这项研究揭示了AI搜索代理的一个根本性缺陷：搜索行为往往不是在探索新知，而是在为已有假设寻找佐证。当搜索结果与模型内部知识冲突时，模型更倾向于忽略证据。这对AI搜索产品的可靠性提出了严峻挑战，也意味着需要开发更好的”知识超越”基准测试来真正衡量搜索能力。

来源： The Decoder, 2026年5月31日

7. Anthropic研究：社会科学领域男性使用AI编程助手频率是女性两倍以上

AI Pulse 观点： AI工具使用中的性别差距如果持续扩大，可能加剧技术领域的现有不平等。早期采用AI编程工具的群体将在效率和能力上获得更大优势，这要求教育机构和企业在AI工具推广中关注包容性和公平性。

来源： The Decoder, 2026年5月31日

8. 大规模研究：让AI聊天机器人更有用会削弱其模拟人类行为的能力

一项大规模研究发现，对AI聊天机器人进行”有帮助性”优化后，其模拟人类行为的能力会显著下降。研究指出，当模型被训练得更乐于助人、更顺从时，它们生成多样化、接近真实人类反应的能力就会减弱。

AI Pulse 观点： 这一发现揭示了AI对齐（alignment）研究中的核心张力：有用性与真实性之间存在权衡。如果目标是让AI在模拟对话、心理研究或社会实验中更准确地反映人类行为，过度优化”有帮助性”可能适得其反。这对AI在社会科学和人机交互研究中的应用具有重要启示。

来源： The Decoder, 2026年5月30日

其他动态

OpenAI Codex 现已支持自主操作Windows PC，可独立进行bug搜索和应用测试（The Decoder, 5月31日）
微软与英伟达 据报正合作开发AI PC，将运行真正的AI代理而非Copilot助手（The Decoder, 5月31日）