1. Cognition AI完成超10亿美元新融资,投后估值达260亿美元
据彭博社报道,Devin背后的Cognition AI完成超过10亿美元新融资,投后估值达到260亿美元,成为全球AI编程赛道估值最高的公司。本轮融资由Lux Capital、General Catalyst和8VC共同领投,Ribbit Capital、Atreides Management、Founders Fund等参投。距离上一轮102亿美元估值仅过去8个多月,Cognition的估值已涨至原来的2.5倍。三位华人创始人合计拥有5枚国际信息学奥林匹克金牌,从短租房里搭建出”全球首位AI软件工程师”Devin的雏形。
AI Pulse 观点: 260亿美元的估值意味着市场正在将AI编程助手定位为未来软件工程的基础设施,而非仅仅是效率工具。Lux Capital、General Catalyst和8VC的联袂领投,分别代表了硬科技基础设施、企业流程转型和政府级部署三重叙事,预示着AI Agent正从开发者工具向企业级平台演进。
来源: 36氪,2026年6月1日
2. 阿里”上货”与字节”练功”:中国大厂AI战略路线分化
5月最后一周,两件相邻发生的事揭示了中国大厂的两种AI路线。阿里千问App与淘宝全面打通,读取40亿商品库和20年购物数据,同时蚂蚁AI支付用户数破亿,成为全球首个支付笔数与用户数双双破亿的AI原生支付产品。字节方面,即梦AI的Seedance 2.0在视频模型评测中登顶,2026年资本开支上限达4700亿元人民币,若环境理想可冲1000亿美元。
AI Pulse 观点: 阿里在做AI时代的”水电煤”和”零售收银台”,强调快速集成和商业化落地;字节在做AI时代的”诺贝尔实验室”,追求基础研究突破和基础设施的长期投入。两种路线并无绝对优劣,但代表了AI产业化过程中”应用驱动”与”技术驱动”的经典分野。
来源: 36氪,2026年5月31日
3. 开源编程语言Zig向AI代码说”不”:创建者称AI辅助贡献是”垃圾”
开源现代编程语言Zig明确禁止提交AI辅助生成的代码。Zig创建者兼首席开发者Andrew Kelley在JetBrains播客中将AI辅助贡献称为”垃圾”,指出这些贡献占用了有限的代码审查时间,拖慢了整个团队的节奏。Kelley强调,对Zig来说”传帮带”本身就是项目核心使命,而AI贡献反而适得其反。值得注意的是,Zig的衍生项目Bun(被Anthropic收购)则拥抱AI,其创建者近日使用Claude Code将Bun从Zig移植到了Rust。
AI Pulse 观点: Zig的立场引发了关于AI代码生成质量与开发者成长之间平衡的深层讨论。在Claude Code、OpenAI Codex等工具席卷硅谷的背景下,Zig代表了另一种声音——代码审查不仅是质量保证,更是人才培养的过程。这提醒我们,AI编程工具的广泛采用可能带来的隐性成本:当AI替代了学习过程,开发者社区的长期健康发展是否会受到影响?
4. 宇树科技科创板上会:机器人正成为半导体下一个超级终端
2026年6月1日,宇树科技迎来科创板IPO上会。表面看是机器人公司的资本市场节点,但对半导体产业而言,具身智能正在打破传统范式——不再满足于从现有芯片目录中选型,而是围绕运动控制、毫秒级实时响应、极致低功耗、多传感器融合等刚性需求,倒逼芯片与电子元器件方案重新设计。宇树将具身智能明确拆分为”大脑”(感知与决策)和”小脑”(运动控制),对应两种完全不同的芯片技术路径。
AI Pulse 观点: 机器人成为半导体”超级终端”的判断具有前瞻性。继手机、汽车、服务器之后,具身智能有望成为驱动芯片创新的第四大终端。地平线、寒武纪、黑芝麻在”大脑”赛道的算力竞赛,以及瑞萨、瑞芯微在”小脑”赛道的精密控制布局,预示着一条全新的半导体增长曲线正在形成。
来源: 36氪,2026年5月31日
5. Anthropic禁止面试中使用AI工具:要看候选人”真实思考能力”
据Bloomberg Businessweek报道,Anthropic在招聘中明确禁止候选人在现场面试期间使用AI工具,除非另有说明。Anthropic的面试多达五轮,其中包括被称为”文化面试”的环节,候选人需要回答关于价值观、世界观和伦理困境的问题。Anthropic认为,文化面试比一般公司更为严苛,未通过该环节几乎意味着被淘汰。目前Anthropic和OpenAI正在批量制造数十位千万富翁,最高薪资可达85万美元加股权补偿。
AI Pulse 观点: Anthropic的政策反映了一个有趣的悖论:一家致力于构建最先进AI的公司,却在招聘中禁止使用AI。这表明在评估核心人才时,独立思考能力和文化契合度仍然无法被AI替代。随着AI工具在软件开发和日常工作中的普及,如何区分”使用AI的能力”和”独立思考的能力”将成为招聘领域的新挑战。
6. 研究发现AI搜索代理倾向于确认已知信息而非真正搜索
哈尔滨工业大学和小红书研究人员发现,GPT-5.4、Gemini 3.1 Pro、Claude Sonnet 4.6等前沿模型在BrowseComp基准测试中的高分,并不反映其真正的搜索能力。研究揭示了一种”内在知识依赖”(IKD)现象:模型主要依赖训练中吸收的内部知识,而非实际搜索。当研究人员移除搜索索引中的支持文档后,所有模型的表现反而比完全没有工具访问时更差——MiniMax M2.5从44.5%暴跌至8.0%。
AI Pulse 观点: 这项研究揭示了AI搜索代理的一个根本性缺陷:搜索行为往往不是在探索新知,而是在为已有假设寻找佐证。当搜索结果与模型内部知识冲突时,模型更倾向于忽略证据。这对AI搜索产品的可靠性提出了严峻挑战,也意味着需要开发更好的”知识超越”基准测试来真正衡量搜索能力。
7. Anthropic研究:社会科学领域男性使用AI编程助手频率是女性两倍以上
Anthropic的一项研究发现,在社会科学研究的AI编程助手使用中,男性使用频率是女性的两倍以上。这一差距揭示了AI工具采用中的性别分化现象,可能对未来AI技能的分布和职业机会产生深远影响。
AI Pulse 观点: AI工具使用中的性别差距如果持续扩大,可能加剧技术领域的现有不平等。早期采用AI编程工具的群体将在效率和能力上获得更大优势,这要求教育机构和企业在AI工具推广中关注包容性和公平性。
8. 大规模研究:让AI聊天机器人更有用会削弱其模拟人类行为的能力
一项大规模研究发现,对AI聊天机器人进行”有帮助性”优化后,其模拟人类行为的能力会显著下降。研究指出,当模型被训练得更乐于助人、更顺从时,它们生成多样化、接近真实人类反应的能力就会减弱。
AI Pulse 观点: 这一发现揭示了AI对齐(alignment)研究中的核心张力:有用性与真实性之间存在权衡。如果目标是让AI在模拟对话、心理研究或社会实验中更准确地反映人类行为,过度优化”有帮助性”可能适得其反。这对AI在社会科学和人机交互研究中的应用具有重要启示。
其他动态
- OpenAI Codex 现已支持自主操作Windows PC,可独立进行bug搜索和应用测试(The Decoder, 5月31日)
- 微软与英伟达 据报正合作开发AI PC,将运行真正的AI代理而非Copilot助手(The Decoder, 5月31日)