日报 2026 年 5 月 18 日

AI Pulse 日报 | 2026-05-18

Google I/OAnthropicOpenAI通义千问腾讯xAIAI Agent大模型

## 1. Google I/O 2026 明日开幕：Gemini 4.0、Aluminium OS、AR 眼镜三大看点

Google I/O 2026 主题演讲将于 5 月 19 日上午 10 点（太平洋时间）在 Shoreline Amphitheatre 举行。谷歌已确认演讲将涵盖"最新 Gemini 模型更新"和"智能体编程"，业界广泛解读为 Gemini 4.0 的正式亮相。此外，Aluminium OS（基于 Android 的 ChromeOS 替代系统）和 Android XR 眼镜（与三星、Warby Parker 等合作）也在预期发布名单中。

来源：AIToolsRecap / The AI Track (2026-05-18)
链接：https://aitoolsrecap.com/Blog/ai-news-may-18-2026

> **AI Pulse 观点：** Google I/O 将是本周 AI 行业最大的事件。Gemini 4.0 能否在基准测试中匹敌 Claude Mythos Preview 的 94.6% GPQA 分数，将直接决定本周的竞争叙事。谷歌提前在 5 月 12 日的 Android Show 中发布了平台层公告，将 I/O 聚焦于模型和硬件——这是一种精明的节奏策略。

## 2. Anthropic 9000 亿美元融资接近尾声，或反超 OpenAI 成为估值最高 AI 公司

据 Bloomberg 报道，Anthropic 正在进行的融资轮次——至少 300 亿美元，估值超过 9000 亿美元——预计最快于 5 月底完成。该轮由红杉资本、Dragoneer、Greenoaks 和 Altimeter 联合领投。若以该估值成交，Anthropic 将首次超越 OpenAI 今年 3 月 8520 亿美元的估值，在三个月内从 3800 亿美元飙升至 9000 亿美元以上。资金将主要用于 AWS 和 Google Cloud 的算力基础设施建设。

来源：Bloomberg / AIToolsRecap (2026-05-16)
链接：https://aitoolsrecap.com/Blog/ai-news-may-16-2026

> **AI Pulse 观点：** 这轮融资的核心逻辑是"算力即护城河"。在模型架构趋同的时代，谁能锁定最多的算力资源，谁就能持续领先。Anthropic 在 Google I/O 前加速融资，既是抢占基础设施窗口期，也是在向市场传递信心——无论 Gemini 4.0 表现如何，Anthropic 的算力版图已就位。

## 3. OpenAI 将 GPT-5.5 Instant 设为 ChatGPT 默认模型

OpenAI 已将 GPT-5.5 Instant 设置为 ChatGPT 的默认模型。这一更快的版本面向日常交互场景优化，在保持高质量输出的同时显著降低响应延迟。TechCrunch 对此进行了报道，确认这一变更已面向所有用户生效。

来源：TechCrunch / AIToolsRecap (2026-05-17)
链接：https://techcrunch.com/2026/05/17/openai-gpt-5-5-instant-default-chatgpt/

> **AI Pulse 观点：** 将"Instant"版本设为默认，反映了 OpenAI 对用户体验优先级的重新排序。在 Anthropic 和 Google 都在追求"更强"的同时，OpenAI 选择"更快"作为默认体验——这是一个聪明的差异化策略。对大多数用户而言，毫秒级响应比模型参数的微小提升更能感知。

## 4. 通义千问预告"重量级"大模型：5 月 20 日阿里云峰会正式亮相

5 月 18 日，阿里云通义千问通过官微宣布，其"重量级新朋友"将于 5 月 20 日的阿里云峰会正式亮相。官方预告该模型将在全能性、模型能力、深度与广度上实现全面升级。在 GPT-5.6 内测、Gemini 4.0 即将发布、DeepSeek-V4 来势汹汹的背景下，国产大模型必须拿出足够的硬实力。

来源：AITOP100 (2026-05-18)
链接：https://www.aitop100.cn/ai-daily-2026-05-18

> **AI Pulse 观点：** 通义千问选择在 Google I/O 和 Anthropic 融资消息的夹缝中预告新模型，时机选择极具战略意义。5 月 20 日的发布将直接面临 Gemini 4.0 的全球关注窗口——要么凭借硬实力抢占注意力，要么在国际巨头的声量中被边缘化。这对国产大模型来说是一场注意力保卫战。

## 5. 中国大模型周调用量连续三周超越美国：腾讯 Hy3preview 周调用 2.66 万亿 Token

OpenRouter 最新数据显示，5 月 11 日至 17 日这一周，全球 AI 大模型总调用量达 26.9 万亿 Token，中国贡献了 7.693 万亿 Token，美国为 4.24 万亿 Token——中国的调用量已达美国的 1.81 倍。全球调用量排行榜前两名均为中国模型：腾讯 Hy3preview 和 DeepSeek-V4-Flash。Hy3preview 周调用量 2.66 万亿 Token，环比增长 210%，且在结束免费期转为收费后依然夺冠。

来源：AITOP100 / OpenRouter (2026-05-18)
链接：https://www.aitop100.cn/ai-daily-2026-05-18

> **AI Pulse 观点：** 调用量的超越不仅是数字游戏，更是生态竞争力的体现。Hy3preview 在收费后仍能保持增长，说明用户黏性来自模型能力而非价格补贴。当中国模型从"免费尝鲜"走向"付费使用"且用户仍在增长，这标志着国产大模型已经跨越了从技术验证到商业可持续的关键拐点。

## 6. 1.5 万亿参数 Grok 完成训练：马斯克放话"王炸"体验

xAI 创始人马斯克确认，内部第 9 版 Grok 大模型基础模型已正式完成训练。这款新模型拥有 1.5 万亿参数，预计将在未来 3 到 4 周内向公众发布。据透露，该模型大量吸纳了 Cursor 等编程工具的代码数据进行训练，目标是在编程能力上直接与 Claude 竞争。

来源：AITOP100 / X (2026-05-18)
链接：https://www.aitop100.cn/ai-daily-2026-05-18

> **AI Pulse 观点：** 1.5 万亿参数意味着 Grok 正从"追赶者"向"竞争者"转型。大量使用编程数据训练的决策，直接对标 Claude 在开发者领域的优势地位。如果 Grok v9 真的能在编程基准上接近 Claude 的水平，xAI 将在 AI 竞争中拥有三张牌——搜索（xAI 自有流量）、社交（X 平台）和编程（Grok v9）。

## 7. 腾讯发布 AI 设计智能体 Ardot 公测：自然语言生成 UI，一键转代码

腾讯正式开启 AI 设计智能体协作平台 Ardot 公测。该工具支持"自然语言→设计初稿→可编辑→一键转代码"的全链路能力，5 分钟即可产出设计初稿。生成结果保留图层结构，设计师可精细调整，并可一键导出 React/Vue 前端代码。平台原生支持多人实时协作，打破传统设计流程的线性瓶颈。

来源：AITOP100 (2026-05-18)
链接：https://www.aitop100.cn/ai-daily-2026-05-18

> **AI Pulse 观点：** Ardot 代表了 AI 对设计工作流的深度重塑。从"辅助绘图"到"智能共创"，设计工具的范式正在从"让人画得更快"转向"让 AI 画出初稿，人类精修"。这种全链路能力——从自然语言到设计再到代码——正在消除设计与开发之间的交接摩擦，可能彻底改变产品团队的协作模式。

## 8. PwC 全球部署 Claude：数十万专业人士接入，保险核保从 10 周缩短至 10 天

Anthropic 与 PwC 宣布扩展战略合作，PwC 将向全球数十万专业人士部署 Claude Code 和 Cowork，认证 3 万名美国专业人员，并建立联合卓越中心。PwC 正基于 Claude 构建全新的财务业务部门，保险核保时间从 10 周压缩至 10 天，安全任务交付时间缩短 70%。

来源：Anthropic Blog (2026-05-14)
链接：https://www.anthropic.com/news/pwc-deployment

> **AI Pulse 观点：** 这是迄今为止最大规模的专业服务企业 AI 部署。PwC 的选择具有信号意义——当四大会计师事务所中最具创新基因的一家将核心业务构建在 Claude 之上，其他三家和整个专业服务行业将加速跟进。保险核保从 10 周到 10 天的压缩，展示了 AI Agent 在复杂知识工作领域可能带来的生产力革命。

## 其他动态

- **谷歌推出 Gemini Intelligence**：安卓平台跨应用 AI 自动化功能正式发布，长按电源键即可让 AI 代执行多步骤任务，首批支持三星 Galaxy Z Fold8/Flip8 等设备 (2026-05-18)
- **腾讯上线 AI 应用生成平台"吐司"**：输入想法即可一键生成 App，灵感广场支持创意接力，安卓版已上线 (2026-05-15)
- **Zerostack**：一个纯 Rust 编写的 Unix 风格编程智能体在 Hacker News 获 480 分热度，旨在将 Unix 哲学引入 AI 智能体框架 (2026-05-17)
- **NVIDIA SANA-WM**：26 亿参数开源世界模型，可从文本提示生成 1 分钟 720p 视频 (2026-05-16)

1. Google I/O 2026 明日开幕：Gemini 4.0、Aluminium OS、AR 眼镜三大看点

Google I/O 2026 主题演讲将于 5 月 19 日上午 10 点（太平洋时间）在 Shoreline Amphitheatre 举行。谷歌已确认演讲将涵盖”最新 Gemini 模型更新”和”智能体编程”，业界广泛解读为 Gemini 4.0 的正式亮相。此外，Aluminium OS（基于 Android 的 ChromeOS 替代系统）和 Android XR 眼镜（与三星、Warby Parker 等合作）也在预期发布名单中。

来源：AIToolsRecap / The AI Track (2026-05-18) 链接：https://aitoolsrecap.com/Blog/ai-news-may-18-2026

AI Pulse 观点： Google I/O 将是本周 AI 行业最大的事件。Gemini 4.0 能否在基准测试中匹敌 Claude Mythos Preview 的 94.6% GPQA 分数，将直接决定本周的竞争叙事。谷歌提前在 5 月 12 日的 Android Show 中发布了平台层公告，将 I/O 聚焦于模型和硬件——这是一种精明的节奏策略。

2. Anthropic 9000 亿美元融资接近尾声，或反超 OpenAI 成为估值最高 AI 公司

来源：Bloomberg / AIToolsRecap (2026-05-16) 链接：https://aitoolsrecap.com/Blog/ai-news-may-16-2026

AI Pulse 观点： 这轮融资的核心逻辑是”算力即护城河”。在模型架构趋同的时代，谁能锁定最多的算力资源，谁就能持续领先。Anthropic 在 Google I/O 前加速融资，既是抢占基础设施窗口期，也是在向市场传递信心——无论 Gemini 4.0 表现如何，Anthropic 的算力版图已就位。

3. OpenAI 将 GPT-5.5 Instant 设为 ChatGPT 默认模型

来源：TechCrunch / AIToolsRecap (2026-05-17) 链接：https://techcrunch.com/2026/05/17/openai-gpt-5-5-instant-default-chatgpt/

AI Pulse 观点： 将”Instant”版本设为默认，反映了 OpenAI 对用户体验优先级的重新排序。在 Anthropic 和 Google 都在追求”更强”的同时，OpenAI 选择”更快”作为默认体验——这是一个聪明的差异化策略。对大多数用户而言，毫秒级响应比模型参数的微小提升更能感知。

4. 通义千问预告”重量级”大模型：5 月 20 日阿里云峰会正式亮相

5 月 18 日，阿里云通义千问通过官微宣布，其”重量级新朋友”将于 5 月 20 日的阿里云峰会正式亮相。官方预告该模型将在全能性、模型能力、深度与广度上实现全面升级。在 GPT-5.6 内测、Gemini 4.0 即将发布、DeepSeek-V4 来势汹汹的背景下，国产大模型必须拿出足够的硬实力。

来源：AITOP100 (2026-05-18) 链接：https://www.aitop100.cn/ai-daily-2026-05-18

AI Pulse 观点： 通义千问选择在 Google I/O 和 Anthropic 融资消息的夹缝中预告新模型，时机选择极具战略意义。5 月 20 日的发布将直接面临 Gemini 4.0 的全球关注窗口——要么凭借硬实力抢占注意力，要么在国际巨头的声量中被边缘化。这对国产大模型来说是一场注意力保卫战。

5. 中国大模型周调用量连续三周超越美国：腾讯 Hy3preview 周调用 2.66 万亿 Token

来源：AITOP100 / OpenRouter (2026-05-18) 链接：https://www.aitop100.cn/ai-daily-2026-05-18

AI Pulse 观点： 调用量的超越不仅是数字游戏，更是生态竞争力的体现。Hy3preview 在收费后仍能保持增长，说明用户黏性来自模型能力而非价格补贴。当中国模型从”免费尝鲜”走向”付费使用”且用户仍在增长，这标志着国产大模型已经跨越了从技术验证到商业可持续的关键拐点。

6. 1.5 万亿参数 Grok 完成训练：马斯克放话”王炸”体验

来源：AITOP100 / X (2026-05-18) 链接：https://www.aitop100.cn/ai-daily-2026-05-18

AI Pulse 观点： 1.5 万亿参数意味着 Grok 正从”追赶者”向”竞争者”转型。大量使用编程数据训练的决策，直接对标 Claude 在开发者领域的优势地位。如果 Grok v9 真的能在编程基准上接近 Claude 的水平，xAI 将在 AI 竞争中拥有三张牌——搜索（xAI 自有流量）、社交（X 平台）和编程（Grok v9）。

7. 腾讯发布 AI 设计智能体 Ardot 公测：自然语言生成 UI，一键转代码

腾讯正式开启 AI 设计智能体协作平台 Ardot 公测。该工具支持”自然语言→设计初稿→可编辑→一键转代码”的全链路能力，5 分钟即可产出设计初稿。生成结果保留图层结构，设计师可精细调整，并可一键导出 React/Vue 前端代码。平台原生支持多人实时协作，打破传统设计流程的线性瓶颈。

来源：AITOP100 (2026-05-18) 链接：https://www.aitop100.cn/ai-daily-2026-05-18

AI Pulse 观点： Ardot 代表了 AI 对设计工作流的深度重塑。从”辅助绘图”到”智能共创”，设计工具的范式正在从”让人画得更快”转向”让 AI 画出初稿，人类精修”。这种全链路能力——从自然语言到设计再到代码——正在消除设计与开发之间的交接摩擦，可能彻底改变产品团队的协作模式。

8. PwC 全球部署 Claude：数十万专业人士接入，保险核保从 10 周缩短至 10 天

来源：Anthropic Blog (2026-05-14) 链接：https://www.anthropic.com/news/pwc-deployment

AI Pulse 观点： 这是迄今为止最大规模的专业服务企业 AI 部署。PwC 的选择具有信号意义——当四大会计师事务所中最具创新基因的一家将核心业务构建在 Claude 之上，其他三家和整个专业服务行业将加速跟进。保险核保从 10 周到 10 天的压缩，展示了 AI Agent 在复杂知识工作领域可能带来的生产力革命。

其他动态

谷歌推出 Gemini Intelligence：安卓平台跨应用 AI 自动化功能正式发布，长按电源键即可让 AI 代执行多步骤任务，首批支持三星 Galaxy Z Fold8/Flip8 等设备 (2026-05-18)
腾讯上线 AI 应用生成平台”吐司”：输入想法即可一键生成 App，灵感广场支持创意接力，安卓版已上线 (2026-05-15)
Zerostack：一个纯 Rust 编写的 Unix 风格编程智能体在 Hacker News 获 480 分热度，旨在将 Unix 哲学引入 AI 智能体框架 (2026-05-17)
NVIDIA SANA-WM：26 亿参数开源世界模型，可从文本提示生成 1 分钟 720p 视频 (2026-05-16)