← 返回排行榜
💻 模型排行 最近更新: 2026-05-23

AI 代码能力排行榜

数据来源: https://www.swebench.com/
SWE-bench Bash-Only

数据来源:SWE-bench 官方 Bash-Only 排行榜(mini-SWE-agent v2.0.0,500 个实例,单次尝试)。数据获取于 2026 年 2 月。LMSYS Chatbot Arena 等排行榜因网络限制暂时无法获取。

排名模型厂商SWE-bench类型
🥇Claude 4.5 OpusAnthropic76.8%闭源
🥈Gemini 3 FlashGoogle DeepMind75.8%闭源
🥉MiniMax M2.5MiniMax75.8%闭源
4Claude Opus 4.6Anthropic75.6%闭源
5Claude 4.5 Opus (medium)Anthropic74.4%闭源
6Gemini 3 Pro PreviewGoogle DeepMind74.2%闭源
7GLM-5Z-AI72.8%闭源
8GPT-5.2OpenAI72.8%闭源
9Claude 4.5 SonnetAnthropic71.4%闭源
10Kimi K2.5Moonshot AI70.8%闭源
11DeepSeek V3.2DeepSeek70.0%开源
12Gemini 3 ProGoogle DeepMind69.6%闭源
13Claude 4 OpusAnthropic67.6%闭源
14Claude 4.5 HaikuAnthropic66.6%闭源
15GPT-5.1OpenAI66.0%闭源
16GPT-5OpenAI65.0%闭源
17Claude 4 SonnetAnthropic64.9%闭源