阿里Qwen3.7-Max首进全球编程排名前四成中国AI里程碑

IMP5.5

SNT+0.6▲

CONF85%

Operational

阿里巴巴Qwen3.7-Max在Code Arena基准测试中位列全球第四，成为首个跻身一线阵营的中国AI模型。截至2026年5月24日，该模型得分1541分，反超OpenAI和谷歌旗下产品，仅次于Anthropic的Claude Opus 4.7与4.6 Thinking版本。

该基准测试以严苛著称，涵盖前端开发、多步推理与智能体编码流程。Qwen3.7-Max累计获超1522票，是非Anthropic模型中排名最高。开发者测试显示，其单任务成本仅为Opus 4.7的约三分之一、ChatGPT-5.5的四分之一。阿里将该模型定位为承担长时间自主任务的智能体基础模型，内部测试实现35小时连续编码、超1158次工具调用且无上下文漂移。目前，模型已通过阿里云Model Studio开放。

EditorJack Lee

阿里Qwen3.7-Max首进全球编程排名前四 成中国AI里程碑

阿里Qwen3.7-Max首进全球编程排名前四成中国AI里程碑