阿里Qwen3.7-Max首进全球编程排名前四 成中国AI里程碑
IMP5.5
SNT+0.6▲
CONF85%
阿里巴巴Qwen3.7-Max在Code Arena基准测试中位列全球第四,成为首个跻身一线阵营的中国AI模型。截至2026年5月24日,该模型得分1541分,反超OpenAI和谷歌旗下产品,仅次于Anthropic的Claude Opus 4.7与4.6 Thinking版本。
该基准测试以严苛著称,涵盖前端开发、多步推理与智能体编码流程。Qwen3.7-Max累计获超1522票,是非Anthropic模型中排名最高。开发者测试显示,其单任务成本仅为Opus 4.7的约三分之一、ChatGPT-5.5的四分之一。阿里将该模型定位为承担长时间自主任务的智能体基础模型,内部测试实现35小时连续编码、超1158次工具调用且无上下文漂移。目前,模型已通过阿里云Model Studio开放。
EditorJack Lee