谷歌发布Gemini 3深思：创纪录推理能力

IMP7.0

SNT+1.0▲

CONF100%

Operational

谷歌于2026年2月12日推出Gemini 3深思重大升级版，推理能力达超人类水平，广泛应用于复杂科学与工程任务。

新版本多项指标刷新纪录：在Codeforces的Elo评分达3455；在人类最后考试（HLE）中取得48.4%成绩；在ARC-AGI-2测试中得分84.6%。

在科研应用中，该模型发现一篇高能物理论文中的细微逻辑缺陷，并在材料科学与物理建模领域取得突破，实现从手稿速写到3D打印原型的加速迭代。

该更新汇聚前Anthropic研究者贡献，早期访问权限已向研究人员与工程师开放，可通过Gemini API获取。

EditorTan Wei Jie