ET 03:01

谷歌发布Gemini 3深思:创纪录推理能力

IMP7.0
SNT+1.0
CONF100%
Operational

谷歌于2026212日推出Gemini 3深思重大升级版,推理能力达超人类水平,广泛应用于复杂科学与工程任务。

新版本多项指标刷新纪录:在Codeforces的Elo评分达3455;在人类最后考试(HLE)中取得48.4%成绩;在ARC-AGI-2测试中得分84.6%

在科研应用中,该模型发现一篇高能物理论文中的细微逻辑缺陷,并在材料科学与物理建模领域取得突破,实现从手稿速写到3D打印原型的加速迭代。

该更新汇聚前Anthropic研究者贡献,早期访问权限已向研究人员与工程师开放,可通过Gemini API获取。

EditorTan Wei Jie