ET 03:01

Công bố Gemini 3 Deep Think: Năng lực tư duy đạt mức kỷ lục

IMP7.0
SNT+1.0
CONF100%
Operational

Google chính thức giới thiệu phiên bản cập nhật lớn của Gemini 3 Deep Think, đạt mức hiệu suất tư duy vượt nhân loại trong các nhiệm vụ khoa học và kỹ thuật phức tạp.

Cập nhật này thiết lập nhiều kỷ lục: điểm Elo trên Codeforces đạt 3.455, vượt qua các chuyên gia trên bài kiểm tra Humanity's Last Exam (HLE) với 48,4%, và đạt 84,6% trên ARC-AGI-2.

Trong nghiên cứu, mô hình đã phát hiện được một lỗi logic tinh tế trong một bài báo đánh giá vật lý năng lượng cao, đồng thời thúc đẩy các đột phá trong mô hình hóa vật liệu và thiết kế vật lý, cho phép tạo mẫu 3D nhanh hơn từ bản vẽ thủ công.

Cập nhật này nhận được sự đóng góp từ các nhà nghiên cứu tiền thân của Anthropic. Giao diện thử nghiệm sớm hiện đang mở cho các nhà nghiên cứu và kỹ sư thông qua API Gemini.

EditorTan Wei Jie