ET 18:10

AI vượt kỷ lục của con người trong bài chuẩn tối ưu nanoGPT tự chủ

Prime Intellect ngày 15/5/2026 cho biết các tác nhân AI sử dụng Claude Opus 4.7 và Codex, hệ thống được mô tả là dựa trên GPT 5.5, đã vượt kỷ lục của con người trong bài chuẩn tối ưu nanoGPT mà không cần hướng dẫn từ con người. Kết quả này có thể đánh dấu một cột mốc mới cho nghiên cứu AI tự chủ.

Phòng thí nghiệm cho biết thử nghiệm tiêu tốn khoảng 14.000 giờ tính toán trên Nvidia H200, thực hiện xấp xỉ 10.000 vòng lặp và tạo ra 23,9 tỷ token dấu vết suy luận. Opus 4.7 đạt mục tiêu sau 2.930 bước, còn Codex đạt sau 2.950 bước; cả hai đều vượt mốc kỷ lục trước đó của con người là 2.990 bước.

Bài chuẩn nanoGPT do Keller Jordan khởi xướng, nhằm đo hiệu quả huấn luyện một mô hình cố định 124 triệu tham số trong cùng kiến trúc và dữ liệu, chỉ cho phép thay đổi bộ tối ưu và siêu tham số. Prime Intellect cho biết kết quả đã mở mã nguồn và có thể tái lập, song báo cáo cũng lưu ý vẫn còn các câu hỏi chưa ngã ngũ về tính mới khoa học và hành vi ra quyết định tự chủ.

EditorJack Lee