OpenAI Phát Hành GPT-5.3-Codex-Spark Trên Các Chip Của Cerebras, Mở Rộng Đa Dạng GPU

OpenAI đã chính thức ra mắt GPT-5.3-Codex-Spark vào ngày 13 tháng 2 năm 2026, trở thành phiên bản mã hóa đầu tiên có thể chạy trên các chip của Cerebras, đánh dấu bước chuyển từ phụ thuộc vào NVIDIA. Phiên bản này là phiên bản tối giản của Codex, tập trung vào tốc độ phản hồi thấp hơn chứ không phải khả năng triển khai đầy đủ.

Những chỉ số nổi bật bao gồm tốc độ phản hồi tăng 15 lần lên đến hơn 1.000 từ mỗi giây, cửa sổ ngữ cảnh lên đến 128.000 từ, chi phí truyền dữ liệu vòng đi vòng lại giảm 80%, chi phí mỗi từ giảm 30%, và thời gian phản hồi đầu tiên giảm 50%. Giao diện CLI và mở rộng VS Code của Codex hiện đang được cung cấp cho các nhà nghiên cứu sử dụng gói Pro của ChatGPT.

Mặc dù tốc độ được cải thiện đáng kể, phiên bản này lại kém hiệu quả hơn phiên bản đầy đủ GPT-5.3-Codex trên các bài kiểm tra SWE-Bench Pro và Terminal-Bench 2.0. OpenAI dự kiến sẽ mở rộng quyền truy cập API cho các đối tác doanh nghiệp chọn lọc, sau đó mở rộng dần đến cộng đồng rộng hơn dựa trên phản hồi từ các tác vụ thực tế.

Sự chuyển đổi này xảy ra sau khi OpenAI ký một thỏa thuận trị giá hơn 100 tỷ USD với Cerebras vào tháng 1 năm 2026, đồng thời tiếp tục hợp tác với AMD và Broadcom, trong khi thỏa thuận trị giá 1 nghìn tỷ USD với NVIDIA đang chậm lại. Các nhà phân tích cho rằng việc này là một chiến lược chuyển dịch nhằm giảm rủi ro phụ thuộc vào một nhà cung cấp duy nhất, đồng thời tăng năng suất cho các nhà phát triển trong thị trường cạnh tranh gay gắt của các công cụ hỗ trợ lập trình.

EditorLim