OpenAI tìm kiếm chip suy luận thay thế NVIDIA, lo ngại về tốc độ xử lý
Tám nguồn tin cho biết kể từ năm 2025, OpenAI đã không hài lòng với chip AI của NVIDIA trong các tác vụ suy luận và đang theo đuổi các phương án thay thế, đánh dấu bước chuyển chiến lược có thể đe dọa vị thế thống trị thị trường phần cứng AI của NVIDIA. Vấn đề tập trung vào độ trễ khi xử lý các khối lượng công việc cụ thể như hỗ trợ lập trình—nơi thời gian phản hồi nhanh là yếu tố then chốt.
OpenAI đang xem xét các loại chip tích hợp bộ nhớ SRAM mật độ cao trên die (on-die), chẳng hạn từ Cerebras và Groq, nhằm tăng tốc suy luận—giai đoạn đòi hỏi băng thông bộ nhớ cao hơn cả huấn luyện mô hình. Dù NVIDIA vẫn là nhà cung cấp chính cho nhu cầu suy luận, OpenAI dự kiến dành khoảng 10% năng lực suy luận tương lai cho các giải pháp thay thế. Các cuộc đàm phán với Groq đã đình trệ sau khi NVIDIA ký thỏa thuận cấp phép phi độc quyền trị giá 20 tỷ USD và tuyển dụng nhiều kỹ sư chủ chốt của Groq. Trong khi đó, OpenAI đã ký kết thỏa thuận thương mại với Cerebras. NVIDIA khẳng định chip của họ vẫn vượt trội về hiệu năng và hiệu quả chi phí khi triển khai quy mô lớn.