OpenAI tìm kiếm chip suy luận AI thay thế NVIDIA, tiếp cận AMD, Cerebras và Groq
Theo Reuters ngày 2 tháng 2 năm 2026, nhiều nguồn tin cho biết OpenAI từ năm ngoái đã âm thầm đánh giá các chip suy luận AI của AMD, Cerebras và Groq nhằm tìm giải pháp thay thế NVIDIA, do không hài lòng với độ trễ phản hồi trong một số ứng dụng, đặc biệt là phát triển phần mềm và tích hợp hệ thống.
Động thái này phản ánh trọng tâm ngày càng lớn của OpenAI đối với khâu suy luận (inference)—quá trình tạo phản hồi thời gian thực từ mô hình AI đã huấn luyện—xem đây là điểm nghẽn hiệu năng then chốt. Dù NVIDIA thống trị thị trường phần cứng huấn luyện AI, GPU của hãng lại phụ thuộc vào bộ nhớ ngoài, dẫn đến độ trễ cao hơn so với kiến trúc tích hợp SRAM như của Cerebras. OpenAI dự kiến phân bổ khoảng 10% khối lượng suy luận sang nền tảng phi-NVIDIA, song khẳng định hiện nay đa số cụm suy luận vẫn do NVIDIA vận hành. Trong khi đó, hai bên vẫn tiếp tục đàm phán về thỏa thuận đầu tư 10 tỷ USD, dù giao dịch này vẫn chưa được chốt. Giám đốc điều hành NVIDIA Jensen Huang phủ nhận mâu thuẫn, nhấn mạnh chip của hãng mang lại hiệu suất và chi phí vượt trội cho suy luận quy mô lớn.