Thinking Machines ra mắt mô hình tương tác AI độ trễ thấp sau khi Murati rời OpenAI
Thinking Machines Labs, startup AI do cựu CTO OpenAI Mira Murati sáng lập, ngày 11/5/2026 công bố bản demo và blog kỹ thuật cho Interaction Model. Mô hình này xử lý đồng thời giọng nói, video và văn bản, với độ trễ phản hồi 0,40 giây.
Theo công ty, hệ thống dùng kiến trúc song công toàn phần, xử lý đầu vào và đầu ra mỗi 200 mili giây trong một Transformer duy nhất, không cần bộ mã hóa giọng nói riêng. Mô hình tiền tuyến là hệ mixture-of-experts quy mô 276 tỷ tham số, trong đó 12 tỷ tham số hoạt động, kết hợp với mô hình nền phục vụ suy luận bất đồng bộ, tìm kiếm web và sử dụng công cụ.
Dữ liệu benchmark do Thinking Machines dẫn ra cho thấy TML-Interaction-Small đạt 77,8 điểm trên FD-bench, so với 46,8 điểm của GPT-realtime-2.0 thuộc OpenAI; độ trễ tương ứng là 0,40 giây so với 1,18 giây. Trước đó, Thinking Machines huy động khoảng 2 tỷ USD trong vòng do Andreessen Horowitz dẫn dắt, với mức định giá được cho là 12 tỷ USD. Công ty hiện có khoảng 130 nhân sự, nhiều người từng làm tại OpenAI.