OpenAI có một bước tiến mới trong sự độc lập về công nghệ của mình. Gã khổng lồ AI vừa giới thiệu Jalapeño, bộ xử lý trí tuệ nhân tạo đầu tiên được phát triển tùy chỉnh với Broadcom. Con chip này, được thiết kế đặc biệt để suy luận các mô hình ngôn ngữ lớn, sẽ giúp phản hồi nhanh hơn các truy vấn đồng thời giảm chi phí năng lượng của các dịch vụ như ChatGPT và Codex.
Một con chip được thiết kế để chạy các mô hình AI
Không giống như các bộ tăng tốc đa năng được sử dụng cho nhiều khối lượng công việc tính toán, Jalapeño được xây dựng dựa trên nhu cầu suy luận cụ thể của OpenAI. Giai đoạn này tương ứng với việc thực thi một mô hình đã được đào tạo khi người dùng gửi truy vấn, tạo văn bản, phân tích hình ảnh hoặc yêu cầu tác nhân AI.
OpenAI giải thích rằng họ đã tối ưu hóa kiến trúc của chip xung quanh việc trao đổi giữa tính toán, bộ nhớ và mạng. Mục tiêu là đạt được hiệu quả thực tế gần hơn với tiềm năng lý thuyết của phần cứng, đặc biệt bằng cách giảm sự di chuyển dữ liệu, vốn rất tốn kém năng lượng trong cơ sở hạ tầng AI.
Sự phát triển được tăng tốc nhờ các mô hình riêng của OpenAI
Chương trình sẽ đạt đến giai đoạn băng radiễn ra trước quá trình sản xuất chip chỉ trong chín tháng. OpenAI cho biết các mô hình của họ đã tham gia vào một số giai đoạn thiết kế và tối ưu hóa. Các ví dụ kỹ thuật đã được thử nghiệm trong phòng thí nghiệm, đặc biệt là với GPT-5.3-Codex-Spark.
Kết quả đầu tiên cho thấy hiệu suất trên mỗi watt “vượt trội đáng kể” đến các giải pháp tham khảo hiện tại mà chưa có số liệu chi tiết nào được công bố. Một báo cáo kỹ thuật phải được truyền đạt trong những tháng tới.
Chiến lược cơ sở hạ tầng quy mô rất lớn
Jalapeño là một phần trong mối quan hệ hợp tác nhiều năm với Broadcom để triển khai bộ tăng tốc AI tùy chỉnh lên tới 10 gigawatt vào năm 2029. “Bằng cách thiết kế nhiều kho công nghệ hơn, chúng tôi có thể cung cấp nhiều thông tin thông minh hơn với hiệu quả cao hơn,” tóm tắt Greg Brockman, chủ tịch và đồng sáng lập của OpenAI.
Do đó, OpenAI sẽ không thay thế ngay lập tức các GPU hiện có, nhưng đây là nền tảng của nền tảng phần cứng nội bộ nhằm làm cho các mô hình của nó nhanh hơn, đáng tin cậy hơn và có khả năng sử dụng ít tốn kém hơn, bản thân đây đã là một cuộc cách mạng nhỏ…
















