NVIDIA Đạt Bước Nhảy Vọt Hiệu Suất AI Chỉ Với Tối Ưu Phần Mềm
Trong một báo cáo mới nhất từ cuộc kiểm tra MLPerf Inference v6.0 do MLCommons tổ chức, NVIDIA đã gây ấn tượng mạnh khi tăng hiệu suất của mô hình DeepSeek-R1 lên gấp 2,7 lần mà không cần thay đổi bất kỳ phần cứng nào. Kết quả này được thực hiện hoàn toàn thông qua các cải tiến phần mềm, khẳng định khả năng tối ưu hóa sâu sắc của hãng trong lĩnh vực trí tuệ nhân tạo.
Chi Tiết Kết Quả MLPerf Inference v6.0
Hệ thống GB300 NVL72 của NVIDIA đã đạt được 8.064 token mỗi giây trên mỗi GPU khi chạy DeepSeek-R1 ở chế độ Server. Con số này thể hiện mức tăng trưởng đáng kinh ngạc, lên đến 2,77 lần so với kết quả 2.907 token/giây/GPU từ lần nộp bài trước đó. Ở chế độ Offline, hiệu suất cũng được cải thiện đáng kể, đạt 9.821 token/giây/GPU, tương đương với mức tăng 1,68 lần.
Ngoài DeepSeek-R1, NVIDIA còn cho thấy sự tiến bộ vượt bậc với các mô hình khác như Llama 3.1 405B. Cụ thể, ở chế độ Server, hiệu suất đạt 259 token/giây/GPU, tăng 1,52 lần, và ở chế độ Offline là 271 token/giây/GPU, tăng 1,21 lần. Những con số này minh chứng cho sự ổn định và khả năng mở rộng của nền tảng Blackwell Ultra mà NVIDIA đang phát triển.
Ưu Thế Vượt Trội Trong Ngành Công Nghiệp AI
MLPerf Inference v6.0 đã được cập nhật với nhiều mô hình mới, bao gồm DeepSeek-R1, GPT-OSS-120B và Mixtral 8x7B, đồng thời mở rộng phạm vi kiểm tra sang các lĩnh vực như mô hình ngôn ngữ lớn dạng dày đặc, hệ thống kết hợp thị giác và ngôn ngữ, cũng như gợi ý sinh tạo. Điều này phản ánh sự đa dạng của các tác vụ AI trong môi trường doanh nghiệp hiện đại.
CEO Jensen Huang của NVIDIA từng mô tả MLPerf là bộ kiểm tra "khắt khe" nhất hiện nay, và kết quả lần này cho thấy hãng không chỉ vượt qua thử thách mà còn thiết lập khoảng cách lớn so với các đối thủ. NVIDIA tuyên bố rằng họ là đơn vị duy nhất nộp kết quả cho DeepSeek-R1 trong MLPerf Inference năm ngoái, và với v6.0, ưu thế này tiếp tục được duy trì trong khi nhiều nhà sản xuất ASIC cạnh tranh và AMD vẫn chưa tham gia đầy đủ.
Ý Nghĩa Chiến Lược Và Tương Lai
NVIDIA nhấn mạnh rằng, bên cạnh hiệu suất cao, các yếu tố như token trên mỗi đô la và chi phí sở hữu toàn phần (TCO) trong triển khai quy mô lớn là lý do chính khiến doanh nghiệp lựa chọn hạ tầng của hãng. Việc tăng hiệu suất thông qua tối ưu phần mềm mà không cần nâng cấp phần cứng không chỉ giảm thiểu chi phí mà còn tối đa hóa giá trị đầu tư cho khách hàng.
Sự kiện này không chỉ củng cố vị trí dẫn đầu của NVIDIA trong lĩnh vực suy luận AI mà còn mở ra hướng đi mới cho ngành công nghiệp, nơi phần mềm đóng vai trò then chốt trong việc khai thác tối đa tiềm năng của phần cứng. Với tốc độ phát triển nhanh chóng, NVIDIA tiếp tục khẳng định cam kết thúc đẩy ranh giới của công nghệ AI toàn cầu.



