Nghịch lý thị trường chip: TurboQuant của Google không làm giảm mà còn thúc đẩy nhu cầu chip nhớ
TurboQuant Google thúc đẩy nhu cầu chip nhớ, Samsung bùng nổ lợi nhuận

Thị trường chip nhớ bùng nổ bất chấp công nghệ tiết kiệm bộ nhớ TurboQuant của Google

Thị trường bán dẫn toàn cầu vừa trải qua những tuần đầy biến động khi Google Research công bố thuật toán TurboQuant, một công nghệ hứa hẹn giảm mạnh lượng bộ nhớ cần thiết để vận hành trí tuệ nhân tạo (AI). Thoạt nhìn, điều này có vẻ đe dọa trực tiếp đến các nhà sản xuất chip nhớ băng thông cao (HBM) như Samsung Electronics và SK Hynix. Tuy nhiên, thực tế lại đang diễn ra một nghịch lý thú vị: thay vì sụp đổ, thị trường chip nhớ đang bùng nổ mạnh mẽ hơn bao giờ hết.

Samsung ghi nhận lợi nhuận kỷ lục, xoa dịu lo ngại từ TurboQuant

Theo báo cáo từ Financial Times, trong khi giới đầu tư ban đầu lo ngại TurboQuant có thể dập tắt cơn sốt chip nhớ, kết quả kinh doanh của Samsung Electronics lại cho thấy một kịch bản trái ngược. Công ty Hàn Quốc vừa đưa ra ước tính lợi nhuận quý I cao hơn tổng lợi nhuận cả năm ngoái cộng lại, một con số ấn tượng không chỉ xoa dịu cổ đông mà còn khẳng định tình trạng 'nút thắt cổ chai' về bộ nhớ cho AI vẫn chưa hạ nhiệt.

Cổ phiếu Samsung đã hồi phục nhanh chóng sau đợt sụt giảm ban đầu và áp sát mức cao kỷ lục, phản ánh niềm tin thị trường rằng công nghệ mới không làm giảm nhu cầu mà còn có thể thúc đẩy ngành bán dẫn lên tầm cao mới. Samsung nhận định thị trường đang bước vào một 'siêu chu kỳ chưa từng có' với nhu cầu chip nhớ bền bỉ và mạnh mẽ.

Banner rộng Pickt — ứng dụng danh sách mua sắm cộng tác cho Telegram

TurboQuant hoạt động thế nào và tại sao gây xôn xao?

TurboQuant hoạt động bằng cách nén 'KV cache', một dạng bộ nhớ ngắn hạn cho phép các mô hình ngôn ngữ lớn như ChatGPT ghi nhớ ngữ cảnh hội thoại. Google khẳng định giải pháp này có thể cắt giảm tới 6 lần lượng bộ nhớ sử dụng mà không ảnh hưởng đáng kể độ chính xác. Ông Han In-su, nhà nghiên cứu đóng góp cho TurboQuant, cho biết thuật toán này có thể hiện thực hóa các nhiệm vụ khó khăn trước đây, như xử lý ngữ cảnh dài hơn trong điều kiện bộ nhớ hạn chế hoặc triển khai AI trên thiết bị nhỏ.

Giáo sư Kwon Seok-joon tại Đại học Sungkyunkwan nhận định TurboQuant có tiềm năng cắt giảm chi phí vận hành mô hình ngôn ngữ từ 4 đến 8 lần. 'Thoạt nhìn, điều này có vẻ đe dọa nhu cầu chip nhớ băng thông cao', ông nói. Trên lý thuyết, nếu hệ thống cần ít bộ nhớ hơn, nhu cầu chip mới sẽ giảm, dẫn đến việc cổ phiếu Samsung và SK Hynix sụt giảm mạnh tháng trước khi nhà đầu tư bán tháo.

Nghịch lý Jevons: Hiệu suất cao hơn, tiêu thụ nhiều hơn

Tuy nhiên, các nhà phân tích đang áp dụng 'Nghịch lý Jevons', một lý thuyết kinh tế từ năm 1865, để giải thích hiện tượng này. Lý thuyết chỉ ra rằng khi hiệu suất sử dụng tài nguyên tăng, tổng lượng tiêu thụ thực tế sẽ tăng vì chi phí rẻ hơn mở ra nhiều ứng dụng mới. Tương tự, giáo sư Kwon phân tích rằng việc suy luận AI rẻ hơn sẽ mở ra khối lượng công việc trước đây quá đắt đỏ, như trợ lý mã hóa thời gian thực hoặc tác tử AI đồng thời, từ đó kéo theo nhu cầu tính toán và lưu trữ tăng vọt.

Lịch sử đã chứng minh điều này qua công nghệ Kubernetes của Google: ban đầu lo ngại giảm nhu cầu máy chủ, nhưng chi phí thấp khuyến khích sử dụng rộng rãi, dẫn đến bùng nổ hạ tầng trung tâm dữ liệu.

Banner sau bài viết Pickt — ứng dụng danh sách mua sắm cộng tác với hình minh họa gia đình

Thay đổi cấu trúc thị trường: Từ bán lẻ sang hợp đồng dài hạn

Một yếu tố khác giúp các nhà sản xuất chip Hàn Quốc tự tin là sự thay đổi trong cấu trúc vận hành thị trường. Ray Wang từ SemiAnalysis cho biết bộ nhớ đang mất tính chu kỳ thất thường nhờ nhu cầu AI bền vững. Các nhà cung cấp dịch vụ AI đang 'đặt chỗ' trước bằng hợp đồng dài hạn để đảm bảo nguồn cung.

Ông Jun Young-hyun, đồng Giám đốc điều hành Samsung, xác nhận công ty đang chuyển từ hợp đồng ngắn hạn sang các thỏa thuận kéo dài 3 đến 5 năm với khách hàng lớn, tạo tấm đệm an toàn về doanh thu và giảm thiểu tác động từ biến động thuật toán hay tâm lý thị trường ngắn hạn.

Tương lai của TurboQuant và thị trường chip nhớ

Hiện tại, TurboQuant vẫn là ý tưởng học thuật và sẽ được trình bày chi tiết tại Hội nghị quốc tế về Biểu diễn học tập (ICLR) ở Brazil cuối tháng 4. Dù thành công đến đâu, thế giới vẫn 'khát' chip nhớ. Giáo sư Han In-su chia sẻ: 'Chúng tôi chưa bao giờ tưởng tượng một công nghệ từ câu hỏi học thuật về nén dữ liệu lại có thể gây hiệu ứng kinh tế và xã hội lớn đến vậy.'

Nguồn: FT, The Verge