DeepSeek V4: Cuộc đua AI Trung Quốc chậm lại vì áp lực tự chủ chip nội địa
Theo báo cáo từ 36Kr, giới công nghệ Trung Quốc đang đối mặt với một câu hỏi lớn: liệu DeepSeek V4 có được phát hành hay không? Trong hơn một năm qua, cuộc đua về các mô hình ngôn ngữ lớn (LLM) toàn cầu đã bước vào giai đoạn cạnh tranh khốc liệt. Các tập đoàn công nghệ hàng đầu như OpenAI, Anthropic và Google duy trì nhịp độ cập nhật liên tục, với chu kỳ nâng cấp chỉ từ 2-3 tháng, thậm chí hàng tháng. Các phiên bản mới nhanh chóng được đưa ra thị trường để thử nghiệm, kiểm chứng và hoàn thiện.
Tuy nhiên, trong suốt 15 tháng qua, DeepSeek đã chậm lại đáng kể trong việc cập nhật các phiên bản lớn. V4 nhiều lần bị trì hoãn, khiến nhịp độ tụt hậu rõ rệt, từ vị thế dẫn đầu ngành trở thành người chậm nhịp. Sự chờ đợi đầy lo lắng của giới công nghệ Trung Quốc dần biến thành vòng xoáy hoài nghi.
Áp lực từ chiến lược tự chủ công nghệ
Đầu tháng 4, một số cơ quan truyền thông Trung Quốc bất ngờ đưa tin: DeepSeek V4 có thể sẽ được phát hành trong vài tuần tới, nhưng không nên đặt kỳ vọng quá cao vào phiên bản này. Tại sao một đợt phát hành được mong đợi từ lâu lại phải "tiêm phòng kỳ vọng" từ trước như vậy? Sự thật có lẽ nằm trong một mẩu tin bị đa số bỏ qua.
Tháng 1 năm 2025, hãng tin Reuters tiết lộ một chi tiết quan trọng: Sau khi DeepSeek R1 ra mắt, các cơ quan liên quan đã "khuyến khích" DeepSeek sử dụng bộ vi xử lý Ascend của Huawei, thay vì tiếp tục dùng Nvidia. Hai chữ "khuyến khích" trong bối cảnh này mang sức nặng, vượt xa nghĩa đen. DeepSeek không phải là một công ty khởi nghiệp bình thường, mà được coi là hình mẫu thành công đầu tiên của AI Trung Quốc trong việc phá vỡ sự phong tỏa công nghệ từ Mỹ. Ý nghĩa biểu tượng này đã khiến DeepSeek nhanh chóng trở thành quân cờ then chốt trong bàn cờ chiến lược tự chủ công nghệ quốc gia.
Thách thức kỹ thuật và sự thỏa hiệp
Theo thông tin từ 36Kr, đầu năm 2025, DeepSeek thực sự đã nỗ lực sử dụng chip Huawei Ascend 910C để huấn luyện mô hình thế hệ tiếp theo. Tuy nhiên, quá trình này vấp phải nhiều rào cản kỹ thuật: độ ổn định huấn luyện không đủ, thường xuyên bị sập hệ thống trong các kịch bản phân tán quy mô lớn, và tốc độ giao tiếp giữa các chip không đạt kỳ vọng. Dù Huawei đã cử đội ngũ kỹ sư đến tận trụ sở DeepSeek để hỗ trợ trực tiếp, nhưng cuối cùng vẫn không giải quyết được vấn đề tương thích trong giai đoạn huấn luyện.
Kết quả là một sự thỏa hiệp: DeepSeek quay lại sử dụng GPU Nvidia cho giai đoạn huấn luyện, còn chip Ascend chỉ được dùng cho khâu suy luận. Điều này đồng nghĩa với việc, riêng ở khâu huấn luyện - mắt xích cốt lõi, DeepSeek đã mất gần một năm để thử sai.
Nỗ lực thích ứng với chip nội địa
Năm 2026, phiên bản V4 xuất hiện những tín hiệu mới. Theo các nguồn tin rò rỉ mà 36Kr thu thập được, DeepSeek đã không mở quyền thử nghiệm sớm cho Nvidia, mà ưu tiên bàn giao phiên bản tiền phát hành cho dòng chip thế hệ mới Ascend 950PR của Huawei để tương thích hóa. Đồng thời, để phân tán rủi ro, họ cũng đồng bộ hóa việc thích ứng với chip Cambricon Technologies - công ty được mệnh danh là "Nvidia của Trung Quốc".
Tuy nhiên, những thách thức kỹ thuật vẫn rất đáng kể. Khó khăn cốt lõi của công tác thích ứng nằm ở việc "đối chiếu độ chính xác", đảm bảo mô hình cho ra kết quả nhất quán trên các hệ sinh thái phần cứng khác nhau. Điều này đòi hỏi phải điều chỉnh một lượng lớn mã nguồn tầng thấp. Khi các hãng lớn toàn cầu duy trì nhịp độ nâng cấp mô hình từ 2-3 tháng, DeepSeek lại ngày càng chậm lại. Trong khoảng thời gian đó, một tỷ lệ rất lớn tài nguyên kỹ thuật đã được đổ vào việc thích ứng với chip nội địa Trung Quốc.
Tác động đến ngành công nghiệp và cạnh tranh
Bên cạnh đó, sự liên kết ở cấp độ chuỗi ngành cũng đang diễn ra đồng thời. Đầu năm 2026, thị trường rộ lên tin đồn Alibaba, ByteDance và Tencent đã đặt hàng hàng trăm nghìn chip Ascend 950PR từ Huawei. Một giả thuyết hợp lý là: các nhà cung cấp dịch vụ điện toán đám mây đang chờ kết quả kiểm chứng từ DeepSeek V4 để đánh giá khả năng sử dụng thực tế của chip nội địa trong huấn luyện AI quy mô lớn.
Nếu DeepSeek V4 vận hành thành công, chip Huawei 950PR sẽ được nâng cấp vai trò thử nghiệm công nghệ thành sản phẩm thương mại hóa. Ngược lại, nếu không đạt kỳ vọng, kết quả này cũng đồng nghĩa với việc giúp toàn ngành xác định rõ giới hạn năng lực hiện tại của các dòng chip nội địa Trung Quốc.
Áp lực nhân sự và định hướng tương lai
Từ nửa cuối năm 2025, đội ngũ nhân sự cốt lõi của DeepSeek bắt đầu có sự lung lay. Các nhân sự chủ chốt như Vương Bỉnh Tuyên, Quách Đạt Nhã, Ngụy Hạo Nhiên và Nguyễn Trưng đã lần lượt rời đi. Nguyên nhân của sự rời đi rất phức tạp, nhưng yếu tố dễ thấy là sự bất lợi về chế độ đãi ngộ. Theo một số thông tin, đối thủ cạnh tranh đưa ra mức đãi ngộ gấp "2 đến 3 lần" DeepSeek, một số tập đoàn lớn thậm chí đưa ra đề xuất tổng thu nhập lên tới 8 chữ số.
Với tư cách là một công ty khởi nghiệp chưa gọi vốn bên ngoài, dù mức lương không quá thấp nhưng DeepSeek không thể cạnh tranh với các chính sách kích thích bằng cổ phiếu và định giá cao của các gã khổng lồ như ByteDance, Alibaba hay Tencent. Ông Lương Văn Phong đã bắt đầu thúc đẩy công tác định giá công ty, xác định rõ giá trị quyền chọn mua cổ phần để mang lại sự chắc chắn hơn cho đội ngũ nhân sự.
Kết luận: Sứ mệnh quốc gia và cái giá phải trả
DeepSeek hiện nay đang rơi vào một sự mơ hồ về vị thế. Họ vẫn cần thương mại hóa, vẫn cần giữ chân nhân tài, nhưng đồng thời lại được kỳ vọng gánh vác trọng trách tương thích hóa nội địa. Xung đột từ hai vai trò này có lẽ chính là logic sâu xa khiến DeepSeek ngày càng chậm lại trong năm qua.
Do đó, kỳ vọng của thị trường về hiệu năng của DeepSeek V4 cũng đang được điều chỉnh giảm xuống. Mô hình này có thể không phải là một mô hình "bom tấn" gây sốt toàn giới công nghệ một lần nữa, nhưng có thể là một cột mốc quan trọng về mặt công nghiệp, chứng minh rằng các mô hình tiên tiến của Trung Quốc có thể đạt đến mức độ khả dụng trên hệ sinh thái phần cứng nội địa. "Bài kiểm tra" của DeepSeek V4 có lẽ còn quan trọng hơn đối với định hướng dài hạn của toàn bộ giới AI Trung Quốc.
Theo 36Kr, Nghiêm Khiết



