DeepSeek ra mắt AI mã nguồn mở lớn nhất, giá chỉ từ 3.700 đồng/triệu token

DeepSeek vừa chính thức phát hành hai mô hình ngôn ngữ lớn thế hệ mới dưới dạng bản xem trước, mang tên V4 Flash và V4 Pro. Cả hai đều được quảng bá là những mô hình mã nguồn mở lớn nhất từ trước đến nay, đồng thời có mức giá thấp hơn đáng kể so với các đối thủ thương mại trên thị trường.

Kiến trúc tiết kiệm chi phí vượt trội

Cả V4 Flash và V4 Pro đều sử dụng kiến trúc mixture-of-experts (MoE). Thay vì kích hoạt toàn bộ tham số trong mỗi lần xử lý, hệ thống chỉ sử dụng một phần nhỏ, giúp giảm chi phí vận hành một cách đáng kể. Hai mô hình này cũng hỗ trợ cửa sổ ngữ cảnh lên tới 1 triệu token, đủ để đưa toàn bộ một tài liệu dài hoặc kho mã nguồn lớn vào câu lệnh.

V4 Pro hiện là mô hình mã nguồn mở lớn nhất hiện có, với 1,6 nghìn tỷ tham số, trong đó 49 tỷ được kích hoạt mỗi lần xử lý. Con số này vượt qua Kimi K 2.6 của Moonshot AI (1,1 nghìn tỷ), M1 của MiniMax (456 tỷ), và gần gấp đôi so với DeepSeek V3.2 (671 tỷ). Phiên bản nhỏ hơn, V4 Flash, có 284 tỷ tham số với 13 tỷ được kích hoạt.

—

Banner rộng Pickt — ứng dụng danh sách mua sắm cộng tác cho Telegram

Hiệu suất gần bằng các mô hình hàng đầu

DeepSeek cho biết cả hai mô hình hoạt động tốt hơn V3.2 nhờ cải tiến kiến trúc, và đã gần như thu hẹp khoảng cách với các mô hình dẫn đầu hiện tại, cả mã nguồn mở lẫn thương mại, trên các bài kiểm tra suy luận. Phiên bản cao nhất, V4-Pro-Max, được cho là vượt qua các đối thủ mã nguồn mở và trội hơn GPT-5.2 của OpenAI cùng Gemini 3.0 Pro của Google trên một số tác vụ.

Trong các bài kiểm tra lập trình, hiệu suất của cả V4 Flash lẫn V4 Pro được đánh giá ngang với GPT-5.4. Tuy nhiên, hai mô hình vẫn thua nhẹ so với các mô hình tiên tiến nhất trong các bài kiểm tra kiến thức tổng hợp, đặc biệt là GPT-5.4 và Gemini 3.1 Pro. DeepSeek nhận định khoảng cách này phản ánh lộ trình phát triển đang đi sau các mô hình tiên phong khoảng 3 đến 6 tháng. Hiện tại, cả hai mô hình chỉ xử lý văn bản, trong khi nhiều mô hình thương mại cùng phân khúc đã hỗ trợ hiểu và tạo ra âm thanh, video lẫn hình ảnh.

Giá thấp hơn đối thủ cạnh tranh

V4 Flash có giá 0,14 USD (khoảng 3.700 đồng) cho mỗi triệu token đầu vào và 0,28 USD (khoảng 7.300 đồng) cho mỗi triệu token đầu ra. Mức giá này thấp hơn so với GPT-5.4 Nano, Gemini 3.1 Flash, GPT-5.4 Mini và Claude Haiku 4.5. Trong khi đó, V4 Pro có giá 0,145 USD (khoảng 3.800 đồng) cho mỗi triệu token đầu vào và 3,48 USD (khoảng 91.300 đồng) cho mỗi triệu token đầu ra, cũng thấp hơn Gemini 3.1 Pro, GPT-5.5, Claude Opus 4.7 và GPT-5.4.

Việc ra mắt diễn ra đúng một ngày sau khi phía Mỹ cáo buộc Trung Quốc sử dụng hàng nghìn tài khoản ảo để đánh cắp tài sản trí tuệ từ các phòng lab AI Mỹ trên quy mô lớn. Bản thân DeepSeek cũng đang đối mặt với cáo buộc từ Anthropic và OpenAI về việc sao chép, hay còn gọi là "chưng cất", các mô hình AI của hai công ty này.