Anthropic tố cáo ba công ty AI Trung Quốc 'chưng cất' dữ liệu quy mô lớn

Anthropic, công ty trí tuệ nhân tạo của Mỹ, đã công bố cáo buộc nghiêm trọng nhắm vào ba phòng thí nghiệm AI hàng đầu của Trung Quốc là DeepSeek, Moonshot và MiniMax. Theo đó, các công ty này bị tố thực hiện chiến dịch "chưng cất diện rộng" nhằm khai thác trái phép dữ liệu từ mô hình AI Claude của Anthropic.

Chiến dịch gian lận với 24.000 tài khoản giả mạo

Trong một bài đăng blog vào ngày 23/2, Anthropic tiết lộ rằng họ đã phát hiện một hoạt động có quy mô công nghiệp, nơi ba công ty Trung Quốc tạo ra khoảng 24.000 tài khoản gian lận để thực hiện hơn 16 triệu giao dịch với Claude. Hành động này không chỉ vi phạm điều khoản dịch vụ của Anthropic mà còn bỏ qua các hạn chế truy cập theo khu vực mà công ty đã thiết lập.

"Chúng tôi phát hiện chiến dịch ở quy mô công nghiệp của ba phòng thí nghiệm AI gồm DeepSeek, Moonshot và MiniMax, trong đó khai thác trái phép khả năng của Claude để cải thiện mô hình AI của riêng họ", Anthropic nhấn mạnh. Công ty cũng cho biết chiến dịch này "ngày càng gia tăng về cường độ và sự tinh vi", với thời gian hành động rất ngắn, và mối đe dọa "vượt ngoài phạm vi của bất kỳ công ty hay khu vực nào".

—

Banner rộng Pickt — ứng dụng danh sách mua sắm cộng tác cho Telegram

Vấn đề 'chưng cất' và những hệ lụy

Trong thế giới AI, "chưng cất" (distillation) là một kỹ thuật cho phép chuyển giao kiến thức từ một mô hình lớn (giáo viên) sang một mô hình nhỏ hơn (học sinh), giúp mô hình học sinh đạt hiệu suất tương đương với chi phí thấp hơn. Hai nhà khoa học Vishal Yadav và Nikhil Pandey giải thích với Forbes: "Kỹ thuật này giúp người dùng tận dụng chất lượng của các mô hình ngôn ngữ lớn (LLM), đồng thời giảm chi phí suy luận".

Tuy nhiên, Anthropic chỉ trích rằng việc "chưng cất" này làm suy yếu các biện pháp kiểm soát xuất khẩu, vốn được thiết kế để duy trì vị thế dẫn đầu của Mỹ trong lĩnh vực AI. Công ty kêu gọi "hành động nhanh chóng và phối hợp giữa các bên trong ngành, nhà hoạch định chính sách, cộng đồng AI toàn cầu" để giải quyết vấn đề. Mặc dù Anthropic khẳng định cuộc tấn công vi phạm điều khoản dịch vụ, nhưng vẫn chưa rõ liệu nó có vi phạm luật quốc tế hay không.

Phản ứng từ các bên liên quan

Đến thời điểm hiện tại, DeepSeek, Moonshot và MiniMax vẫn chưa đưa ra bất kỳ bình luận chính thức nào về cáo buộc này. Sự im lặng của họ làm dấy lên nhiều câu hỏi về tính minh bạch trong ngành công nghiệp AI đang phát triển nhanh chóng.

Đây không phải là lần đầu tiên vấn đề "chưng cất" được đề cập. Đầu năm ngoái, OpenAI cũng báo cáo dấu hiệu tương tự từ DeepSeek, nhưng nhiều người đã chế giễu vì cho rằng các công ty lớn như OpenAI tự cho mình "quyền tuyệt đối" trong việc huấn luyện mô hình. Gần đây, nhóm Tình báo và Mối đe dọa của Google (GTIG) cũng ghi nhận sự gia tăng các nỗ lực trích xuất mô hình, dù không nêu tên cụ thể.

Banner sau bài viết Pickt — ứng dụng danh sách mua sắm cộng tác với hình minh họa gia đình

Bối cảnh của ba công ty bị tố cáo

DeepSeek: Nổi tiếng từ đầu năm ngoái với mô hình AI hiệu suất cao nhưng chi phí thấp, chỉ sử dụng 2.048 card đồ họa Nvidia H800 và 5,6 triệu USD để đào tạo mô hình V3 với 671 tỷ tham số.
Moonshot AI: Là kỳ lân mới của Trung Quốc, nổi tiếng với mô hình mã nguồn mở Kimi K2, vượt trội ChatGPT 4.1 trong bài kiểm tra viết mã và Claude 4 Opus trong kiểm tra kiến thức khoa học.
MiniMax: Thuộc nhóm "AI Tigers", xây dựng nhiều nền tảng AI đa phương thức xử lý văn bản, giọng nói, hình ảnh và video, phục vụ hàng trăm triệu người dùng trong nước.

Sự việc này làm nổi bật những căng thẳng ngày càng tăng trong cuộc đua AI toàn cầu, nơi các công ty tìm cách tối ưu hóa chi phí và thời gian phát triển, nhưng đồng thời cũng đặt ra những thách thức về đạo đức và pháp lý. Cộng đồng công nghệ đang chờ đợi phản ứng chính thức từ các bên liên quan và những động thái tiếp theo từ các nhà hoạch định chính sách.