Lỗi cập nhật Claude Code làm lộ toàn bộ mã nguồn và tính năng bí mật của Anthropic

Claude Code, công cụ lập trình AI do Anthropic phát triển, vừa trải qua một sự cố nghiêm trọng khi một lỗi đóng gói trong bản cập nhật mới nhất đã vô tình tiết lộ toàn bộ mã nguồn của ứng dụng. Sự việc bắt đầu vào khoảng 4 giờ sáng ngày 31/3 theo giờ Mỹ, khi Chaofan Shou, một kỹ sư phần mềm thực tập, phát hiện bản cập nhật Claude Code phân phối qua npm – kho phần mềm công khai dành cho lập trình viên – có kèm theo một file nặng gần 60 MB chứa "bản đồ" trỏ thẳng đến kho lưu trữ dữ liệu nội bộ của Anthropic.

Toàn bộ thiết kế và tính năng bí mật bị phơi bày

File này cho phép tải về tự do toàn bộ mã nguồn gốc của Claude Code dưới dạng ZIP. Shou nhanh chóng đăng thông tin cùng đường link tải thẳng lên mạng xã hội. Chỉ trong vòng 30 phút, cộng đồng lập trình viên toàn cầu đã bắt đầu tải về và phân tích. Đến cuối ngày, một kho lưu trữ bản sao trên GitHub đã thu hút gần 30.000 lượt yêu thích và hơn 41.500 lượt sao chép.

Anthropic xác nhận sự việc là "lỗi đóng gói trong quá trình phát hành do sai sót con người, không phải vi phạm bảo mật". Công ty khẳng định không có dữ liệu khách hàng hay thông tin tài khoản nào bị lộ, và đang triển khai các biện pháp ngăn chặn tái diễn. Tuy nhiên, những gì bị lộ thực chất là toàn bộ "bản vẽ thiết kế" của Claude Code – cách nó được xây dựng, cơ chế hoạt động nội bộ của các tính năng, và cả những tính năng chưa từng được công bố đang trong giai đoạn phát triển.

—

Banner rộng Pickt — ứng dụng danh sách mua sắm cộng tác cho Telegram

Con số cụ thể cho thấy quy mô đáng kể: hơn 1.900 file với 512.000 dòng mã, tương đương một phần mềm thương mại lớn. Dữ liệu cuộc trò chuyện của người dùng, thông tin tài khoản, hay "trí não" của mô hình AI đều không bị ảnh hưởng, nhưng cấu trúc cốt lõi đã bị phơi bày hoàn toàn.

Những tính năng bí mật chưa từng được công bố

Phần gây chú ý nhất không phải là những gì Claude Code đang làm, mà là những dự án bí mật Anthropic đang âm thầm xây dựng:

Banner sau bài viết Pickt — ứng dụng danh sách mua sắm cộng tác với hình minh họa gia đình

KAIROS: Một chế độ mới cho phép Claude Code chạy liên tục trong nền mà không cần người dùng ra lệnh. Thay vì chỉ phản hồi khi được hỏi, KAIROS cho phép công cụ tự quan sát, ghi chú và chủ động thực hiện các tác vụ nhỏ khi nhận thấy cơ hội phù hợp. Hệ thống có giới hạn: bất kỳ hành động nào mất hơn 15 giây đều bị hoãn lại.
autoDream: Gắn liền với KAIROS, tiến trình nền này tự động chạy khi người dùng không hoạt động để "dọn dẹp" bộ nhớ của Claude Code – loại bỏ mâu thuẫn, xác nhận lại thông tin chưa chắc chắn và sắp xếp lại kiến thức về dự án. Cái tên "mơ" ám chỉ việc Claude đang "ngủ và xử lý lại những gì đã học trong ngày".
ULTRAPLAN: Xử lý những tác vụ lập kế hoạch quá phức tạp để hoàn thành trong vài giây. Khi kích hoạt, Claude Code chuyển toàn bộ bài toán lên máy chủ của Anthropic, cho phép hệ thống suy nghĩ tối đa 30 phút, sau đó hiển thị kết quả để người dùng xem xét và phê duyệt qua trình duyệt web trước khi thực thi.

Undercover Mode và câu hỏi về minh bạch

Chi tiết gây tranh luận nhiều nhất là hệ thống có tên Undercover Mode. Khi Claude Code hoạt động trong các dự án phần mềm mã nguồn mở công khai, một chế độ đặc biệt tự động kích hoạt, xóa mọi dấu hiệu cho thấy code được viết hoặc hỗ trợ bởi AI của Anthropic. Các ghi chú lịch sử thay đổi trên Git sẽ không chứa bất kỳ tên mã nội bộ hay dấu vết nào của công ty.

Nội dung tìm thấy trong mã nguồn bị lộ ghi rõ: "Bạn đang hoạt động bí mật... Đừng để lộ danh tính". Mục đích có thể là để Anthropic dùng chính công cụ của mình trong quá trình phát triển nội bộ mà không để lộ thông tin nhạy cảm ra bên ngoài. Tuy nhiên, việc tồn tại một cơ chế chủ động xóa dấu vết AI trong các dự án công khai đã làm dấy lên câu hỏi về tính minh bạch khi AI tham gia đóng góp vào phần mềm mà hàng triệu người đang sử dụng.

Irony không thể bỏ qua: Anthropic tốn công xây dựng hệ thống để đảm bảo AI không bao giờ bị lộ thông tin nội bộ trong các dự án công khai, rồi chính họ lại để lộ toàn bộ thiết kế của hệ thống đó qua một lỗi cập nhật phần mềm.

Lần thứ hai trong một năm, lần thứ hai trong 5 ngày

Sự cố tương tự đã xảy ra vào tháng 2/2025, khi Anthropic phát hiện kịp thời và xóa các phiên bản bị lỗi trước khi thiệt hại lan rộng. Đáng chú ý hơn, đây là lần thứ hai Anthropic để lộ thông tin nội bộ chỉ trong vòng 5 ngày. Ngày 26/3, tờ Fortune đưa tin một lỗi cấu hình trong hệ thống quản lý nội dung của Anthropic khiến gần 3.000 tài liệu chưa được công bố trở nên truy cập công khai, bao gồm thông tin về model AI mới chưa ra mắt. Anthropic khi đó cũng xác nhận đây là "sai sót con người".

Anthropic đã gỡ bỏ bản cập nhật bị lỗi và khuyến nghị người dùng chuyển sang cài đặt Claude Code qua đường dẫn chính thức thay vì qua kho phần mềm npm, vì cách cài đặt trực tiếp không phụ thuộc vào các thư viện bên thứ ba có thể bị tấn công. Tuy nhiên, đến khi Anthropic hành động, ít nhất 3 bản sao công khai của mã nguồn đã xuất hiện trên GitHub với hàng chục nghìn lượt sao chép.

Cảnh báo cho người cập nhật Claude Code trong sáng 31/3

Ngoài vụ rò rỉ mã nguồn, có một nguy cơ bảo mật thực sự và tách biệt cần lưu ý. Trong khoảng từ 7 giờ 21 đến 10 giờ 29 phút sáng theo giờ Việt Nam ngày 31/3, một cuộc tấn công riêng biệt vào kho phần mềm npm đã phát tán một phiên bản độc hại của axios, một thư viện mà Claude Code sử dụng. Phiên bản này chứa mã độc cho phép kẻ tấn công truy cập từ xa vào máy tính của nạn nhân.

Khuyến nghị an toàn: Người dùng đã cài hoặc cập nhật Claude Code qua npm trong khung giờ này nên nhờ người có chuyên môn kỹ thuật kiểm tra thiết bị, thay thế toàn bộ mật khẩu và mã xác thực đang sử dụng trên máy đó, và cân nhắc cài lại hệ điều hành nếu cần. Theo Thế Duyệt, đây là một rủi ro nghiêm trọng đòi hỏi hành động khẩn cấp để bảo vệ dữ liệu cá nhân và an ninh hệ thống.