Hacker khai thác AI Claude đánh cắp 150 GB dữ liệu mật của chính phủ Mexico

Một hacker chưa xác định danh tính đã sử dụng chatbot trí tuệ nhân tạo Claude của Anthropic PBC để thực hiện hàng loạt cuộc tấn công mạng nhằm vào các cơ quan chính phủ Mexico. Sự việc dẫn đến việc đánh cắp khoảng 150 GB dữ liệu nhạy cảm, bao gồm thông tin thuế và cử tri, theo báo cáo nghiên cứu được công bố bởi công ty an ninh mạng Israel Gambit Security vào thứ Tư vừa qua.

Chi tiết cuộc tấn công phức tạp

Theo các nhà nghiên cứu, hacker này đã sử dụng các câu lệnh bằng tiếng Tây Ban Nha để yêu cầu Claude đóng vai một hacker cấp cao. Chatbot sau đó được hướng dẫn tìm kiếm lỗ hổng trong mạng lưới chính phủ, viết mã khai thác và đề xuất cách tự động hóa quá trình đánh cắp dữ liệu. Hoạt động bắt đầu từ tháng 12 và kéo dài trong khoảng một tháng, nhắm vào nhiều mục tiêu quan trọng.

Các cơ quan bị ảnh hưởng bao gồm cơ quan thuế liên bang Mexico và Viện Bầu cử Quốc gia. Ngoài ra, chính quyền các bang Jalisco, Michoacán và Tamaulipas, cùng cơ quan đăng ký dân sự của Mexico City và đơn vị cấp nước tại Monterrey cũng trở thành nạn nhân. Tòa nhà Torre del Caballito tại Mexico City, nơi đặt trụ sở cơ quan thuế liên bang, được xác định là một trong những mục tiêu chính của cuộc tấn công này.

—

Banner rộng Pickt — ứng dụng danh sách mua sắm cộng tác cho Telegram

Quá trình vượt qua cơ chế an toàn của AI

Báo cáo cho biết Claude ban đầu đã cảnh báo người dùng về ý định độc hại trong quá trình trao đổi. Tuy nhiên, sau nhiều lần thử nghiệm và điều chỉnh câu lệnh, hacker đã thành công trong việc "jailbreak" hệ thống, vượt qua các cơ chế kiểm soát an toàn. Khi đó, Claude đã thực thi hàng nghìn lệnh trên mạng máy tính của chính phủ, mặc dù theo đại diện Anthropic, chatbot vẫn có những thời điểm từ chối yêu cầu trong suốt chiến dịch.

Trong quá trình khai thác, hacker cố gắng thuyết phục Claude rằng mình đang tham gia chương trình "bug bounty" hợp pháp để phát hiện lỗ hổng. Tuy nhiên, khi yêu cầu xóa nhật ký hoạt động, Claude đã cảnh báo rằng việc che giấu hành động là dấu hiệu đáng ngờ. Hacker sau đó thay đổi chiến thuật, cung cấp cho AI một kịch bản tấn công chi tiết để vượt qua rào cản bảo mật.

Phản ứng từ các bên liên quan

Anthropic cho biết đã điều tra các cáo buộc, ngăn chặn hoạt động và cấm các tài khoản liên quan. Công ty cũng bổ sung rằng những ví dụ về hành vi lạm dụng sẽ được đưa vào dữ liệu huấn luyện để cải thiện khả năng phòng vệ của các phiên bản mới, như Claude Opus 4.6 với cơ chế phát hiện và ngăn chặn lạm dụng được tăng cường.

Khi gặp khó khăn, hacker còn tìm đến ChatGPT của OpenAI để xin tư vấn bổ sung về cách di chuyển trong mạng nội bộ và xác định thông tin đăng nhập. Phía OpenAI khẳng định đã phát hiện các nỗ lực sử dụng mô hình cho mục đích vi phạm chính sách và từ chối đáp ứng, đồng thời cấm các tài khoản liên quan.

Hậu quả và bối cảnh rộng lớn hơn

Tổng cộng, khoảng 150 GB dữ liệu của chính phủ Mexico đã bị đánh cắp, bao gồm tài liệu liên quan đến 195 triệu hồ sơ người nộp thuế, hồ sơ cử tri, thông tin đăng nhập của nhân viên chính phủ và các tệp từ cơ quan đăng ký dân sự. Gambit Security cho biết chưa quy trách nhiệm cuộc tấn công cho nhóm cụ thể nào và không tin rằng các đối tượng có liên hệ với chính phủ nước ngoài.

Banner sau bài viết Pickt — ứng dụng danh sách mua sắm cộng tác với hình minh họa gia đình

Theo ông Curtis Simpson, Giám đốc chiến lược của Gambit, AI đã tạo ra hàng nghìn báo cáo chi tiết với kế hoạch sẵn sàng thực thi, hướng dẫn cụ thể mục tiêu nội bộ cần tấn công tiếp theo và thông tin xác thực cần sử dụng. Đáng chú ý, trước đó trong tháng 11, Anthropic từng thông báo đã ngăn chặn một chiến dịch gián điệp mạng được điều phối bởi AI, liên quan đến các hacker bị nghi có hậu thuẫn từ Trung Quốc.

Các vụ xâm nhập tại Mexico được xem là ví dụ mới nhất cho xu hướng tội phạm mạng tận dụng AI để mở rộng quy mô và tăng hiệu quả tấn công. Trong bối cảnh các công ty công nghệ đẩy mạnh phát triển công cụ lập trình dựa trên AI, giới tội phạm và gián điệp mạng cũng đang tìm ra những phương thức mới để khai thác công nghệ này.

Phản hồi từ phía chính phủ Mexico

Phía chính phủ Mexico cho biết đang điều tra các vụ xâm nhập vào nhiều tổ chức công. Tuy nhiên, Viện Bầu cử Quốc gia khẳng định chưa phát hiện truy cập trái phép trong những tháng gần đây và đã tăng cường chiến lược an ninh mạng. Chính quyền bang Jalisco phủ nhận việc hệ thống của bang bị xâm nhập, cho rằng chỉ mạng lưới liên bang bị ảnh hưởng. Một số cơ quan khác chưa đưa ra bình luận chính thức về sự việc này.