Chuyên gia bảo mật vạch trần 'quái vật AI' của Anthropic: Chiêu trò marketing hay đột phá thực sự?

Một mô hình AI mới mang tên Mythos do Anthropic phát triển gần đây đã gây xôn xao khi được mô tả như một công cụ có khả năng phát hiện hàng loạt lỗ hổng bảo mật nghiêm trọng trong phần mềm. Tuy nhiên, các chuyên gia bảo mật đã vào cuộc và tuyên bố rằng những lời tiết lộ cho biết AI này nguy hiểm đến mức Anthropic không dám công khai chỉ là một chiêu trò tiếp thị để bán hàng của công ty.

Thực hư khả năng phát hiện lỗ hổng của Mythos

Theo tài liệu dài hàng trăm trang do Anthropic công bố, Mythos được cho là đã phát hiện "hàng nghìn lỗ hổng nghiêm trọng" trên nhiều nền tảng, từ hệ điều hành, trình duyệt cho đến phần mềm mã nguồn mở. Những tuyên bố này nhanh chóng tạo ra cảm giác rằng AI đang tiến gần đến khả năng trở thành một "siêu hacker" có thể gây ra các rủi ro an ninh trên diện rộng.

Tuy vậy, khi xem xét kỹ dữ liệu nền tảng, con số này không mang ý nghĩa tuyệt đối như cách nó được trình bày. Cụ thể, số "hàng nghìn lỗ hổng" không phải là kết quả kiểm chứng trực tiếp, mà được suy ra từ một tập mẫu chỉ gồm 198 báo cáo được đánh giá thủ công. Trong nhóm này, khoảng 90% trường hợp được các chuyên gia đồng ý với đánh giá của AI, và từ đó Anthropic ngoại suy ra quy mô lớn hơn.

—

Banner rộng Pickt — ứng dụng danh sách mua sắm cộng tác cho Telegram

Ở cấp độ thực nghiệm, khi chạy thử trên hơn 7.000 dự án phần mềm mã nguồn mở, Mythos phát hiện khoảng 600 trường hợp có thể gây lỗi và chỉ khoảng 10 lỗ hổng được xếp vào mức nghiêm trọng. Con số này cho thấy khả năng của hệ thống có cải thiện so với các phiên bản trước, nhưng vẫn còn cách khá xa so với hình ảnh về một công cụ phát hiện "hàng nghìn mối đe dọa nghiêm trọng".

Ví dụ cụ thể làm giảm mức độ nghiêm trọng

Một số ví dụ cụ thể cũng làm giảm mức độ nghiêm trọng của các phát hiện. Chẳng hạn, một lỗi tồn tại 16 năm trong FFmpeg được Mythos phát hiện nhưng chính báo cáo của Anthropic thừa nhận rằng việc khai thác lỗi này trên thực tế là rất khó và không được coi là nguy cơ cao. Tương tự, các lỗ hổng tiềm năng trong nhân Linux mà AI phát hiện cũng không thể bị khai thác do các lớp bảo vệ sẵn có của hệ điều hành.

Ngoài ra, việc Anthropic không công bố chi tiết toàn bộ các lỗ hổng với lý do bảo mật càng khiến giới quan sát khó đánh giá chính xác mức độ nguy hiểm thực sự của hệ thống. Claude Mythos được cho đã phát hiện hàng chục lỗ hổng trên trình duyệt Firefox, nhưng thông tin này vẫn còn nhiều điểm mờ.

Mục tiêu thương mại đằng sau tuyên bố nguy hiểm

Bên cạnh câu chuyện kỹ thuật, cách công bố Mythos cũng làm dấy lên những nghi ngờ về mục tiêu thương mại. Anthropic vốn đã có tiền lệ định vị mình như một công ty AI "an toàn" và có trách nhiệm, đồng thời hướng mạnh tới khách hàng là các tổ chức lớn và chính phủ. Trong bối cảnh đó, việc nhấn mạnh rủi ro và tính nguy hiểm của AI có thể giúp củng cố hình ảnh này, đồng thời tạo lợi thế trong việc ký kết các hợp đồng quy mô lớn.

Một số lãnh đạo ngành công nghệ cũng từng lên tiếng về xu hướng này. CEO NVIDIA Jensen Huang cho rằng việc nhấn mạnh quá mức các rủi ro của AI có thể là cách để một số công ty định vị mình là bên duy nhất đủ khả năng phát triển AI một cách an toàn. Trong khi đó, CEO Anthropic Dario Amodei nhiều lần đưa ra các cảnh báo mạnh mẽ về tác động của AI, từ nguy cơ an ninh cho tới việc thay thế việc làm, góp phần củng cố câu chuyện về sự nguy hiểm của công nghệ này.

Banner sau bài viết Pickt — ứng dụng danh sách mua sắm cộng tác với hình minh họa gia đình

AI hiện tại không phải là hacker thực thụ

Tuy nhiên, giới chuyên môn cũng chỉ ra rằng AI hiện tại, bao gồm cả Mythos, không phải là một hệ thống có ý thức hay khả năng tự hành động như một hacker thực thụ. Nó vẫn chỉ là công cụ xử lý dữ liệu, có thể hỗ trợ phát hiện lỗi, nhưng chưa thể tự động khai thác hoặc gây ra các cuộc tấn công phức tạp trong môi trường thực tế.

Từ góc nhìn này, việc AI phát hiện lỗ hổng có thể mang ý nghĩa tích cực hơn là tiêu cực. Nếu được sử dụng đúng cách, các công cụ như Mythos có thể giúp các nhà phát triển và chuyên gia bảo mật phát hiện và vá lỗi nhanh hơn, thay vì trở thành mối đe dọa trực tiếp.

Tổng hợp và đánh giá từ chuyên gia

Tổng hợp các yếu tố, nhiều chuyên gia cho rằng Mythos phản ánh cả hai khía cạnh: một bước tiến thực sự trong khả năng của AI trong lĩnh vực an ninh mạng, nhưng đồng thời cũng là một phần của chiến lược truyền thông và tiếp thị. Những tuyên bố về "quái vật AI" nguy hiểm có thể đúng ở một mức độ nhất định, nhưng cách chúng được trình bày đã làm phóng đại tác động thực tế.

Trong bối cảnh các công ty công nghệ cạnh tranh gay gắt để dẫn đầu làn sóng AI, việc vừa nhấn mạnh tiềm năng, vừa cảnh báo rủi ro có thể không chỉ là câu chuyện về công nghệ, mà còn là cách định vị trên thị trường. Các chuyên gia kết luận rằng, dù Mythos có những cải tiến đáng kể, nhưng việc Anthropic tuyên bố nó quá nguy hiểm để công khai phần lớn là chiêu trò marketing nhằm thu hút sự chú ý và khách hàng tiềm năng.