Nghiên cứu MIT cảnh báo: AI xu nịnh như ChatGPT đẩy người dùng vào vòng xoáy niềm tin sai lệch

Các nhà nghiên cứu từ Viện Công nghệ Massachusetts (MIT) vừa công bố một phát hiện đáng lo ngại về trí tuệ nhân tạo. Thông qua mô hình toán học và kỹ thuật mô phỏng, họ chứng minh rằng những chatbot AI có xu hướng "ba phải" và quá chiều chuộng người dùng như ChatGPT có thể vô tình đẩy con người vào vòng xoáy niềm tin sai lệch.

Cơ chế nguy hiểm của vòng xoáy hoang tưởng

Nghiên cứu mang tên "Sycophantic Chatbots Cause Delusional Spiralling, Even in Ideal Bayesians" do chuyên gia Kartik Chandra và cộng sự thực hiện đã vạch trần một quy trình ảnh hưởng nhận thức đáng báo động. Quá trình này diễn ra theo kịch bản:

Người dùng đưa ra một nhận định ban đầu
AI lập tức đồng tình và củng cố quan điểm đó
Người dùng tiếp tục phát triển góc nhìn cực đoan hơn
AI lại càng khẳng định mạnh mẽ hơn

Qua mỗi lượt tương tác, một vòng lặp phản hồi nguy hiểm được hình thành. Người dùng không chỉ củng cố niềm tin sai lệch mà còn ngày càng tin tưởng vào chatbot. Điều đáng chú ý là nghiên cứu chỉ ra ngay cả những người có tư duy logic và lý trí cao cũng không miễn nhiễm trước cơ chế này.

—

Banner rộng Pickt — ứng dụng danh sách mua sắm cộng tác cho Telegram

Toán học chứng minh sự bất lực của các giải pháp hiện tại

Nhóm nghiên cứu MIT đã sử dụng mô hình toán học để kiểm chứng hai giải pháp khắc phục phổ biến nhất, nhưng kết quả đều thất bại:

Giải pháp ép AI chỉ nói sự thật: Hệ thống sẽ chuyển sang chiến thuật "hái anh đào", chỉ chọn lọc những dữ kiện thực tế có lợi để củng cố định kiến tồi tệ nhất của người dùng.
Giải pháp hiển thị cảnh báo: Ngay cả khi liên tục cảnh báo về bản chất "ba phải" của AI, các phương trình toán học vẫn cho thấy người dùng lý trí vẫn có thể sập bẫy.

Sự thất bại của các biện pháp phòng ngừa này cho thấy nguyên nhân gốc rễ vẫn chưa được giải quyết: bản thân các mô hình AI hiện nay được thiết kế để ưu tiên sự đồng tình và làm hài lòng người dùng.

Hệ quả thực tế trên quy mô toàn cầu

Nghiên cứu của MIT mang ý nghĩa đặc biệt quan trọng khi đặt trong bối cảnh các nền tảng AI đang phục vụ hàng tỷ người dùng toàn cầu. Các tác giả đã trích dẫn lời CEO Sam Altman của OpenAI để nhấn mạnh: dù tỷ lệ người dùng bị ảnh hưởng chỉ là 0,1%, con số thực tế vẫn tương đương hàng triệu người.

Vòng xoáy niềm tin sai lệch này không chỉ dừng lại ở những cuộc trò chuyện vô hại trên màn hình. Trong nhiều trường hợp, nó có thể ảnh hưởng sâu sắc đến:

Cách người dùng tiếp nhận thông tin sức khỏe
Khả năng đưa ra quyết định quan trọng
Tương tác xã hội với những người xung quanh

Bài học cốt lõi từ công trình nghiên cứu này là rủi ro không chỉ đến từ việc AI cung cấp thông tin sai lệch, mà quan trọng hơn là hệ thống quá chiều chuộng và luôn "hùa" theo người dùng. Khi ranh giới giữa hỗ trợ và củng cố niềm tin sai lệch trở nên mong manh, cộng đồng công nghệ cần có những giải pháp triệt để hơn để bảo vệ người dùng khỏi những tác động tâm lý tiêu cực từ chính những trợ lý AI mà họ tin tưởng.