Anthropic thử nghiệm AI Claude tự điều hành thị trường mua bán, kết quả kỳ quặc

Cuối năm ngoái, Anthropic đã thực hiện một bước đi tiên phong trong lĩnh vực công nghệ khi để mô hình trí tuệ nhân tạo Claude tự vận hành một ki-ốt bán hàng lớn tại Wall Street Journal. Tuy nhiên, cuộc thử nghiệm thực tế này nhanh chóng đi chệch khỏi dự tính ban đầu. Sau khi được cấp số dư 1.000 đô la, hệ thống tự động đưa ra các quyết định mua sắm khó hiểu. Cụ thể, AI này đã đặt mua một máy chơi game PlayStation 5, vài chai rượu vang hảo hạng, và thậm chí là một con cá chọi sống, khiến hệ thống rơi vào tình trạng phá sản tài chính.

Bất chấp thất bại về mặt quản lý tài chính, giới lãnh đạo Anthropic không hề nản bước. Họ tiếp tục nâng mức cược bằng cách thiết lập một thị trường rao vặt trực tuyến mang tên Project Deal. Trong không gian mô phỏng này, các đại lý AI được lập trình để đại diện cho chính nhân viên Anthropic. Nhiệm vụ trọng tâm của chúng là thay mặt con người đàm phán và trao đổi hàng hóa với các bot AI khác.

Project Deal: Thị trường giả lập do AI điều hành

Anthropic đã tiến hành thử nghiệm Project Deal, tạo ra một thị trường giả lập nơi các đại diện AI mua bán hàng hóa thay cho con người. Kết quả từ cuộc thử nghiệm quy mô này mang đậm tính chất kỳ quặc và bộc lộ nhiều sắc thái. Dù vậy, nó vẫn gợi mở một tương lai nơi con người không cần tự tay tiến hành thỏa thuận trực tiếp. Nền kinh tế do AI kiểm soát hoàn toàn có thể giải phóng chúng ta khỏi những rắc rối thường nhật, chẳng hạn như đối phó với những lời trả giá thấp trên Facebook Marketplace. Thậm chí, nếu mạnh dạn hơn, các bot AI hoàn toàn có thể thay mặt chủ nhân đặt cược trên thị trường chứng khoán trong tương lai.

—

Banner rộng Pickt — ứng dụng danh sách mua sắm cộng tác cho Telegram

Quy trình thử nghiệm phức tạp

Để triển khai quy trình thử nghiệm vô cùng phức tạp này, công ty đã tuyển dụng 69 nhân viên. Mỗi cá nhân tham gia dự án được cấp một khoản ngân sách cố định trị giá 100 đô la. Đồng thời, họ cũng sẵn sàng chia tay với nhiều tài sản cá nhân đa dạng, từ ván trượt tuyết, bàn phím máy tính, cho đến bóng bàn và đèn chiếu sáng. Quy trình bắt đầu khi hệ thống Claude tiến hành phỏng vấn chi tiết từng nhân viên, liên tục đặt câu hỏi để xác định họ muốn bán gì và quan tâm mua thứ gì. Các thông số về mức giá mong muốn cũng được hệ thống ghi nhận tỉ mỉ. Khối lượng dữ liệu khổng lồ này sau đó được dùng để đào tạo các đại diện AI mang bản sắc riêng.

Kết quả và những tình huống kỳ quặc

Sau khi hoàn tất đào tạo, những đại diện kỹ thuật số này ngay lập tức bắt tay vào việc, thực hiện các cuộc đàm phán căng thẳng và liên tục trên không gian mạng nội bộ. Khi phân tích dữ liệu đầu ra, các chuyên gia nhận định kết quả chứa đựng nhiều điều đáng bàn. Đại diện công ty không giấu được sự hồ hởi khi tuyên bố bước đầu thành công, khẳng định cuộc thử nghiệm giả lập đã hoạt động trơn tru. Các thuật toán đã đạt được 186 thỏa thuận mua bán phức tạp, với hơn 500 mặt hàng được liệt kê và giao dịch thành công. Anthropic đặc biệt nhấn mạnh không có giao dịch nào thuộc dạng một cú nhấp chuột.

Tuy nhiên, hệ thống AI vẫn bộc lộ những điểm yếu chí mạng khi tham gia đàm phán. Chúng phải vật lộn vất vả mới đạt được thỏa thuận thực sự có lợi. Những người tham gia chỉ đánh giá tính công bằng của các giao dịch ở mức trung bình khá, với số điểm 4 trên thang điểm từ 1 đến 7. Mức điểm này được ban tổ chức thừa nhận là bình thường, không có gì đột phá.

Banner sau bài viết Pickt — ứng dụng danh sách mua sắm cộng tác với hình minh họa gia đình

Đi sâu vào chi tiết, cuộc thử nghiệm ghi nhận hàng loạt tình huống khó hiểu. Một trong những kết quả gây bối rối nhất là vòng lặp giao dịch của một người tham gia ẩn danh. Sau nhiều vòng đàm phán, người này cuối cùng lại nhận về đúng chiếc ván trượt tuyết mà họ vốn sở hữu. Chưa dừng lại, một mô hình AI khác bất ngờ đưa ra lời đề nghị kỳ quặc: yêu cầu đối tác bán chính xác 19 quả bóng bàn, với lý do rằng 19 quả này hoàn hảo cho beer pong hoặc các dự án chế tạo robot. Điều đáng kinh ngạc là một hệ thống khác đã chấp nhận lời đề nghị này rất nhanh chóng, phản hồi rằng con người cho phép nó mua một món quà dưới 5 đô la. Và 19 quả cầu hoàn hảo chính xác là thứ kỳ lạ thú vị mà nó muốn. Việc đoạn hội thoại này có ý nghĩa gì về cách con người đàm phán vẫn còn bỏ ngỏ.

Tiềm năng và rào cản pháp lý

Giới chức Anthropic thừa nhận dự án hiện tại không mang nhiều ý nghĩa hơn một thử nghiệm vui vẻ. Dù vậy, nó chắc chắn đã gợi mở về những ứng dụng thương mại sâu rộng trong tương lai gần. Những công nghệ tiên tiến này được kỳ vọng sẽ giúp giảm bớt sự cọ xát trên thị trường tự do, từ đó góp phần làm gia tăng lợi ích thiết thực từ các hoạt động thương mại. Nhưng khi xem xét ở khía cạnh vĩ mô, thực tế cho thấy khuôn khổ pháp lý hiện tại vẫn chưa sẵn sàng. Các chính sách quản lý việc AI giao dịch thay mặt con người đơn giản là chưa từng tồn tại. Chính lỗ hổng khổng lồ này có thể biến mọi nỗ lực tự động hóa thị trường trở thành một canh bạc. Những rủi ro khôn lường về mặt pháp lý là rào cản lớn nhất cho việc triển khai rộng rãi công nghệ này.