Câu hỏi 'strawberry' và cuộc đua AI: Từ lỗi đếm chữ đến dự án bí mật

Giữa năm 2024, một thử thách nhỏ bắt đầu lan truyền mạnh mẽ trên mạng xã hội: hỏi ChatGPT "có bao nhiêu chữ r trong từ strawberry?" Câu trả lời đúng là 3, nhưng ChatGPT lại nhất quán trả lời sai với con số 2. Không phải một lần nhầm lẫn ngẫu nhiên, mà là lỗi lặp đi lặp lại một cách tự tin, khiến cộng đồng công nghệ châm biếm và đặt ra câu hỏi sâu sắc.

AI không nhìn thấy chữ cái: Bản chất của vấn đề

Vấn đề không nằm ở việc AI "ngu", mà ở cách nó xử lý văn bản. Khác với con người đọc từng chữ cái, các mô hình ngôn ngữ lớn như ChatGPT hoạt động dựa trên tokenization - chia văn bản thành các khối ngôn ngữ lớn hơn. Với GPT-4, từ "strawberry" không phải là 10 chữ cái riêng lẻ, mà được tách thành 3 token: str, aw, và berry. Trong ba khối này, chỉ có str và berry chứa chữ r, dẫn đến AI đếm được 2. Đây là hạn chế kiến trúc cố hữu, không dễ dàng khắc phục bằng bản cập nhật đơn giản, vì AI được thiết kế để hiểu nghĩa hơn là phân tích chính tả chi tiết.

Dự án bí mật 'Strawberry': Lời thách thức nội bộ

Tháng 11/2023, sự kiện Sam Altman bị sa thải khỏi OpenAI gây chấn động, kéo theo tin đồn về dự án AI bí mật tên "Q*". Tám tháng sau, tháng 7/2024, Reuters xác nhận OpenAI đang phát triển model mới với bí danh nội bộ là "Strawberry", chính là Q*. Cái tên này không ngẫu nhiên - nó là tuyên ngôn nội bộ, nhắc nhở đội ngũ xây dựng model có thể làm điều mà các phiên bản trước thất bại: đếm đúng số chữ r trong "strawberry". Khi o1 ra mắt tháng 9/2024, OpenAI thậm chí đưa câu hỏi này vào giao diện như một lời thách thức công khai.

—

Banner rộng Pickt — ứng dụng danh sách mua sắm cộng tác cho Telegram

Giải pháp và sự đánh đổi: Tốc độ vs. độ chính xác

O1 không thay đổi cơ chế tokenization, mà sử dụng kỹ thuật chain-of-thought reasoning (suy luận từng bước), cho phép AI "suy nghĩ thành tiếng" trước khi trả lời. Nó tự nhẩm tách từng chữ cái, đếm từng bước, và kiểm tra lại, cho kết quả đúng là 3. Tuy nhiên, phương pháp này có giá đắt: o1 cần 20-30 giây để trả lời, so với GPT-4o chỉ mất dưới 3 giây, và chi phí API cao hơn đáng kể. OpenAI nhấn mạnh đây là model cho tác vụ phức tạp, không nhằm thay thế các model thông thường.

Diễn biến tiếp theo: Lỗi vẫn tồn tại trong các model mới

Tháng 12/2025, OpenAI ra mắt GPT-5.2, nhưng khi được hỏi câu hỏi cũ, model này vẫn trả lời sai với số 2. GPT-5.x sử dụng tokenization scheme mới tên o200k_harmony, nhưng "strawberry" vẫn bị tách thành str + aw + berry. Chain-of-thought reasoning của o1 không được tích hợp vào dòng GPT-5.x do đánh đổi giữa tốc độ phản hồi và chi phí - người dùng thông thường không muốn chờ 30 giây cho mỗi câu trả lời. Tính đến tháng 4/2026, GPT-5.3 và GPT-5.4 đã khắc phục phần nào, trong khi các model như Claude, Gemini, Grok và Perplexity ít khi sai nhờ tokenization khác.

Ý nghĩa sâu xa: Tên gọi trung thực trong thế giới công nghệ

O1-preview và o1-mini đã ngừng phát triển từ tháng 4/2025, nhưng câu chuyện "Strawberry" vẫn chưa có hồi kết. Điều thú vị nhất không phải là kỹ thuật hay khả năng giải bài toán, mà là cách đội ngũ hàng nghìn kỹ sư và nhà nghiên cứu hàng đầu chọn đặt tên dự án quan trọng theo đúng thứ họ chưa làm được, như một lời nhắc nhở tự đặt ra. Trong ngành công nghệ đầy tính từ hoa mỹ, "Strawberry" là cái tên hiếm gặp trong sự trung thực, phản ánh hành trình không ngừng cải tiến của AI.