Vụ lộ source code Claude Code: Bí mật 512.000 dòng và cuộc đua AI coding tool năm 2026
Lộ source code Claude Code: Cuộc đua AI coding tool năm 2026

Vụ lộ source code Claude Code: Bí mật 512.000 dòng và cuộc đua AI coding tool năm 2026

Trong ngành công nghệ, khi một sản phẩm dẫn đầu bị lộ thiết kế nội bộ, đối thủ không vui mừng vì có thể sao chép ngay lập tức, mà vui mừng vì họ cuối cùng hiểu được lý do tại sao mình đang thua cuộc. Ngày 31/3/2026, vụ lộ source code Claude Code đã trao cho Cursor, GitHub Copilot, Google Gemini CLI và toàn bộ thị trường AI coding tool thứ mà họ không thể mua được bằng tiền: 512.000 dòng thiết kế nội bộ của sản phẩm đang dẫn đầu ngành với doanh thu hàng năm lên đến 2,5 tỷ USD.

Câu hỏi thật sự không phải là đối thủ học được gì từ sự cố này. Mà là thứ gì trong 512.000 dòng đó có thể bị sao chép - và thứ gì khiến Anthropic, công ty đứng sau Claude Code, vẫn có thể ngủ ngon mỗi đêm.

Cursor CLI: Đối thủ xứng tầm và bí mật nằm ở "khung" bao quanh AI

Cursor CLI hiện đang là một trong những đối thủ xứng tầm của Claude Code. Tuy nhiên, bí mật của Claude Code không nằm ở AI mà ở "harness" - toàn bộ hệ thống bao quanh mô hình AI. Trước khi đi vào chi tiết những gì bị lộ, cần hiểu một điểm quan trọng mà phần lớn người dùng AI coding tool không biết: Cursor, GitHub Copilot và Claude Code đều sử dụng các mô hình AI có sức mạnh tương đương nhau. Vậy tại sao trải nghiệm lại khác biệt rõ rệt đến vậy?

Banner rộng Pickt — ứng dụng danh sách mua sắm cộng tác cho Telegram

Câu trả lời nằm ở harness, bao gồm cách tool đọc và hiểu codebase, cách nó ghi nhớ những gì đã làm, cách phân chia công việc và kiểm soát quyền truy cập vào máy tính người dùng. Dùng một phép so sánh đơn giản: mô hình AI giống như động cơ xe hơi - tất cả đều mạnh và hoạt động theo nguyên lý tương tự. Harness giống như phần còn lại của chiếc xe - hộp số, hệ thống phanh, vô lăng và hệ thống lái. Mua được động cơ tốt nhất thị trường không đảm bảo chiếc xe sẽ chạy tốt nhất.

Sau khi phân tích toàn bộ 1.902 file bị lộ, nhiều developer đã kết luận độc lập rằng khoảng 40% lợi thế của Claude Code so với đối thủ đến từ harness - không phải từ mô hình AI bên trong. Chính cái 40% đó vừa bị lộ ra ngoài, mở ra cơ hội học hỏi cho các đối thủ.

Ba bài học quan trọng từ source code bị lộ

Phần đáng chú ý nhất trong source code bị lộ không phải là những tính năng ẩn hay thông tin nội bộ, mà là cách Anthropic giải quyết những vấn đề mà toàn ngành đang đau đầu.

Vấn đề đầu tiên: AI "quên" trong phiên làm việc dài. Claude Code giải quyết vấn đề này bằng một hệ thống bộ nhớ 3 lớp: một file index nhẹ chỉ lưu "địa chỉ" của thông tin, các file chủ đề được tải vào khi cần và giải phóng khi không dùng, và lịch sử phiên làm việc chỉ được tìm kiếm theo từ khóa cụ thể. Kết quả là AI luôn biết mình đang làm gì mà không bị "ngợp" bởi quá nhiều thông tin. Đây là thiết kế mà đối thủ có thể học và triển khai trong vài tháng.

Vấn đề thứ hai: Kiểm soát quyền hạn của AI. Source code lộ cho thấy mỗi khả năng của Claude Code - như đọc file, chạy lệnh, tìm kiếm web, chỉnh sửa code - là một "công cụ" độc lập với quyền hạn riêng, và người dùng phải phê duyệt từng quyền một thay vì giao toàn bộ quyền kiểm soát. Đây là lý do Claude Code được đánh giá là an toàn hơn và ít gây ngạc nhiên hơn các đối thủ. Cursor và Copilot cũng có thể áp dụng kiến trúc này để cải thiện bảo mật.

Banner sau bài viết Pickt — ứng dụng danh sách mua sắm cộng tác với hình minh họa gia đình

Vấn đề thứ ba: Multi-agent thực sự. Claude Code có một "AI điều phối" thật sự - một agent chính nhận task lớn, phân chia cho nhiều agent phụ, theo dõi tiến độ và tổng hợp kết quả, giống cách một team leader quản lý nhóm. Đây là kiến trúc phức tạp hơn và sẽ mất nhiều thời gian hơn để sao chép so với các giải pháp hiện tại chỉ gọi AI nhiều lần cùng lúc.

Những thứ không thể sao chép và lý do Anthropic vẫn dẫn đầu

Đọc đến đây, có thể dễ dàng kết luận rằng Claude Code đang gặp rắc rối lớn vì đối thủ giờ biết tất cả bí mật. Nhưng có ba thứ mà 512.000 dòng code không thể tiết lộ.

Thứ nhất là mô hình AI bên trong. Những gì bị lộ là harness - cái khung bao quanh AI. Mô hình thật sự của Claude, thứ tạo ra 60% lợi thế còn lại, không bị lộ và tiêu tốn hàng tỷ USD cùng nhiều năm nghiên cứu để xây dựng. Cursor và Copilot có thể copy toàn bộ harness nhưng vẫn phụ thuộc vào mô hình của họ, vốn không mạnh bằng Claude Opus trên nhiều tác vụ lập trình phức tạp.

Thứ hai là kiến thức từ thất bại. Những thiết kế trong code không phải ngẫu nhiên - chúng là kết quả của 18 tháng thực tế, hàng triệu phiên làm việc và hàng nghìn bug report từ người dùng thật. Code cho biết "làm gì" nhưng không cho biết "đã thử gì rồi thất bại" và "tại sao lại chọn cách này thay vì cách kia". Khoảng cách đó không thể thu hẹp chỉ bằng cách đọc. Như một nhà phân tích kỹ thuật nhận xét: "Bạn có thể copy bản nhạc, nhưng không copy được số năm luyện tập của nhạc sĩ."

Thứ ba là vị trí trên thị trường doanh nghiệp. 80% doanh thu Claude Code đến từ các công ty lớn. Những tổ chức này đã đào tạo đội ngũ, xây dựng workflow và tích hợp tool vào quy trình phát triển phần mềm hàng ngày. Dù Cursor hay Copilot ra mắt tính năng tương đương hoàn toàn vào ngày mai, việc thuyết phục hàng nghìn kỹ sư của một công ty lớn chuyển sang tool khác là bài toán về con người và quy trình, không phải bài toán kỹ thuật.

Câu hỏi cho năm 2026: Ai sẽ là người chiến thắng?

Axios đúng: vụ lộ này sẽ không làm Anthropic chìm. Claude Code vẫn dẫn đầu, vẫn đang phát triển với tốc độ nhanh, và mô hình AI bên trong vẫn là thứ không ai có thể lấy đi. Nhưng vụ lộ đã thay đổi một thứ quan trọng: khoảng cách giữa Claude Code và đối thủ không còn là bí ẩn nữa.

Cursor biết chính xác mình cần xây gì. Copilot biết mình đang thiếu gì. Google Gemini CLI có bản thiết kế để so sánh. Trước ngày 31/3, sự dẫn đầu của Claude Code một phần đến từ việc đối thủ không biết họ đang đi đến đâu. Sau ngày đó, lợi thế đó không còn.

Câu hỏi thật sự không phải là "Cursor có copy được Claude Code không?" - câu trả lời rõ ràng là có, ít nhất là phần harness. Câu hỏi là "Anthropic có duy trì được khoảng cách đó trong khi đối thủ đang rút ngắn với tốc độ nhanh hơn trước không?" Đó là cuộc đua mà năm 2026 sẽ trả lời - và người dùng là người hưởng lợi nhất dù kết quả là gì. Theo Thế Duyệt.