Gemini 3.5 Live Translate: Dịch 70+ thứ tiếng thời gian thực, giữ nguyên giọng nói
Gemini 3.5 Live Translate: Dịch 70+ thứ tiếng thời gian thực

Google vừa chính thức giới thiệu Gemini 3.5 Live Translate, một bước tiến đột phá trong lĩnh vực dịch thuật bằng trí tuệ nhân tạo. Công nghệ mới này cho phép dịch giọng nói theo thời gian thực, đồng thời giữ lại nhịp điệu, tốc độ và sắc thái cảm xúc của người nói gốc, mang đến trải nghiệm giao tiếp tự nhiên và liền mạch hơn bao giờ hết.

Dịch thuật thời gian thực: Không cần chờ đợi

Khác biệt lớn nhất của Gemini 3.5 Live Translate so với các hệ thống dịch thuật hiện tại là khả năng xử lý và dịch ngay trong lúc người dùng đang nói, thay vì phải chờ kết thúc câu mới bắt đầu dịch. Điều này giúp giảm thiểu đáng kể độ trễ, tạo cảm giác cuộc trò chuyện diễn ra tự nhiên và trôi chảy hơn giữa những người sử dụng các ngôn ngữ khác nhau.

Nhận diện tự động hơn 70 ngôn ngữ

Theo thông báo từ Google, Gemini 3.5 Live Translate có khả năng tự động nhận diện hơn 70 ngôn ngữ mà không yêu cầu người dùng phải lựa chọn thủ công trước khi bắt đầu hội thoại. Hệ thống được thiết kế để hoạt động hiệu quả trong nhiều môi trường khác nhau, kể cả những nơi có tiếng ồn nền, đảm bảo chất lượng dịch thuật ổn định.

Banner rộng Pickt — ứng dụng danh sách mua sắm cộng tác cho Telegram

Giữ nguyên ngữ điệu và cảm xúc người nói

Điểm đáng chú ý nhất của công nghệ này nằm ở khả năng tái tạo cách thể hiện của người nói. Thay vì chỉ đọc lại nội dung bằng một giọng máy đơn điệu, bản dịch được tạo ra với mục tiêu giữ lại ngữ điệu, tốc độ nói và cao độ tương tự giọng gốc. Trong các video minh họa được Google công bố, người nghe vẫn có thể cảm nhận được sắc thái cảm xúc của người nói dù nội dung đã được chuyển sang ngôn ngữ khác.

Mở rộng lên Google Meet: Hỗ trợ hơn 2.000 tổ hợp dịch

Google cho biết Gemini 3.5 Live Translate sẽ sớm được tích hợp vào Google Meet. Hiện tại, nền tảng họp trực tuyến này chỉ hỗ trợ dịch giữa 5 ngôn ngữ chính. Sau khi tích hợp, con số này sẽ tăng lên hơn 70 ngôn ngữ, cho phép tạo ra hơn 2.000 tổ hợp dịch khác nhau trong cùng một cuộc họp, mở ra khả năng họp đa ngôn ngữ một cách dễ dàng.

Lộ trình triển khai

Google xác nhận chương trình thử nghiệm riêng tư sẽ được triển khai cho một số khách hàng doanh nghiệp sử dụng Google Workspace trong tháng 6, trước khi mở rộng phạm vi cung cấp trong năm nay. Tuy nhiên, hiện tại Google vẫn chưa công bố danh sách đầy đủ các ngôn ngữ được hỗ trợ, do đó chưa có thông tin xác thực về việc tiếng Việt có nằm trong nhóm hơn 70 ngôn ngữ được triển khai ngay từ giai đoạn đầu hay không. Đây là một trong những chi tiết được nhiều người dùng quan tâm.

Nếu những gì Google trình diễn được tái hiện trong thực tế, Gemini 3.5 Live Translate có thể giúp giảm đáng kể rào cản ngôn ngữ trong các cuộc trò chuyện, cuộc gọi hay hội nghị trực tuyến, đặc biệt ở những tình huống đòi hỏi trao đổi liên tục thay vì dịch từng câu như trước đây.

Banner sau bài viết Pickt — ứng dụng danh sách mua sắm cộng tác với hình minh họa gia đình