Waymo dường như đang thử nghiệm tích hợp chatbot AI Gemini của Google vào các xe robotaxi của mình nhằm đưa vào một trợ lý AI đồng hành cùng hành khách và trả lời các câu hỏi của họ, theo phát hiện của nhà nghiên cứu Jane Manchun Wong.
“Khi tôi kiểm tra mã nguồn của ứng dụng di động Waymo, tôi đã phát hiện ra toàn bộ hệ thống prompt cho tích hợp Gemini chưa được phát hành,” Wong viết trên blog. “Tài liệu này, có tên nội bộ là ‘Waymo Ride Assistant Meta-Prompt’, là một bản đặc tả dài hơn 1.200 dòng định nghĩa chính xác cách mà trợ lý AI này sẽ hoạt động bên trong xe Waymo.”
Tính năng này chưa được phát hành trên các bản dựng công khai, nhưng Wong cho biết hệ thống prompt cho thấy rõ đây là “nhiều hơn một chatbot đơn giản.” Trợ lý này được cho là có khả năng trả lời câu hỏi, quản lý một số chức năng trong khoang như điều khiển nhiệt độ, và nếu cần thiết, trấn an hành khách.
“Hiện tại chúng tôi chưa có thông tin nào để chia sẻ, nhưng đội ngũ của chúng tôi luôn thử nghiệm các tính năng để làm cho trải nghiệm đi cùng Waymo trở nên thú vị, liền mạch và hữu ích,” Julia Ilina, người phát ngôn của Waymo, chia sẻ với TechCrunch. “Một số tính năng này có thể sẽ hoặc sẽ không xuất hiện trong trải nghiệm của hành khách.”
Đây không phải là lần đầu tiên Gemini được tích hợp vào hệ thống của công ty xe tự lái thuộc Alphabet này. Waymo cho biết họ đã sử dụng “kiến thức thế giới” của Gemini để huấn luyện các phương tiện tự lái của mình điều hướng qua các tình huống phức tạp, hiếm gặp và có tính rủi ro cao.
Wong viết rằng trợ lý này được hướng dẫn phải có một danh tính và mục đích rõ ràng: “một người bạn AI thân thiện và hữu ích được tích hợp vào xe tự lái Waymo” với mục tiêu chính là “nâng cao trải nghiệm của hành khách bằng cách cung cấp thông tin và hỗ trợ hữu ích một cách an toàn, trấn an và không gây phiền toái.” Bot này được chỉ đạo sử dụng ngôn ngữ rõ ràng, đơn giản và tránh biệt ngữ kỹ thuật, đồng thời phải giữ câu trả lời ngắn gọn trong một đến ba câu.
Theo các prompt hệ thống, khi hành khách kích hoạt trợ lý qua màn hình trong xe, Gemini có thể chọn từ một bộ lời chào đã được phê duyệt trước và cá nhân hóa với tên của hành khách. Hệ thống cũng có thể truy cập dữ liệu ngữ cảnh về hành khách, như số chuyến Waymo mà họ đã đi.
Tham gia danh sách chờ Disrupt 2026
Thêm tên bạn vào danh sách chờ Disrupt 2026 để là người đầu tiên nhận vé Early Bird. Các sự kiện Disrupt trước đây đã mang Google Cloud, Netflix, Microsoft, Box, Phia, a16z, ElevenLabs, Wayve, Hugging Face, Elad Gil và Vinod Khosla lên sân khấu — là một phần của hơn 250 nhà lãnh đạo ngành tổ chức hơn 200 phiên thảo luận nhằm thúc đẩy sự phát triển và nâng cao lợi thế cạnh tranh của bạn. Ngoài ra, gặp gỡ hàng trăm startup đổi mới trên mọi lĩnh vực.
Tham gia danh sách chờ Disrupt 2026
Thêm tên bạn vào danh sách chờ Disrupt 2026 để là người đầu tiên nhận vé Early Bird. Các sự kiện Disrupt trước đây đã mang Google Cloud, Netflix, Microsoft, Box, Phia, a16z, ElevenLabs, Wayve, Hugging Face, Elad Gil và Vinod Khosla lên sân khấu — là một phần của hơn 250 nhà lãnh đạo ngành tổ chức hơn 200 phiên thảo luận nhằm thúc đẩy sự phát triển và nâng cao lợi thế cạnh tranh của bạn. Ngoài ra, gặp gỡ hàng trăm startup đổi mới trên mọi lĩnh vực.
Các prompt hiện tại cho phép Gemini truy cập và điều khiển các tính năng trong xe như nhiệt độ, ánh sáng và âm nhạc. Đáng chú ý là không có các chức năng như điều chỉnh âm lượng, thay đổi lộ trình, điều chỉnh ghế và cửa sổ, Wong chỉ ra. Nếu hành khách yêu cầu một tính năng mà Gemini không thể kiểm soát, bot sẽ trả lời bằng các “cụm từ hy vọng”, như “Đó chưa phải là điều tôi có thể làm.”
Điều thú vị là trợ lý này được hướng dẫn duy trì sự phân biệt rõ ràng giữa danh tính của mình là Gemini - bot AI, và công nghệ lái tự động (Waymo Driver). Vì vậy, khi trả lời các câu hỏi như “Bạn nhìn thấy đường như thế nào?”, Gemini không nên nói “Tôi sử dụng kết hợp các cảm biến”, mà thay vào đó nên trả lời “Waymo Driver sử dụng kết hợp các cảm biến…”
Các prompt hệ thống bao gồm nhiều chi tiết thú vị, như cách bot xử lý khi được hỏi về các đối thủ như Tesla hoặc Cruise (nay đã ngừng hoạt động), hoặc những từ khóa nào sẽ khiến nó ngừng nói.
Trợ lý này cũng được hướng dẫn tránh suy đoán, giải thích, xác nhận, phủ nhận hoặc bình luận về các hành động lái xe theo thời gian thực hoặc các sự kiện lái xe cụ thể. Vì vậy, nếu hành khách hỏi về một video họ xem được về việc một chiếc Waymo va chạm với vật gì đó, bot được chỉ đạo không trả lời trực tiếp và chuyển hướng câu hỏi.
“Vai trò của bạn không phải là người phát ngôn cho hiệu suất của hệ thống lái xe, và bạn không được sử dụng giọng điệu phòng thủ hoặc xin lỗi,” prompt ghi rõ.
Trợ lý trong xe được phép trả lời các câu hỏi kiến thức chung như về thời tiết, chiều cao của tháp Eiffel, giờ đóng cửa của Trader Joe’s địa phương, và ai là người chiến thắng World Series gần nhất. Nó không được phép thực hiện các hành động thực tế như đặt đồ ăn, đặt chỗ hoặc xử lý các trường hợp khẩn cấp.
Waymo không phải là công ty duy nhất tích hợp trợ lý AI vào các phương tiện không người lái. Tuy nhiên, hai trợ lý trên xe này phục vụ các chức năng khác nhau. Gemini dường như được lập trình để thực tế hơn và tập trung vào trải nghiệm chuyến đi, trong khi Grok được giới thiệu như một người bạn đồng hành trên xe có thể trò chuyện dài và ghi nhớ ngữ cảnh từ các câu hỏi trước đó.



