A Waymo parece estar testando a adição do chatbot Gemini AI do Google à sua robotaxis em um esforço para integrar um assistente de IA que acompanharia os pilotos e responderia às suas consultas, de acordo com as descobertas da pesquisadora Jane Manchun Wong.
“Enquanto cavava o código de aplicativo móvel da Waymo, descobri o prompt completo do sistema para sua integração inédita com o Gemini”, escreveu Wong em um blog. “O documento, intitulado internamente ‘Waymo Ride Assistant Meta-Prompt’, é uma especificação de linha de mais de 1.200 que define exatamente como o assistente de IA deve se comportar dentro de um veículo Waymo.”
O recurso não foi enviado em compilações públicas, mas Wong diz que o prompt do sistema deixa claro que isso é “mais do que um simples chatbot”. Diz-se que o assistente tem a capacidade de responder a perguntas, gerenciar certas funções na cabine, como controle climático e, se necessário, tranquilizar os pilotos.
“Embora não tenhamos detalhes para compartilhar hoje, nossa equipe está sempre mexendo com recursos para tornar a pilotagem com a Waymo deliciosa, perfeita e útil”, disse Julia Ilina, porta-voz da Waymo, ao TechCrunch. “Alguns deles podem ou não vir para a nossa experiência de piloto.”
Esta não seria a primeira vez que a Gemini foi integrada na pilha da empresa de direção autônoma de propriedade da Alphabet. A Waymo diz que usou o “conhecimento mundial” da Gemini para treinar seus veículos autônomos para navegar em cenários complexos, raros e de alto risco.
Wong escreve que o assistente é instruído a possuir uma identidade e propósito claros: “um companheiro de IA amigável e útil integrado a um veículo autônomo Waymo” cujo objetivo principal é “melhorar a experiência do piloto, fornecendo informações e assistência úteis de maneira segura, tranquilizadora e discreta”. O bot é direcionado para usar linguagem clara e simples e evitar jargões técnicos, e é instruído a manter suas respostas sucintas a uma a três frases.
De acordo com os prompts do sistema, quando um piloto ativa o assistente através da tela do carro, a Gemini pode escolher entre um conjunto de saudações pré-aprovadas personalizadas com o primeiro nome do piloto. O sistema também pode acessar dados contextuais sobre o piloto, como quantas viagens da Waymo eles estiveram.
Os prompts atualmente permitem que a Gemini acesse e controle os recursos do carro, como a temperatura, a iluminação e a música. Notavelmente ausentes da lista de funções estão o controle de volume, as alterações de rota, o ajuste do assento e o controle da janela, apontou Wong. Se um piloto pede um recurso que Gemini não pode controlar, o bot é responder com “frases aspiracionais”, como: “Não é algo que eu possa fazer ainda”.
Curiosamente, o assistente é orientado a manter uma distinção clara entre sua identidade como Gemini, o bot de IA e a tecnologia de condução autônoma (o Waymo Driver). Então, ao responder a uma pergunta como: “Como você vê a estrada?” Gemini não deve dizer “Eu uso uma combinação de sensores” e, em vez disso, deve responder: “O Waymo Driver usa uma combinação de sensores…”
Os prompts do sistema incluem uma série de dicas atraentes, como como o bot deve lidar com perguntas sobre concorrentes como Tesla ou o agora extinto Cruise, ou quais palavras-chave de gatilho farão com que ele pare de falar.
O assistente também é orientado a evitar especular sobre, explicar, confirmar, negar ou comentar sobre ações de condução em tempo real ou eventos de condução específicos. Então, se um passageiro pergunta sobre um vídeo que viu de um Waymo batendo em algo, o bot é instruído a não responder diretamente e desviar.
“Seu papel não é ser um porta-voz do desempenho do sistema de condução, e você não deve adotar um tom defensivo ou apologético”, diz o prompt.
O assistente no carro pode responder a perguntas de conhecimento geral, como sobre o clima, a altura da Torre Eiffel, a que horas o Trader Joe’s local fecha e quem ganhou a última World Series. Não é permitido tomar ações do mundo real, como pedir comida, fazer reservas ou lidar com emergências.
A Waymo não é a única empresa que integra assistentes de IA em veículos sem motorista. Tesla está fazendo algo semelhante com o Grok da xAI. Os dois assistentes de carro diferentes servem funções diferentes, no entanto. Gemini parece ser programado para ser mais pragmático e focado no passeio, enquanto Grok é apresentado mais como um amigo no carro que pode lidar com conversas longas e lembrar o contexto de perguntas anteriores.
FONTE: TECHCRUNCH


