A Nvidia anunciou novas infraestruturas e modelos de IA na segunda-feira (01/12), enquanto trabalha para construir a tecnologia backbone para a IA física, incluindo robôs e veículos autônomos que podem perceber e interagir com o mundo real.
A gigante de semicondutores anunciou o Alpamayo-R1, um modelo de linguagem de visão de raciocínio aberto para pesquisa de direção autônoma na conferência NeurIPS AI em San Diego, Califórnia. A empresa afirma que este é o primeiro modelo de ação de linguagem de visão focado na condução autônoma. Modelos de linguagem visual podem processar texto e imagens juntos, permitindo que os veículos “vejam” seu entorno e tomem decisões com base no que percebem.
Este novo modelo é baseado no modelo Cosmos-Reason da Nvidia, um modelo de raciocínio que pensa através de decisões antes de responder. A Nvidia lançou inicialmente a família modelo Cosmos em janeiro de 2025. Modelos adicionais foram lançados em agosto.
Tecnologias como o Alpamayo-R1 são fundamentais para empresas que procuram alcançar a condução autônoma de nível 4, o que significa autonomia total em uma área definida e sob circunstâncias específicas, disse a Nvidia em um post no blog.
A Nvidia espera que esse tipo de modelo de raciocínio dê aos veículos autônomos o “senso comum” para abordar melhor as decisões de direção diferenciadas como os humanos fazem.
Este novo modelo está disponível no GitHub e Hugging Face.
Juntamente com o novo modelo de visão, a Nvidia também enviou novos guias passo a passo, recursos de inferência e fluxos de trabalho pós-treinamento para o GitHub – coletivamente chamado de Cosmos Cookbook – para ajudar os desenvolvedores a usar e treinar melhor os modelos do Cosmos para seus casos de uso específicos. O guia abrange a curadoria de dados, geração de dados sintéticos e avaliação de modelos.
Esses anúncios vêm à medida que a empresa está empurrando a velocidade total para a IA física como um novo caminho para suas GPUs avançadas de IA.
O co-fundador e CEO da Nvidia, Jensen Huang, disse repetidamente que a próxima onda de IA é a IA física. Bill Dally, cientista-chefe da Nvidia, ecoou esse sentimento em uma conversa com o TechCrunch durante o verão, enfatizando a IA física em robótica.
“Eu acho que, eventualmente, os robôs vão ser um grande jogador no mundo e nós queremos basicamente fazer o cérebro de todos os robôs”, disse Dally na época. “Para fazer isso, precisamos começar a desenvolver as principais tecnologias.”
fonte: TECHCRUNCH


