Close Menu
    Facebook X (Twitter) Instagram
    Facebook X (Twitter) Instagram YouTube TikTok
    SantoTechSantoTech
    PODCAST
    • Início
      • Notícias
    • Colunistas
    • Editais
    • Startups
    • Eventos
    • Dicas
    • Vagas e jobs
    • Vídeos
    SantoTechSantoTech
    Home»Destaques»Nvidia desenvolve IA para raciocinar em vídeos de uma hora de duração

    Nvidia desenvolve IA para raciocinar em vídeos de uma hora de duração

    Destaques 14/07/2025Redação SantotechPor Redação SantotechAtualizado em: 14/07/20253 minutos de leitura
    Fonte: Nvidia
    Fonte: Nvidia

    🔍 Em uma frase

    Pesquisadores desenvolveram uma estrutura que permite que modelos de IA executem raciocínio em vídeos de uma hora de duração, combinando um grande conjunto de dados anotados, um pipeline de treinamento de dois estágios e um método de computação paralela eficiente.

    📌 Por que isso é importante

    A maioria dos sistemas de IA tem dificuldade para processar e raciocinar sobre vídeos longos devido a conjuntos de dados limitados, altos requisitos de memória e dificuldade em rastrear eventos espalhados ao longo do tempo. Isso limita aplicações em áreas como robótica, sistemas autônomos e análise esportiva, onde a compreensão de sequências extensas é essencial.

    🧠 A Ideia Central

    O sistema proposto apresenta uma solução completa para raciocínio em vídeos longos. Inclui o LongVideo-Reason, um conjunto de dados com 52.000 pares de perguntas e respostas anotados com etapas de raciocínio em áreas como esportes, vlogs e jogos. O treinamento ocorre em duas fases: aprendizagem por cadeia de pensamento seguida por aprendizagem por reforço (AR), que ajuda a refinar as respostas por meio de feedback.

    Para gerenciar as demandas computacionais do processamento de vídeos longos, os pesquisadores introduziram o Paralelismo de Sequência de Reforço Multimodal (MR-SP), um método que processa segmentos de vídeo em paralelo e armazena em cache os resultados intermediários para reduzir a computação redundante.

    📊 Resultados notáveis

    • Melhor raciocínio em vídeos longos: O modelo LongVILA-R1-7B atingiu 67,9% de precisão no LongVideo-Reason, superando modelos de código aberto como o Video-R1-7B (62,7%) e ultrapassando o GPT-4o em algumas áreas.
    • Adapta-se à duração do vídeo: diferentemente de outros modelos, seu desempenho é melhor à medida que mais quadros são adicionados.
    • O treinamento é 2,1× mais rápido: o MR-SP acelerou o treinamento RL em 2,1× e permitiu que vídeos de uma hora (3.600 quadros) fossem executados em um único nó de 8 GPUs sem problemas de memória.

    💡 Quais são as aplicações potenciais?

    • Robótica e sistemas autônomos: permite rastreamento e raciocínio em tarefas de várias etapas e movimentação de objetos em longo prazo.
    • Análise de esportes e jogos: permite análise completa da partida para táticas, avaliação de jogadores e previsões.
    • Educação e mídia: oferece suporte a resumos e respostas a perguntas em conteúdo de vídeo longo, como palestras e filmes.

    ⚠️ Limitações e Considerações

    Embora o sistema seja escalável para milhares de quadros, vídeos do mundo real podem ser mais longos e complexos. A definição de “raciocínio” também permanece aberta à interpretação, exigindo maior refinamento.

    Fonte: TECH IN ASIA, Nvidia, MIT, HKU, UC Berkeley | Artigo completo: http://arxiv.org/abs/2507.07966v1 |

    Link para o canal de noticias no whatsappp

    IA Inovacao NVIDIA
    Compartilhar. Facebook Twitter Pinterest LinkedIn Email Telegram WhatsApp Copiar link
    Redação Santotech
    • Website

    Notícias relacionadas

    11/03/2026

    GTA 6 Vai Escapar? O AAA em Crise e a Ascensão do Triple I

    11/03/2026

    Farol Digital firma parceria com Banco do Nordeste e fortalece ecossistema de inovação na Grande João Pessoa

    10/03/2026

    CERTI apoia a estruturação de parque de inovação que impulsiona startups na fronteira Brasil-Paraguai 

    Siga nas redes
    • Facebook
    • Twitter
    • Instagram
    • YouTube
    • TikTok
    gobeejobs banner 300x250 santotech
    Em Destaque

    Farol Digital firma parceria com Banco do Nordeste e fortalece ecossistema de inovação na Grande João Pessoa

    Caitlin Kalinowski, líder da área de robótica da OpenAI, renuncia ao cargo em resposta a um acordo com o Pentágono

    Brasil estuda linhão de R$ 17 bilhões para evitar desperdício de energia eólica e solar

    Farol Digital coloca João Pessoa entre os três principais ecossistemas de inovação do Brasil

    Sobre nós
    Sobre nós

    Somos o portal de tecnologia que conecta o ecossistema inovador do Nordeste ao Brasil e ao mundo.

    Fale Conosco: [email protected]
    Redação: +55 83 987931523

    Facebook X (Twitter) Instagram YouTube TikTok
    Últimas Noticias

    GTA 6 Vai Escapar? O AAA em Crise e a Ascensão do Triple I

    Farol Digital firma parceria com Banco do Nordeste e fortalece ecossistema de inovação na Grande João Pessoa

    CERTI apoia a estruturação de parque de inovação que impulsiona startups na fronteira Brasil-Paraguai 

    coloque sua marca aqui 300x250
    © 2026 Santo Tech. por NIBWOZ.
    • Início
    • Colunistas
    • Editais
    • Startups
    • Eventos
    • Dicas
    • Vagas e jobs

    Digite o que busca acima e tecle Enter para procurar ou tecle Esc para cancelar.