Close Menu
    Facebook X (Twitter) Instagram
    Facebook X (Twitter) Instagram YouTube TikTok
    SantoTechSantoTech
    PODCAST
    • Início
      • Notícias
    • Colunistas
    • Editais
    • Startups
    • Eventos
    • Dicas
    • Vagas e jobs
    SantoTechSantoTech
    Home»Destaques»Nvidia desenvolve IA para raciocinar em vídeos de uma hora de duração

    Nvidia desenvolve IA para raciocinar em vídeos de uma hora de duração

    Destaques 14/07/2025Redação SantotechPor Redação SantotechAtualizado em: 14/07/20253 minutos de leitura
    Fonte: Nvidia
    Fonte: Nvidia
    ads

    🔍 Em uma frase

    Pesquisadores desenvolveram uma estrutura que permite que modelos de IA executem raciocínio em vídeos de uma hora de duração, combinando um grande conjunto de dados anotados, um pipeline de treinamento de dois estágios e um método de computação paralela eficiente.

    📌 Por que isso é importante

    A maioria dos sistemas de IA tem dificuldade para processar e raciocinar sobre vídeos longos devido a conjuntos de dados limitados, altos requisitos de memória e dificuldade em rastrear eventos espalhados ao longo do tempo. Isso limita aplicações em áreas como robótica, sistemas autônomos e análise esportiva, onde a compreensão de sequências extensas é essencial.

    🧠 A Ideia Central

    O sistema proposto apresenta uma solução completa para raciocínio em vídeos longos. Inclui o LongVideo-Reason, um conjunto de dados com 52.000 pares de perguntas e respostas anotados com etapas de raciocínio em áreas como esportes, vlogs e jogos. O treinamento ocorre em duas fases: aprendizagem por cadeia de pensamento seguida por aprendizagem por reforço (AR), que ajuda a refinar as respostas por meio de feedback.

    Para gerenciar as demandas computacionais do processamento de vídeos longos, os pesquisadores introduziram o Paralelismo de Sequência de Reforço Multimodal (MR-SP), um método que processa segmentos de vídeo em paralelo e armazena em cache os resultados intermediários para reduzir a computação redundante.

    📊 Resultados notáveis

    • Melhor raciocínio em vídeos longos: O modelo LongVILA-R1-7B atingiu 67,9% de precisão no LongVideo-Reason, superando modelos de código aberto como o Video-R1-7B (62,7%) e ultrapassando o GPT-4o em algumas áreas.
    • Adapta-se à duração do vídeo: diferentemente de outros modelos, seu desempenho é melhor à medida que mais quadros são adicionados.
    • O treinamento é 2,1× mais rápido: o MR-SP acelerou o treinamento RL em 2,1× e permitiu que vídeos de uma hora (3.600 quadros) fossem executados em um único nó de 8 GPUs sem problemas de memória.

    💡 Quais são as aplicações potenciais?

    • Robótica e sistemas autônomos: permite rastreamento e raciocínio em tarefas de várias etapas e movimentação de objetos em longo prazo.
    • Análise de esportes e jogos: permite análise completa da partida para táticas, avaliação de jogadores e previsões.
    • Educação e mídia: oferece suporte a resumos e respostas a perguntas em conteúdo de vídeo longo, como palestras e filmes.

    ⚠️ Limitações e Considerações

    Embora o sistema seja escalável para milhares de quadros, vídeos do mundo real podem ser mais longos e complexos. A definição de “raciocínio” também permanece aberta à interpretação, exigindo maior refinamento.

    Fonte: TECH IN ASIA, Nvidia, MIT, HKU, UC Berkeley | Artigo completo: http://arxiv.org/abs/2507.07966v1 |

    IA Inovacao NVIDIA
    Compartilhar. Facebook Twitter Pinterest LinkedIn Email Telegram WhatsApp Copiar link
    Redação Santotech
    • Website

    ads

    Notícias relacionadas

    14/07/2025

    Após o YouTube, a Meta anuncia repressão ao conteúdo “não original” do Facebook

    14/07/2025

    Chaves vazadas abrem RCE em aplicativos Laravel

    14/07/2025

    Abertas inscrições para Fórum Celso Furtado: evento reúne grandes nomes do pensamento crítico sobre justiça e desenvolvimento

    Siga nas redes
    • Facebook
    • Twitter
    • Instagram
    • YouTube
    • TikTok
    coloque sua marca aqui 300x250
    Em Destaque

    Após o YouTube, a Meta anuncia repressão ao conteúdo “não original” do Facebook

    Abertas inscrições para Fórum Celso Furtado: evento reúne grandes nomes do pensamento crítico sobre justiça e desenvolvimento

    Nvidia desenvolve IA para raciocinar em vídeos de uma hora de duração

    Estudo mostra que ferramentas de codificação de IA podem não acelerar todos os desenvolvedores

    Sobre nós
    Sobre nós

    Somos um portal de tecnologia desenvolvido com o propósito de mostrar a nossa tecnologia para
    Nosso estado, região, pais e Mundo.

    Fale Conosco: [email protected]
    Redação: +55 83 987931523

    Facebook X (Twitter) Instagram YouTube TikTok
    Últimas Noticias

    Após o YouTube, a Meta anuncia repressão ao conteúdo “não original” do Facebook

    Chaves vazadas abrem RCE em aplicativos Laravel

    Abertas inscrições para Fórum Celso Furtado: evento reúne grandes nomes do pensamento crítico sobre justiça e desenvolvimento

    coloque sua marca aqui 300x250
    © 2025 Santo Tech. por NIBWOZ.
    • Início
    • Colunistas
    • Editais
    • Startups
    • Eventos
    • Dicas
    • Vagas e jobs

    Digite o que busca acima e tecle Enter para procurar ou tecle Esc para cancelar.