
A chinesa Deepseek, criadora do chatbot que está surpreendendo o mundo da tecnologia, está com uma novidade multimodal, capaz de analisar e gerar imagens. Segundo a empresa, o chamado Janus-Pro conseguiu superar o DALL-E 3 da OpenAI em alguns testes. As aplicações abrangem diversas áreas, como criação de conteúdo visual (gerando imagens originais para publicidade, design e jogos, por exemplo), edição de fotos, aplicação de filtros, remoção de objetos, além de análise para extrair informações relevantes das cenas. Esses são outros recursos do Janus-Pro. Essa novidade reforça a posição da Deepseek como um dos principais players do cenário da Inteligência Artificial, impulsionando, é claro, a inovação e desafiando os líderes atuais.
Entendendo o Modelo
Na realidade, são vários modelos, mas o maior deles tem 7 bilhões de parâmetros, considerado de teste pelo seu tamanho, e não foi liberado ainda. Porém, a Deepseek está mostrando que veio para impactar o mercado de IA, mesmo com o último lançamento de sua versão R1 em 20/01.
O Janus-Pro já se mostrou bastante eficiente em gerar imagens, com comparativos onde o modelo superou o DALL-E 3, sendo ultrapassado apenas por outros modelos como Midjourney, Flux e Aurora.

A empresa Deepseek está mostrando que consegue fazer modelos mais eficientes e lucrativos, provando que é possível gastar muito menos e necessitar de menos processamento para chegar a um resultado muito bom — e isso faz toda a diferença. Inclusive, isso provocou a queda da bolsa de valores e, consequentemente, das ações da Nvidia, que perdeu US$ 400 bilhões em um único dia.
Vale salientar que começaram com os modelos Deepseek V1, V2 e V3. O V3, de dezembro do ano passado, foi o primeiro a chamar atenção: um modelo grande que possui 675 bilhões de parâmetros, muito mais do que os 7 bilhões do Janus-Pro. Basicamente, iniciaram o pré-treinamento usando dados variados de texto (em chinês e inglês) e, depois, passaram para uma etapa de fine-tuning (ajuste supervisionado com dados rotulados). Quando o modelo sai do pré-treinamento, ainda está muito básico e não se comunica de forma “palatável e agradável”. Por isso, são aplicadas técnicas de otimização, inserindo perguntas e comparando com respostas desejadas.
O modelo principal é enorme (671 bilhões de parâmetros) e funciona como uma rede de especialistas: dentro dele, há múltiplos “fragmentos” treinados, cada um especializado em uma área do conhecimento. Imagine uma pessoa com múltiplas personalidades: um gênio da matemática, biologia, história, etc. Ao receber uma pergunta, o “cérebro” principal decide qual especialista deve responder, reduzindo o uso de recursos computacionais.
A China não tem os melhores chips, mas aprendeu a usar melhor os recursos escassos. Segundo a empresa, utilizaram apenas US$ 6 milhões para treinar um dos maiores modelos do mercado, superando benchmarks de modelos mais recentes com menos memória e processamento — algo que causou alvoroço no mercado de tecnologia.
Enquanto os Estados Unidos investem pesado em IA (influenciados pelas novas orientações de Donald Trump, ex-presidente do país), a China está expondo as vulnerabilidades de seus oponentes.
Curiosidades
A China publica mais artigos científicos (papers) em IA do que os EUA e o Ocidente combinados.
O modelo oficial já está disponível para acesso público, sustentando sua liderança em pesquisa.
O foco é alcançar maior desempenho com menos custos, uma lição que a China está compartilhando com o mundo.
Com certeza, ainda teremos novidades nesta semana, já que as informações sobre a China continuarão a abalar o mercado. Obrigado por acompanhar mais esta análise conosco!
O Janus PRO já se mostrou bastante eficiente em gerar imagens, com comparativos onde o modelo era superior DALL-E 3, inclusive ultrapassado por outros modelos como Midjourney , Flux e Aurora.
A empresa Deepseek esta mostrando que consegue fazer modelos mais eficentes e lucrativos, provando que é possivel gastar muito menos e necessita de menos processamento para chegar a um resultado muito bom e isso faz toda a diferença, inclusive provocando a queda da bolsa de valores e consequentemente das ações da NVidia, que em um único dia 400 Bilhões de dólares.
Vale salientar que começaram com o modelo Deepseek V1, V2 e V3. O V3, que é de dezembro do ano passado, foi o primeiro que começou a chamar atenção. Então primeiro é um modelo grande modelo grande que possui 675 bilhões de parâmetros, muito mais do que os 7 bilhões do Janus-pro. Basicamente começaram a fazer o pré-treinamento usando muitos dados de textos variados, quer sejam em chinês, quer sejam em inglês, e logo após passaram para uma outra etapa que é uma etapa de fine tuning, um ajuste de maneira supervisionada, com dados rotulados. Quando o modelo sai desse pré-treinamento, ele ainda está muito básico e ele não fala de um jeito “palatável e agradável”, então há algumas técnicas de otimização inserindo perguntas e e e comparando com respostas que gostaríamos.
O modelo principal é bem grande (671 bilhões de parâmetros), porém dentro desse modelo é como se ele possuísse vários experts onde em um único cérebro, uma única inteligência, foram treinados vários fragmentos cada um especializado em uma área do conhecimento. Imagine como uma pessoa com múltiplas personalidades: um gênio da matemática, biologia, história, notícias, são várias personalidades. Quando ele recebe uma pergunta, o “cérebro” acima desse a personalidade geral decide qual area vai responder , ganhando o ganho de uso de menos recusrsos computacionais, entre outros.
A China não tem os melhores chips, porem aprenderam a usar melhor os recursos escassos que segundo eles , utilizaram apenas cerca de 6 Milhões de dólares para fazer o treinamento de ums dos maiores modelos do mercado, superando os benchmarks de seus modelos mais atuais, usando menos recursos, memória e computação, inclusive causando alvoroço em todo o mercado de tecnologia.
Sabe que os Estados Unidos estão investindo bastante pesado em Inteligência Artificial, até por conta das novas orientações do Donald Trump, Presidente do EUA em especial, poré a China esta mostrando pra que veio e expondo as vulnerabilidade de “seus oponentes”
A China é que mais publica paper artigos em Inteligência Artificial acima até do que dos Estados Unidos e mais do que ocidente. Eles estão na frente na pesquisa então não é difícil você pensar que isso se sustenta até porque eles estão com o modelo oficial lançado eles estão dando acesso para as pessoas .
Siga o canal do Santotech no WhatsApp e receba as principais notícias do dia no seu celular