
No final de março, a OpenAI anunciou sua intenção de lançar seu primeiro modelo de linguagem “aberta” desde o GPT-2 ainda este ano. Agora, detalhes sobre esse modelo estão começando a surgir a partir das sessões da empresa com a comunidade de desenvolvedores de IA.
Fontes informaram que Aidan Clark, vice-presidente de pesquisa da OpenAI, está liderando o desenvolvimento do modelo aberto, que está em estágios iniciais. A OpenAI tem como meta o lançamento no início do verão e pretende tornar o modelo — um modelo de raciocínio nos moldes dos modelos da série O da OpenAI — o melhor entre os modelos de raciocínio aberto.
A OpenAI está explorando uma licença altamente permissiva para o modelo, com poucas restrições comerciais ou de uso, segundo fontes do Santo Tech. Modelos abertos como o Llama e o Gemma, do Google, têm sido criticados por alguns membros da comunidade por imporem requisitos onerosos — críticas que a OpenAI aparentemente busca evitar.
A OpenAI enfrenta pressão crescente de rivais como o laboratório chinês de IA DeepSeek, que adotou uma abordagem aberta para o lançamento de modelos. Em contraste com a estratégia da OpenAI, esses concorrentes “abertos” disponibilizam seus modelos à comunidade de IA para experimentação e, em alguns casos, comercialização.
Provou ser uma estratégia extremamente bem-sucedida para algumas empresas. A Meta, que investiu pesadamente em sua família Llama de modelos de IA aberta, afirmou no início de março que o Llama havia acumulado mais de 1 bilhão de downloads . Enquanto isso, o DeepSeek rapidamente conquistou uma grande base de usuários em todo o mundo e atraiu a atenção de investidores nacionais .
A OpenAI pretende que seu modelo aberto, que será “texto de entrada, texto de saída”, seja executado em hardware de consumo de ponta e possivelmente permita que os desenvolvedores ativem e desativem seu “raciocínio”, semelhante aos modelos de raciocínio lançados recentemente pela Anthropic e outras empresas. (O raciocínio pode melhorar a precisão, mas ao custo de maior latência.) Se o lançamento for bem recebido, a OpenAI poderá lançar modelos adicionais — potencialmente incluindo modelos menores.
Em comentários públicos anteriores , o CEO da OpenAI, Sam Altman, disse que acredita que a OpenAI está do lado errado da história quando se trata de tornar suas tecnologias de código aberto.
“[Eu pessoalmente acho que precisamos] descobrir uma estratégia diferente para o código aberto”, disse Altman durante uma sessão de perguntas e respostas no Reddit em janeiro. “Nem todos na OpenAI compartilham dessa visão, e também não é nossa maior prioridade no momento… Produziremos modelos melhores [no futuro], mas manteremos uma liderança menor do que nos anos anteriores.”
Altman também afirmou que o próximo modelo aberto da OpenAI passará por um processo de red-team e será avaliado quanto à segurança. Fontes informaram ao que a empresa pretende lançar um cartão de modelo para o modelo — um relatório técnico completo mostrando os resultados dos benchmarks e testes de segurança internos e externos da OpenAI.
“Antes do lançamento, avaliaremos este modelo de acordo com nossa estrutura de preparação, como faríamos com qualquer outro modelo”, disse Altman em uma publicação no X no mês passado . “E faremos um trabalho extra, já que sabemos que este modelo será modificado após o lançamento.”
A OpenAI despertou a ira de alguns especialistas em ética da IA por supostamente apressar os testes de segurança de modelos recentes e não liberar cartões de modelo para outros . Altman também é acusado de enganar executivos da OpenAI sobre análises de segurança de modelos antes de sua breve demissão em novembro de 2023.
fonte: Techcrunch
