Cresce a expectativa para o lançamento do GPT-5, novo grande modelo de linguagem (LLM) da OpenAI. Desde maio, a companhia comandada por Sam Altman prepara a nova tecnologia, mais uma vez com o foco de dar mais um passo em direção à hipotética Inteligência Artificial Geral (AGI, na sigla em inglês).
Evolução direta do GPT-4o, o GPT-5 deve trazer capacidades de compreensão e respostas bem mais robustas e mais ágeis. O novo modelo deve ter uma base de dados mais ampla, ser menos propenso a alucinações e gerar resultados ainda mais precisos diante das descrições dos usuários.
Leia também: OpenAI revela SearchGPT, um buscador com IA para desbancar o Google
Uma das melhorias diretas do GPT-5 deve ser a maior janela de contexto — isto é, o tamanho da entrada de solicitações. Espera-se que a nova versão seja capaz de receber prompts ainda maiores, assim possibilitando interações mais complexas e específicas.
Com uma maior janela de contexto, o GPT-5 poderia compreender blocos de textos maiores de uma vez só. Isso dá espaço para pedir resumos e revisões de documentos mais extensos, ou até de livros inteiros, por exemplo.
Também são esperados aprimoramentos significativos nas capacidades multimodais do GPT-5. O modelo deve ser mais eficiente para compreender áudio, vídeos e fotos para produzir respostas.
Contudo, há quem acredite que a evolução não será tão evidente assim. Jake Heller, CEO e cofundador da Casetext, que desenvolve um assistente virtual jurídico que utiliza o GPT-4, disse que não acha que os avanços do GPT-5 não serão tão perceptíveis.
Ele conta que a evolução do GPT-3 para o GPT-4 foi significativa, como se a IA evoluísse das capacidades de alguém apenas com escola primária para graduação — portanto, significativo e perceptível. Para o GPT-5, Heller espera que o modelo atinja ao nível de PhD, então vai ser melhor, mas não necessariamente bombástico.
IA mais autônoma e útil
Uma das esperanças de Heller é de que o GPT-5 esteja mais preparado para lidar com a sucessão de ações, isto é, consiga completar tarefas que envolvem múltiplas etapas complexas, mas sem se perder pelo caminho. A partir disso, os prompts poderiam ser mais robustos, ao mesmo tempo que o modelo conseguiria passar por cada estágio da solicitação, tal como um humano faria.
“Atualmente, eu diria que os modelos não são tão espertos”, pontuou Heller. “Você percebe que eles ficam presos ou que desviam e acabam na direção errada”, continuou.
Também existe a preocupação de que os avanços do modelo de próxima geração da OpenAI não justifiquem o preço cobrado para operá-lo. “Eu não quero fazer um investimento a não ser que eu me sinta muito confortável de que a parte financeira fará sentido”, pontuou Hooman Radfar, CEO da Collective, plataforma de IA para empreendedores autônomos.
O custo para implementar e manter grandes modelos de linguagem em aplicações é alto, e atualmente o GPT-4 atende uma infinidade de plataformas e serviços. Nessa briga, também entram em questão o preço de soluções concorrentes, tais como modelos da Meta ou o Gemini, do Google.