OpenAI lança o GPT-4o, que consegue interagir com o usuário através de áudio e vídeo

OpenAI lança o GPT-4o, que consegue interagir com o usuário através de áudio e vídeo

A OpenAI lançou uma evolução significativa do ChatGPT: o GPT-4o, onde o ‘o’ simboliza ‘omni’.

Esta nova iteração da IA da OpenAI foi revelada um dia antes da conferência de desenvolvedores do Google.

Com o objetivo de manter sua posição líder em um mercado cada vez mais competitivo, a OpenAI apresenta uma versão aprimorada e mais acessível do modelo de inteligência artificial que sustenta seu chatbot, o ChatGPT.

Durante um evento transmitido ao vivo na segunda-feira (13), a OpenAI apresentou o GPT-4o, uma atualização do seu modelo GPT-4 com mais de um ano de idade.

Este novo modelo de linguagem (LLM) foi treinado com vastos conjuntos de dados da internet e promete uma melhor capacidade de lidar com texto, áudio e vídeo em tempo real.

As atualizações estarão disponíveis em breve.

A principal melhoria está na capacidade de resposta, permitindo uma interação mais fluída.

Agora é possível fazer uma pergunta e receber uma resposta de áudio em milissegundos, bem como obter respostas baseadas em imagens.

Mira Murati, diretora de tecnologia da OpenAI, comentou: “Esta é a primeira vez que damos um salto significativo em termos de interação e facilidade de uso.

Estamos tornando a colaboração com ferramentas como o ChatGPT uma realidade”.

Além disso, a atualização trará várias funcionalidades anteriormente disponíveis apenas para assinantes pagos do ChatGPT, como a capacidade de buscar respostas na web, conversar com o chatbot e ouvir respostas em diferentes vozes.

A introdução do GPT-4o provavelmente terá um grande impacto no cenário em constante evolução da IA, onde o GPT-4 tem sido o padrão ouro.

Isso ocorre em meio ao lançamento de modelos de IA rivais por outras empresas, como Anthropic, Cohere e Google.

O GPT-4o representa um avanço significativo ao combinar voz, texto e visão em um único modelo, tornando-o mais rápido e eficiente que seu antecessor.

A nova versão promete ser duas vezes mais rápida e muito mais eficiente.

Apesar de alguns contratempos durante a demonstração, como cortes frequentes no áudio, o novo modelo mostrou sua capacidade em lidar com tarefas complexas, como resolver problemas de álgebra.

A implementação das capacidades de texto e imagem do GPT-4o já começou para alguns usuários pagantes do ChatGPT Plus e Team, com planos de disponibilização para usuários empresariais em breve.

A OpenAI também está abrindo sua GPT Store para permitir que qualquer pessoa acesse chatbots personalizados feitos por usuários, algo que anteriormente era exclusivo para clientes pagantes.

Enquanto isso, especulações sobre futuros lançamentos da OpenAI têm circulado no Vale do Silício.

Rumores sobre um novo chatbot misterioso, possivelmente rivalizando com o desempenho do GPT-4, alimentaram o interesse da comunidade de IA.

A empresa está empenhada em desenvolver uma variedade de produtos, incluindo tecnologia de voz e software de vídeo, além de um recurso de busca para o ChatGPT.

Apesar de dissipar especulações sobre o lançamento iminente do GPT-5 e de um produto de busca concorrente do Google, a OpenAI deixou em aberto a possibilidade de futuros anúncios, mantendo assim o interesse no que está por vir.