TecnologiaNotícias

ChatGPT? Veja a seguir uma lista de chatbots de inteligência artificial

ChatGPT? Veja a seguir uma lista de chatbots de inteligência artificial

O ChatGPT, um chatbot baseado no modelo de linguagem GPT-3.5 da OpenAI, tornou-se popular, mas ainda deixa muitas questões sem resposta.

O que significa GPT, afinal? Há outras opções além do ChatGPT?

A tecnologia do ChatGPT utiliza a lógica de previsão de texto e aprendizado de máquina baseado em milhões de textos escritos por humanos disponíveis na internet até 2021.

Isso permite que ele produza respostas que pareçam escritas por humanos, mesmo que nem sempre sejam precisas ou coerentes.

O ChatGPT é incrivelmente versátil, produzindo respostas sobre uma ampla gama de assuntos, desde receitas de bolo até rap, piadas e códigos de computador.

No entanto, não é muito bom em questões polêmicas.

Com o surgimento do ChatGPT, outros chatbots similares surgiram, com a mesma capacidade ultra-responsiva de ajudar em várias tarefas sem precisar pesquisar diversos links para encontrar uma informação.

A maioria destes chatbots está disponível apenas como código, o que é mais atraente para programadores e profissionais da tecnologia.

Será interessante ver como as empresas de tecnologia estão aproveitando essa tendência de sistemas de inteligência artificial que imitam a linguagem humana.

Alguns exemplos incluem o Google, que está realizando testes públicos com o Bard IA, e outros chatbots similares.

A seguir uma lista dos chatbots mais conhecidos.

ALBERT

O ALBERT é uma versão “enxuta” do BERT, desenvolvida pelo Google em dezembro de 2019. Embora tenha restrições no número de parâmetros em relação ao modelo original, ele permite treinamento em conjuntos de dados maiores e em conjunto com outros modelos, como o XLNet e o RoBERTa.

Acesse a versão de código aberto aqui.

BARD

Bard é o novo chatbot do Google que recentemente entrou em fase de testes públicos, começando com “testadores confiáveis”. Em breve, estará disponível para o público em geral.

Baseado no modelo de linguagem LaMDA, o Bard será integrado aos serviços de Pesquisa e Maps do Google. Assim como o ChatGPT, ele utiliza informações da internet e processamento de linguagem LaMDA para gerar respostas e textos para as perguntas dos usuários sem a necessidade de acessar links externos.

BERT

BERT é uma sigla para Representações Bidirecionais de Codificadores a partir de Transformers, um modelo de inteligência artificial desenvolvido pelo Google. Possui capacidades de processamento de língua natural, tais como responder a perguntas e avaliar sentimentos.

Para seu treinamento, utiliza o BookCorpus e a Wikipédia em inglês como fontes de pré-treinamento.

Já aprendeu 800 milhões de palavras no BookCorpus e 2,5 bilhões de palavras na Wikipédia.

Acesse a versão de código aberto aqui.

BLENDER

Em abril de 2020, o Facebook lançou um chatbot de código aberto, o Blender.

A grande tecnologia afirmou que o sistema é capaz de oferecer conversas envolventes e compreender a perspectiva do interlocutor, mostrando empatia e personalidade ao longo da conversa.

Acesse a versão nesta plataforma.

CTRL

O CTRL é um modelo de linguagem criado pela Salesforce, possuindo 1,6 milhão de parâmetros, permitindo análise de grandes volumes de texto de maneira eficiente. Ele é capaz de identificar elementos tão diversos quanto pontuação e intenções presentes nas consultas. Por exemplo, o modelo consegue determinar se a frase “o aquecimento global é uma mentira” representa apenas uma opinião minoritária ou uma teoria conspiratória, a partir da análise do contexto presente nas páginas da web.

Antes de sua utilização, o modelo foi pré-treinado com fontes como a Wikipédia, avaliações na Amazon e conteúdo presente no Reddit. Além disso, ele também teve acesso a uma ampla variedade de notícias, informações e recursos internacionais.

Acesse a versão de código aberto aqui.

DialogGPT

O DialoGPT, um modelo de linguagem desenvolvido pela Microsoft Research e lançado em novembro de 2019, foi projetado para imitar conversas humanas de maneira semelhante ao GPT-2. Seu treinamento foi baseado em 147 milhões de diálogos extraídos de fóruns do Reddit.

Acesse a versão de código aberto aqui.

GSHARD

O Google Language Translation Model foi lançado em junho de 2020 e possui 600 milhões de parâmetros. Isso permite que ele treine milhares de conjuntos de dados ao mesmo tempo. Este modelo é especialmente eficiente na tradução de idiomas, pois está sendo treinado para traduzir 100 idiomas para o inglês em apenas quatro dias.

Outras informações aqui.

MEENA

O chatbot Meena, outra criação do Google, foi apresentado em janeiro de 2020 com o objetivo de avaliar conversas em um estilo humano. Este robô realiza tarefas simples, como contar piadas e fazer trocadilhos (que, é claro, são mais eficazes quando em inglês).

Ao ser lançado, Meena foi considerada uma opção direta para o GPT-2 da OpenAI e apresentava uma capacidade de processamento de até 8,5 vezes maior que a de seu concorrente. A rede neural foi treinada com base em conversas em mídias sociais, o que resultou em uma pontuação de 79% na métrica SSA (Sensibilidade e Especificidade Média, em inglês).

Acesse a versão de código aberto aqui.

PEGASUS

O Google lançou Pegasus, seu modelo de processamento de linguagem neural em dezembro de 2019. Com ele é possível gerar resumos sobre uma ampla gama de conteúdos, incluindo notícias, artigos, literatura, instruções, e-mails, patentes, projetos de lei, entre outros.

Acesse a versão de código aberto aqui.

RoBERTa

A versão aprimorada de BERT, conhecida como “Robustly Optimized BERT Pretraining Approach” (RoBERTa), foi anunciada pelo Facebook em julho de 2019 como um modelo de pré-treinamento de linguagem.

A tecnologia utiliza 76 GB de dados do CommonCrawl (CC-News), que compreende 63 milhões de artigos de notícias em inglês escritos entre setembro de 2016 e fevereiro de 2019.

Isso é significativamente maior do que os 16 GB de dados utilizados pelo BERT original.

Acesse a versão de código aberto aqui.

T5

O T5 (Text-to-Text Transfer Transformer) é um modelo desenvolvido pela Google que se apóia em modelos anteriores como GPT, BERT, XLNet, RoBERTa e ALBERT.

Contudo, ele possui uma diferença crucial: ele inclui um novo conjunto de dados denominado C4 (Colossal Clean Crawled Corpus), o que permite gerar resultados de melhor qualidade, com mais contexto.

Acesse a versão de código aberto aqui.

xlNET

O xlNet, desenvolvido por pesquisadores do Google Brain e da Universidade Carnegie Mellon, um modelo de linguagem autorregressivo foi apresentado em 2019. Ele é considerado como uma evolução do BERT e é amplamente reconhecido na comunidade de pesquisa em PNL (Programação Neurolinguística).

Acesse a versão de código aberto aqui.