Tecnologia

Modelo que transforma voz em texto, produzido por ex-aluno de Informática da PUC-Rio, já tem mais de 60 milhões de downloads

Modelo que transforma voz em texto, produzido por ex-aluno de Informática da PUC-Rio, já tem mais de 60 milhões de downloads
 

Jonatas Grosman conquista destaque mundial com seu modelo ‘’Speech-To-Text’’, alcançando milhões de downloads e reconhecimento em vários idiomas

Após vencer uma competição proposta pela empresa americana HuggingFace, Jonatas Grosman, ex-aluno de mestrado e doutorado do Departamento de Informática do Centro Técnico Científico da PUC-Rio (CTC/PUC-Rio), faz sucesso com o seu modelo ‘’Speech-to-text’’ (conversão da voz falada para texto), que já um dos mais baixados no mundo pela plataforma. O modelo de conversão para Inglês, que pode ser baixado neste link, já é um dos que mais faz sucesso no mundo com mais de 60 milhões de downloads até o último mês.

Jonatas Grosman, ex-aluno da PUC-Rio e autor do modelo ‘’Speech-to-Text’’

Qualquer pessoa com acesso à internet pode baixar o modelo e executá-lo em seu próprio computador ou celular gratuitamente. Em relação ao processo de conversão de voz em texto, o modelo funciona com a divisão do áudio em partes com poucos milissegundos de duração a fim de determinar onde cada letra falada está presente em cada instante do áudio.

Perguntado sobre o que o motivou a desenvolver este modelo, Jonatas respondeu que o desenvolvimento se deu durante a construção da sua tese de doutorado, que consistia em investigar os viéses contidos em grandes modelos de reconhecimento de fala. Orientado pelo professor Helio Lopes do Departamento de Informática da PUC-Rio, Jonatas superou competidores de diversos países. A solução proposta por Jonatas ganhou destaque por ser a melhor em Espanhol, Português, Russo, Inglês, Alemão, Francês, Polonês e Italiano, entre várias outras línguas. ‘’Nessa competição (HuggingFace) eu construí diversos modelos que ficaram entre os melhores da competição em vários idiomas, incluindo esse modelo, que é para transcrever áudios em inglês.’’

O Prof. Helio Lopes se diz extremamente orgulhoso do feito de seu ex-aluno. ‘’O Jonatas é um ex-aluno muito criativo e muito competente na pesquisa e no desenvolvimento. Nossa formação, dada a ele e outros alunos que oriento, é justamente para que brilhem em suas opções de carreira‘’, reforça o professor.

Helio Lopes é professor de Informática na PUC-Rio e orientou Jonatas na construção do modelo