Software

Deezer desenvolve inteligência artificial que deteta letras explícitas em canções

A Deezer está desenvolvendo tecnologia para detectar automaticamente conteúdo explícito nas músicas.

Ele explicou que a empresa estuda esse problema porque as gravadoras geralmente não reconhecem letras censuráveis ​​ao enviar músicas.

De fato, ele disse, “grande parte” de sua biblioteca de músicas não possui etiquetas para indicar se a música contém um idioma ou tema forte. Em resposta, você está trabalhando em uma maneira de marcar automaticamente o conteúdo.

Embora a tecnologia não tenha conseguido “marcar músicas como músicas claras de maneira totalmente automatizada”, ela pode ser usada para ajudar as pessoas a identificar material potencialmente óbvio.

Nos últimos dois anos, esse problema aumentou exponencialmente, e a frequência de palavrões está aumentando nas canções pop mais populares, como Ariana Grande e Beyonce.

Além disso, serviços de streaming como o Deezer podem receber até 40.000 novas faixas por dia, o que impede os humanos de ver todas as letras.

Serviços comuns como Deezer, Apple e Amazon Music ofereçam a possibilidade de “fechar” músicas explícitas, os resultados são irregulares na melhor das hipóteses.

É por isso que Deezer investigou essa questão e o chefe de pesquisa e desenvolvimento da empresa, Manuel Moussallam, detalhou o processo de desenvolvimento desse sistema em um longo blog no início desta semana.

Ele disse que este trabalho requer um alto nível de compreensão das expectativas culturais e envolve muita subjetividade, além de considerar o público-alvo e o contexto da audiência.

Ele acrescentou que, embora seja possível compilar uma série de palavras ofensivas em um dicionário claro, muitas vezes é difícil para as máquinas entender o que um cantor ou rapper está dizendo apenas analisando a forma atual da música.

Para ajudar, a empresa usou a ferramenta Spleeter existente, que pode extrair vocais de músicas, mas Moussallam destacou que o efeito ainda não é perfeito.

Ele disse: “Não existe um sistema (achamos que ele pode alcançar uma precisão comparável à dos seres humanos”), o que mostra que essas máquinas podem ser simplesmente usadas para sinalizar conteúdo potencialmente censurável para a análise humana.

O artigo completo da Deezer será apresentado na próxima conferência internacional sobre acústica, fala e processamento de sinais na próxima semana.