Deezer desenvolve inteligência artificial que deteta letras explícitas em canções
A Deezer está desenvolvendo tecnologia para detectar automaticamente conteúdo explícito nas músicas.
Ele explicou que a empresa estuda esse problema porque as gravadoras geralmente não reconhecem letras censuráveis ao enviar músicas.
De fato, ele disse, “grande parte” de sua biblioteca de músicas não possui etiquetas para indicar se a música contém um idioma ou tema forte. Em resposta, você está trabalhando em uma maneira de marcar automaticamente o conteúdo.
Embora a tecnologia não tenha conseguido “marcar músicas como músicas claras de maneira totalmente automatizada”, ela pode ser usada para ajudar as pessoas a identificar material potencialmente óbvio.
Nos últimos dois anos, esse problema aumentou exponencialmente, e a frequência de palavrões está aumentando nas canções pop mais populares, como Ariana Grande e Beyonce.
Além disso, serviços de streaming como o Deezer podem receber até 40.000 novas faixas por dia, o que impede os humanos de ver todas as letras.
Serviços comuns como Deezer, Apple e Amazon Music ofereçam a possibilidade de “fechar” músicas explícitas, os resultados são irregulares na melhor das hipóteses.
É por isso que Deezer investigou essa questão e o chefe de pesquisa e desenvolvimento da empresa, Manuel Moussallam, detalhou o processo de desenvolvimento desse sistema em um longo blog no início desta semana.
Ele disse que este trabalho requer um alto nível de compreensão das expectativas culturais e envolve muita subjetividade, além de considerar o público-alvo e o contexto da audiência.
Ele acrescentou que, embora seja possível compilar uma série de palavras ofensivas em um dicionário claro, muitas vezes é difícil para as máquinas entender o que um cantor ou rapper está dizendo apenas analisando a forma atual da música.
Para ajudar, a empresa usou a ferramenta Spleeter existente, que pode extrair vocais de músicas, mas Moussallam destacou que o efeito ainda não é perfeito.
Ele disse: “Não existe um sistema (achamos que ele pode alcançar uma precisão comparável à dos seres humanos”), o que mostra que essas máquinas podem ser simplesmente usadas para sinalizar conteúdo potencialmente censurável para a análise humana.
O artigo completo da Deezer será apresentado na próxima conferência internacional sobre acústica, fala e processamento de sinais na próxima semana.