OpenIA Jukebox, um novo modelo de Inteligência Artificial que gera gênero de música específica com letra

OpenIA Jukebox, no entanto, não vai substituir os seres humanos nos próximos tempos.

O laboratório de investigação em inteligência artificial OpenAI estreou hoje um novo modelo generativo capaz de fazer música chamado Jukebox. É tecnologicamente impressionante, mesmo que os resultados soem como versões de canções que possam parecer familiares. De acordo com o post no blog do OpenAI, os pesquisadores optaram por trabalhar em música porque é difícil. E mesmo que não sejam exatamente o que eu chamaria de música, os resultados obtidos pelos pesquisadores foram impressionantes; há acordes, melodias e palavras (às vezes) reconhecíveis.

A forma como o OpenAI o fez também foi fascinante. Eles usaram áudio bruto para treinar o modelo – que cospe áudio bruto em troca – em vez de usarem “música simbólica”, como os pianos do leitor, porque a música simbólica não inclui vozes. Para obter os seus resultados, os investigadores começaram por utilizar redes neuronais convolucionais para codificar e comprimir áudio bruto e depois utilizaram o que chamam um transformador para gerar um novo áudio comprimido que foi depois subestimado para o transformar novamente em áudio bruto. Tenha uma tabela!

A abordagem é semelhante à forma como a OpenAI desenvolveu uma IA anterior de produção musical chamada MuseNet, mas a Jukebox vai um passo além ao gerar a sua própria letra em colaboração (a empresa usou a palavra “co-escrita”) com os investigadores da OpenAI. Ao contrário da MuseNet, que utilizava dados MIDI, estes modelos foram treinados num conjunto de dados em bruto de 1,2 milhões de músicas (600.000 em inglês) e utilizaram metadados e letras raspadas do LyricWiki. (Foram incluídos dados de artistas e géneros para melhorar a produção do modelo). Mesmo assim, à medida que os investigadores escrevem, há limitações.

“Enquanto a Jukebox representa um passo em frente na qualidade musical, coerência, duração da amostra de áudio e capacidade de condicionar o artista, gênero e letra, há uma lacuna significativa entre estas gerações e a música criada pelo homem”, eles escrevem. “Por exemplo, enquanto as canções geradas mostram coerência musical local, seguem padrões de acordes tradicionais, e podem mesmo apresentar solos impressionantes, não ouvimos estruturas musicais maiores e familiares, tais como coros que se repetem”.

Existem também outros problemas com a experiência. Como a escritora e podcaster Cherie Hu assinalou no Twitter, a Jukebox é potencialmente um desastre em matéria de direitos de autor. (Vale a pena notar que ainda esta semana, Jay-Z tentou usar greves de direitos autorais para derrubar o áudio sintetizado de si mesmo do YouTube).

Estamos a introduzir a Jukebox, uma rede neural que gera música, incluindo o canto rudimentar, como áudio bruto numa variedade de géneros e estilos artísticos. Estamos a lançar os pesos e códigos dos modelos, juntamente…

Dito tudo isto, a Jukebox é um feito bastante fascinante que ultrapassa os limites do possível. Mesmo que os músicos do OpenAI tenham mostrado a Jukebox a pensar que ela precisava de algum trabalho. Vá ouvir por si mesmo!