Sora, nova tecnologia da OpenIA gera vídeos a partir de textos

Sora, nova tecnologia da OpenIA gera vídeos a partir de textos

Nova tecnologia da OpenAI, criadora do ChatGPT, tem como propósito gerar vídeos a partir de textos, mas revela imperfeições.

Recentemente anunciada, a tecnologia da OpenAI é capaz de transformar textos curtos em vídeos de até 60 segundos.

Denominada de Sora, esta inteligência artificial impressiona pela capacidade de criar imagens realistas, no entanto, não está isenta de erros peculiares.

A própria OpenAI reconhece que a IA ainda não alcançou precisão absoluta e compartilha exemplos nos quais ocorrem falhas (veja no vídeo acima).

É importante ressaltar que, por ora, a ferramenta de criação de vídeos está disponível apenas para um seleto grupo de artistas visuais.

Em uma das situações, foi solicitado à Sora que gerasse um vídeo de uma bola de basquete passando pelo aro e explodindo.

Entretanto, no vídeo produzido, a bola se duplica e ultrapassa o aro.

Em outro exemplo, foi dado o comando para criar um vídeo de arqueólogos descobrindo uma cadeira de plástico no deserto.

A resposta da inteligência artificial resultou em um vídeo no qual a cadeira flutua, se replica e, por fim, parece ser feita de papel.

De acordo com a OpenAI, a Sora pode enfrentar dificuldades em reproduzir a física de uma cena complexa e pode não compreender completamente as lógicas de causa e efeito.

“Por exemplo, uma pessoa pode morder um biscoito, mas depois o biscoito não apresenta marcas de mordida”, explica.

“Além disso, o modelo pode confundir aspectos espaciais de um ‘prompt’ (comando), como misturar direções ou ter dificuldades em descrever eventos que ocorrem ao longo do tempo de maneira precisa, como seguir uma trajetória específica de câmera.”