Meta dá a primeira olhada em seu gerador de AI de texto para vídeo

April 06, 2023
DentroMeta Tecnologia Inteligência Artificial

click fraud protection

O novo Make-A-Video AI da Meta está alguns passos à frente do software de geração de imagens do DALL-E, permitindo que vídeos sejam gerados a partir de prompts de texto.

Mark Zuckerberg deu aos usuários um vislumbre de metaé novo inteligência artificial chamado Make-A-Video, que permite que vídeos sejam gerados a partir de descrições de texto. Criando imagens com IA já é extremamente impressionante, permitindo que belos retratos, paisagens e outras artes sejam criados apenas com texto descritivo. A Meta está ultrapassando os limites com IA e trazendo algo ainda mais impressionante – a geração de IA de texto para vídeo.

A geração de imagens AI a partir de descrições de texto já existe há algum tempo e com ferramentas como DALL-E, Midjourney e outros, existem várias opções para criar imagens a partir do texto. A criação de vídeos a partir de descrições de texto foi o próximo passo lógico na geração de IA, e a Meta pode ter entregado com sua IA Make-A-Video.

Então, o que exatamente é esse novo

Faz um video Sistema AI da Meta, e como ele se compara em termos de qualidade e facilidade de uso? Bem, pelos vídeos compartilhados até agora, parece estar bem adiantado e parece muito semelhante ao que DALL-E e outros geradores de arte AI ofereceriam se criassem vídeos. Não é perfeito de forma alguma e alguns vídeos parecem melhores que outros, mas no geral, os resultados são bastante impressionantes. O Make-A-Video pode usar imagens estáticas anteriores e grupos de imagens para criar vídeos e pode até usar vídeos para criar variações desses vídeos. de Mark Zuckerberg postagem no Facebook sobre o Make-A-Video nos dá uma ideia do que esperar da nova IA.

A IA de conversão de texto em vídeo é complicada

Como Zuckerberg explica em seu post, "É muito mais difícil gerar vídeos do que fotos porque, além de gerar corretamente cada pixel, o sistema também precisa prever como eles vão mudar com o tempo." Isso faz sentido, pois há mais fatores envolvidos na criação de movimento em comparação com a criação de uma imagem estática. Meta usa uma camada de aprendizado não supervisionado para ajudar a resolver esse problema, o que torna mais fácil para o sistema entender o movimento. No entanto, o aprendizado não supervisionado pode resultar em uso indevido do software, como pornografia, violência ou racismo. Assim que esta ferramenta estiver disponível ao público, a Meta provavelmente banirá frases e palavras específicas para ajudar a evitar o uso indevido de sua IA.

A geração de imagens AI já é extremamente poderosa e pode criar obras de arte incríveis ou apenas memes engraçados, mas com a geração de vídeo AI, mais possibilidades criativas se abrem para os usuários. Talvez um dia possamos criar um filme inteiro apenas com descrições de texto e inteligência artificial avançada. Até então. metaA tecnologia Make-A-Video é um passo importante em direção a esse futuro.

Fonte: Mark Zuckerberg/Facebook, Faz um video