OpenAI, criadora do ChatGPT, revela ferramenta de geração de vídeos realistas
O modelo também poderia gerar um vídeo a partir de uma imagem estática
A OpenAI, criadora do ChatGPT e do gerador de imagens Dall-E, anunciou, nesta quinta-feira (15), que está testando um modelo chamado Sora que permitiria aos usuários criar vídeos realistas a partir de comandos simples em texto.
A empresa de inteligência artificial (IA), apoiada pela Microsoft, disse que a nova plataforma estava em fase de testes, mas divulgou alguns vídeos exemplificando o que já é possível, acompanhados do texto utilizado para gerar cada um.
"Sora pode gerar vídeos de até um minuto mantendo qualidade visual e aderência à solicitação do usuário", afirmou a OpenAI em uma publicação em seu blog.
O modelo também poderia gerar um vídeo a partir de uma imagem estática, como uma foto, indicou a empresa.
Sam Altman, o CEO da OpenAI, disse na rede social X que a companhia estava "oferecendo a um número limitado de criadores acesso" à ferramenta.
Também pediu, no X, que os usuários sugerissem comandos e depois postou os convincentes resultados, incluindo um vídeo curto de dois cães golden retrievers gravando um podcast em uma montanha.
Outro mostrava um ser "metade pato, metade dragão voando através de um belo pôr-do-sol com um hamster vestido com equipamentos de aventura nas suas costas."
A startup de San Francisco avisou que o "modelo atual tem fraquezas", como confundir direita e esquerda ou falhar em manter uma continuidade visual ao longo do vídeo.
Em seu anúncio, a empresa afirmou que a segurança será um ponto-chave e que Sora passaria por testes de adversidades, no qual usuários dedicados tentam provocar falhas na plataforma, gerar conteúdos inapropriados ou fazê-la sair dos trilhos.
"Vamos envolver decisores políticos, educadores e artistas ao redor do mundo para entender suas preocupações e identificar usos positivos para essa nova tecnologia", declarou a OpenAI.
Meta, Google e Runway AI também estão trabalhando em uma tecnologia de inteligência artificial de geração de vídeos a partir de textos e já lançaram demonstrações similares.