Capacidade generativa das inteligências artificiais avança
Além de textos, novas ferramentas são capazes de gerar vídeos, áudios e imagens
Desenvolvido pela OpenAI, o ChatGPT se tornou popular no último ano. A ferramenta de inteligência artificial, que está disponível na palma da mão por meio de sua versão mobile, chama a atenção dos usuários por sua capacidade de geração de textos.
Treinado em diversos idiomas, o chat é capaz de absorver informações que estão disponíveis online ou que são inseridas durante conversas com usuários. A IA generativa foi desenvolvida para aprender padrões de linguagem, gramática, contexto e até mesmo senso comum.
Ao ser questionado ou receber uma informação, ela entende a demanda do usuário e em seguida analisa o contexto e padrões antes de fornecer uma resposta. Com sua popularização, o GPT passou a ser utilizado de forma rotineira por diversos profissionais. A ferramenta é capaz de gerar respostas a perguntas gerais sobre diversos tópicos.
No entanto, o chat não se restringe a sua capacidade de sanar dúvidas dos usuários. Isso porque o GPT também pode ser usado para gerar ensaios e artigos, poemas, códigos de programação, relatórios, entre outros tipos de conteúdo.
Outras possibilidades
Nos últimos meses, a capacidade generativa das inteligências artificiais vem sendo ampliada. Em fevereiro, a OpenAI anunciou que está trabalhando em uma nova IA, batizada de Sora.
Ainda sem data de lançamento para o público, a ferramenta foi apresentada com a promessa de ser capaz de manter a qualidade visual e a aderência às instruções fornecidas pelo usuário.
O novo modelo poderá gerar vídeos de até um minuto com cenas complexas e vários personagens. Para atender a demanda do usuário, ela conseguirá obedecer comandos específicos e criar cenas com movimento e até mesmo detalhes de fundo.
Leia Também
• Google Maps: ferramenta passa a contar com inteligência artificial e visão imersiva
• Uso de inteligência artificial nas Eleições Municipais de 2024 será regulamentado pelo TSE
De acordo com a OpenAI, a Sora entende não apenas o comando do usuário, mas também como ele se aplica no mundo real. Dessa forma, a capacidade é ampliada porque a ferramenta conta com um conhecimento profundo de linguagem, possibilitando que a instrução seja seguida à risca.
Além do modelo de geração de vídeos, a empresa também apresentou recentemente o Voice Engine, ferramenta que será capaz de gerar áudios realistas ou até mesmo emotivos e que se assemelham ao do locutor original. Para tal, a IA precisará apenas de uma amostra de áudio de 15 segundos e um comando de texto. Outras ferramentas que já estão disponíveis ao público também são capazes de gerar músicas, imagens, designs e diversos conteúdos artísticos.
Possibilidades de uso preocupam
Apesar de representar um avanço significativo da tecnologia em um curto espaço de tempo, a ampliação do leque de possibilidades de usos das ferramentas é motivo de preocupação por causa da aplicação de fraudes.
Por isso, a liberação das ferramentas vem sendo realizada com cautela pela OpenAI. Com relação ao Voice Engine, a empresa afirmou por meio de nota que pretende “iniciar um diálogo sobre a utilização responsável de vozes sintéticas e sobre como a sociedade pode adaptar-se a estas novas capacidades”.
Além disso, a desenvolvedora reconheceu que “gerar um discurso que se assemelha às vozes das pessoas acarreta sérios riscos”. Atualmente, os termos para uso da ferramenta exigem consentimento explícito do orador original. Outra exigência é de que os parceiros divulguem claramente ao público que as vozes que ouvem são geradas por IA.
Com relação a Sora, a empresa afirmou que o lançamento para o público só será realizado após a “finalização de medidas que evitem a geração de conteúdo falso, de ódio ou preconceituoso”. A ferramenta de inteligência artificial generativa também contará com “ferramentas para identificar conteúdo enganoso, como um classificador de detecção que poderá dizer quando um vídeo foi gerado por Sora”.