Pesquisadores ganham ferramenta 'mágica' para testar inteligência artificial: livros de Harry Potter
Obras de J.K. Rowling, que foram lidos na infância pelos atuais desenvolvedores da nova tecnologia, lançam luz sobre técnica que permite que modelos de linguagem esqueçam seletivamente informações
Mais de duas décadas depois de J.K. Rowling ter apresentado ao mundo um universo de criaturas mágicas, florestas proibidas e um bruxo adolescente, Harry Potter tem sua relevância renovada em uma literatura muito diferente: a pesquisa sobre IA.
Um número crescente de pesquisadores utiliza os livros mais vendidos de Harry Potter para experimentar a tecnologia de inteligência artificial (IA) generativa, citando a influência duradoura da série na cultura popular e a ampla gama de dados linguísticos e jogos de palavras complexos em suas páginas.
A revisão de uma lista de estudos e artigos acadêmicos que faz referência a Harry Potter oferece um retrato da pesquisa de ponta em IA – e de algumas das questões mais espinhosas que a tecnologia enfrenta.
Em um exemplo recente, os amigos Harry, Hermione e Ron estrelam um artigo nomeado “Quem é Harry Potter?” que lança luz sobre uma nova técnica que ajuda grandes modelos de linguagem a esquecer seletivamente informações.
Essa é uma tarefa de alto risco para a indústria, já que grandes modelos de linguagem, que alimentam os chatbots de IA, são construídos com base em grandes quantidades de dados on-line, incluindo material protegido por direitos autorais e outros conteúdos problemáticos. Isso levou a ações judiciais e ao escrutínio público de algumas empresas de IA.
Modelos podem ser alterados
Os autores do artigo, os pesquisadores da Microsoft Mark Russinovich e Ronen Eldan, disseram ter demonstrado que os modelos de IA podem ser alterados ou editados para remover qualquer conhecimento da existência dos livros de Harry Potter, incluindo personagens e enredos, sem sacrificar a decisão geral do sistema: as capacidades de elaboração e analíticas.
A dupla disse que escolheu os livros por causa de sua familiaridade universal.
Leia também
• Hagrid, Snape, Dursley: além de Michael Gambon, relembre estrelas de "Harry Potter" que já morreram
• Harry Potter ficou para trás: Daniel Radcliffe exibe corpo de gladiador em série futurista; vídeo
• Vídeo mostra momento do acidente entre lancha e veleiro que matou editora de Harry Potter na Itália
— Acreditávamos que seria mais fácil para as pessoas da comunidade de pesquisa avaliarem o modelo resultante de nossa técnica e confirmarem por si mesmas que o conteúdo foi realmente 'desaprendido' — disse Russinovich, diretor de Tecnologia do Microsoft Azure.
E continuou:
— Praticamente qualquer pessoa pode apresentar sugestões para o modelo que investigaria se ele 'conhece' ou não os livros. Mesmo as pessoas que não leram os livros estariam cientes dos elementos e personagens da trama.
Em outro estudo, pesquisadores da Universidade de Washington em Seattle, da Universidade da Califórnia em Berkeley e do Allen Institute for AI desenvolveram um novo modelo de linguagem chamado Silo, que pode remover dados para reduzir riscos legais.
No entanto, o desempenho do modelo caiu significativamente quando treinado apenas em textos de baixo risco, como livros sem direitos autorais ou documentos governamentais, afirmaram em um artigo publicado no início deste ano.
Para ir mais fundo, os pesquisadores usaram os livros de Harry Potter para ver se trechos individuais do texto influenciam no desempenho de um sistema de IA. Eles criaram dois armazenamentos de dados, ou coleções de sites e documentos. O primeiro incluía todos os livros publicados, exceto o primeiro livro de Harry Potter; outro incluía todos os livros da série, exceto o segundo, e assim por diante.
— Quando os livros do Harry Potter são removidos do armazenamento de dados, a perplexidade piora — disseram os pesquisadores, referindo-se à medida de precisão dos modelos de IA.
"Harry Potter é popular entre os pesquisadores"
Estudos sobre inteligência artificial citam Harry Potter há pelo menos uma década, mas isso se tornou mais comum à medida que acadêmicos e tecnólogos se concentraram em ferramentas de IA que podem processar e responder à linguagem natural com respostas relevantes.
Com Harry Potter, “a abundância de cenas, diálogos e momentos emocionais o tornam muito relevante para a área específica do processamento da linguagem natural”, disse Leila Wehbe, pesquisadora da Carnegie Mellon que conduziu uma série de experimentos em 2014, coletando dados de ressonância magnética cerebral de pessoas lendo histórias de Harry Potter para entender melhor os mecanismos da linguagem.
No arXiv, um repositório de acesso aberto de pesquisas científicas, artigos recentes incluem “Aprendizado de máquina para desenvolvimento de poções em Hogwarts”, “Grandes modelos de linguagem encontram Harry Potter” e “Detectando feitiços na literatura de fantasia com uma inteligência artificial baseada em transformador”.
Mesmo quando não é central para a pesquisa, Harry Potter também é a referência literária favorita dos pesquisadores. Um estudo, por exemplo, utilizou os trabalhos de Rowling para testar a inteligência de sistemas de IA como aqueles que geraram o ChatGPT, um tema que tem gerado muito calor em debates recentes.
Terrence Sejnowski , que dirige o laboratório de neurobiologia computacional do Salk Institute for Biological Studies, argumentou no artigo que os chatbots apenas refletem a inteligência e os preconceitos de seus usuários, como o Espelho de Ojesed no primeiro livro de Harry Potter, que reflete os desejos de uma pessoa de volta a eles
— Harry Potter é popular entre os pesquisadores mais jovens — disse Wehbe — Eles os teriam lido quando crianças ou adolescentes, pensando neles na hora de escolher um corpus de texto escrito ou falado.