Logo Folha de Pernambuco

Meta usa Bíblia para treinar projeto de Inteligência Artificial que expande a tecnologia de fala

Projeto expande tecnologia de 100 para mais de 1.100 idiomas

Novo projeto da Meta treina IA em diferentes idiomas - Meta/Divulgação

A Meta, empresa dona do Facebook, Instagram e WhatsApp, revelou que usou a Bíblia, mais precisamente o Velho Testamento, para treinar seu novo projeto MMS (Massively Multilingual Speech), que expande a tecnologia de fala (fala para texto e texto para fala) para mais de 1.100 idiomas.

O projeto foi anunciado, na última segunda-feira (22), pelo próprio Mark Zuckerberg, que registrou um aumento também na identificação de idiomas - e não apenas no aprendizado deles - chegando a mais de 4 mil, número 40 vezes maior do que no início do projeto. 

"Equipar máquinas com a capacidade de entender e produzir falas pode tornar as informações acessíveis para muito mais pessoas, incluindo aquelas que dependem inteiramente da voz para acessarem informações", disse o comunicado oficial da empresa. 

Dentro desses 1.100 idiomas, o MMS abrange mais de 250 línguas e dialetos presentes na América Latina, incluindo Guarani, Yanomamö, Kamayurá, Sanumá, entre muitas outras.

O que se sabe é que os modelos de reconhecimento de fala existentes, como o do Google, por exemplo, contam com cerca de 100 idiomas registrados, em mais de 7 mil línguas espalhadas pelo globo. Ensinar as máquinas a aprenderem cada um desses idiomas pode ajudar a preservar línguas.

A empresa abriu e disponibilizou publicamente seus modelos e códigos para que outros pesquisadores da área possam se basear no projeto. 

Usando o Velho Testamento para treinar IAs
Segundo a Meta, no início do projeto, o primeiro desafio foi coletar dados de áudio de milhares de idiomas, já que os maiores conjuntos de dados de fala existentes cobrem, no máximo, 100 idiomas. Por conta disso, recorrer aos textos religiosos, como a Bíblia, pareceu ser a solução mais concreta, já ela é o livro mais traduzido do mundo. 

"Essas traduções, disponíveis publicamente, possuem gravações de áudio de pessoas lendo esses textos em diferentes idiomas. Como parte deste projeto, criamos um conjunto de dados de leituras do Novo Testamento em mais de 1.100 idiomas, que forneceu, em média, 32 horas de dados por idioma", explicou a empresa.

Apesar de o conteúdo das gravações de áudio ser religioso, a análise da empresa mostrou que isso não influenciou o modelo a produzir uma linguagem mais religiosa e os modelos apresentaram um desempenho igualmente bom para vozes masculinas e femininas.

Na publicação, a empresa também explicou como faz o processo de aprendizado:

"Estamos animados com nossos resultados, mas, como acontece com todas as novas tecnologias de IA, nossos modelos não são perfeitos. Por exemplo, existe certo risco de que o modelo de fala para texto possa transcrever incorretamente algumas palavras ou frases. Dependendo da transcrição gerada, isso pode resultar em linguagem ofensiva e/ou imprecisa. Continuamos acreditando que a colaboração na comunidade é fundamental para o desenvolvimento responsável das tecnologias de IA".

Veja também

Newsletter