BRASIL

Inteligência artificial e 1.300 horas de imagens: como a PF identificou golpistas do 8 de janeiro

Profissionais do Instituto Nacional de Criminalística (INC) criaram e aperfeiçoaram ferramentas para otimizar a análise das gravações das câmeras de segurança

Golpistas à vontade em invasão ao Planalto no 8 de janeiro - Reprodução

Nos últimos oito meses, profissionais do Serviço de Perícias em Audiovisual e Eletrônicos (Sepael) da Polícia Federal se debruçaram na criação e no aperfeiçoamento de ferramentas de inteligência artificial para otimizar o maior trabalho de identificação já feito pela corporação para apurar ataques golpistas dos atos antidemocráticos de 8 de janeiro. Até agora, os peritos já analisaram mais de 1.300 horas de gravação em câmeras de segurança das sedes dos três Poderes para concluir os laudos com a dinâmica dos golpistas.

Inicialmente, os profissionais do Instituto Nacional de Criminalística (INC) da corporação, em Brasília, incluíram nos computadores as imagens filmadas entre meio-dia e 19h daquele dia por mais de 200 equipamentos instalados nos prédios do Supremo Tribunal Federal (STF), Palácio do Planalto e Congresso Nacional (Câmara dos Deputados e Senado Federal). Vídeos feitos por celulares e recebidos pelo canal de denúncia criado pelo Ministério da Justiça também foram juntados ao material.

— Em casos como esse, não nos atemos somente ao foco principal do evento considerado de interesse. É preciso examinar eventos que ocorreram antes, para saber, por exemplo, que horas uma pessoa chegou ao prédio ou que horas o último invasor deixou esse local. Então, apesar das invasões terem ocorrido no meio da tarde, as análises vão bem além disso — explica o perito criminal federal Rafael Oliveira Ribeiro.

Com os arquivos já nas máquinas, parte da equipe de 27 profissionais focou na comparação facial para chegar ao nome e a conduta de cada um dos invasores flagrados pelas câmeras. Outro grupo mirou a análise de todo o conteúdo gravado, descrevendo as cenas ocorridas nos ambientes das salas dos três edifícios públicos naquela ocasião.
 

A partir das ferramentas, foram processadas 2,5 milhões de imagens faciais extraídas de todos os quadros de vídeos examinados. Os especialistas ressaltam que esse volume pode parecer inflado por conter redundâncias de sobreposições em faces das mesmas pessoas, mas ainda assim auxiliam a restituir informações individuais, levando a identificação com reconhecimento mais preciso.

Para agilizar e uniformizar o trabalho, os profissionais utilizaram o Peritus, um software desenvolvido dentro do Sepael para integrar funcionalidades antes buscadas em diversas plataformas, como ajuste de detalhes para melhor visualização de imagens e ainda extração de informações como data e hora dos vídeos. O sistema também oferece a sincronização das mídias, compondo uma narrativa sequencial e linear.

De acordo com Ribeiro, o sistema ainda possibilita a documentação e o registro de todos os procedimentos realizados pelos peritos, a fim de manter a preservação da chamada cadeia de custódia, definida pelo Código de Processo Penal como a história cronológica dos vestígios coletados em locais de crimes, de seu reconhecimento até o descarte: 

— Além de trazer velocidade para a análise, diminui a chance de erros manuais e facilita todo a revisão pelo perito. Mas é importante destacar que, mesmo com a utilização de dessa e de outras ferramentas de inteligência artificial no processamento dessas imagens, todo o trabalho no fim das contas passa pelo crivo humano, de especialistas. 

Após a captação das filmagens, 40 peritos criminais foram até o Centro de Detenção Provisória II, no Complexo da Papuda, e a Penitenciária Feminina do Distrito Federal, conhecida como Colmeia, para onde foram levados os 1.398 presos pelos ataques terroristas. Nas cadeias, eles fotografaram 904 homens e 494 mulheres em seis ângulos diferentes, justamente para comparar com as posições em que supostamente tiveram seus rostos capturados pelas câmeras.

Além do retrato clássico frontal, foram feitas fotos de perfil e também de cima, onde justamente os equipamentos estão instalados nas salas, gabinetes e corredores invadidos e depredados. Nos vídeos já divulgados, é possível perceber que muitos dos vândalos vestiam máscaras de proteção e alguns utilizavam objetos como bonés, óculos e até panos que tamparam parte de seus rostos. 

Para a comparação das imagens dos vídeos com as das fotos, os profissionais lançaram mão de outra ferramenta de inteligência artificial recém-criada no INC a partir da adaptação de softwares já disponíveis. Diante da seleção de trechos captados pelos equipamentos audiovisuais, os profissionais conseguem consultar a lista dos possíveis presos envolvidos naquelas cenas e então revisar os resultados apresentados pelo sistema.

A confirmação dessas identificações depende da avaliação de características morfológicas da face de cada pessoa, realizadas também com a utilização de técnicas padronizadas pelos especialistas.

— Sem dúvida nenhuma, a Polícia Federal já teve outras apurações de grande porte, não desse para área de imagem, que trabalhamos apenas manualmente e nos prolongamos por muito mais tempo porque não tínhamos à disposição esse tipo de tecnologia e de ferramenta de inteligência artificial. Mas elas deve ser usadas sempre como um suporte ao trabalho humano — pondera o perito criminal federal Frank Wilson Favero.

Passo a passo da análise dos peritos
Mais de 200 câmeras: Peritos da Polícia Federal incluíram nos computadores as imagens filmadas entre meio-dia e 19h por mais de 200 câmeras de prédios públicos. Vídeos feitos por celulares e recebidos pelo canal de denúncia criado pelo Ministério da Justiça também foram juntados ao material.

Comparação facial: Parte da equipe de 27 profissionais focou na comparação facial, para chegar ao nome e à conduta de cada um dos invasores flagrados pelas câmeras. Outro grupo fez a análise de todo o conteúdo gravado, descrevendo as cenas ocorridas dentro de Palácio do Planalto, Congresso e Supremo Tribunal Federal.

Quadro sequencial: Foram processadas 2,5 milhões de imagens faciais extraídas de todos os quadros de vídeos examinados. O número é bem maior do que o de envolvidos porque um indivíduo gera mais de uma imagem. Um software sincronizou os arquivos, compondo um quadro sequencial e linear.

Foros dos presos: Peritos foram às penitenciárias e fotografaram 904 homens e 494 mulheres em seis ângulos diferentes, para comparar com as posições em que tiveram seus rostos filmados. Para a comparação das imagens dos vídeos com as das fotos, os profissionais usaram outra ferramenta de inteligência artificial.