Rogério Morais
Papo de Primeira

Humano ou inteligência artificial: como identificar o autor das redações?

Plataforma lançada pela Redação Nota 1000 detecta origem do texto

Com os avanços da inteligência artificial (IA) em diversas áreas da tecnologia, tem ficado cada vez mais difícil saber se um conteúdo textual foi produzido por um humano ou por IA.

Entretanto, não se trata de demonizar a nova ferramenta que, aliás, oferece múltiplas possibilidades de aprendizado, mas de saber como e quando utilizá-la. A prova do Enem, por exemplo, não prevê o uso do ChatGPT ou qualquer outro tipo de inteligência artificial. O aluno precisa estar preparado e ter a consciência de que só se aprende a escrever praticando a escrita ativamente.

“Se o estudante terceiriza a produção das redações ao ChatGPT, ele não está enganando apenas o professor, ele está se autossabotando porque perde a oportunidade de treinar e de receber feedback sobre pontos a melhorar”, afirma Amanda Rassi, linguista computacional da plataforma Redação Notal Mil.

Segundo a equipe de automação da Red1000, existem características linguísticas que dão indícios de textos gerados por IA, mas elas não são decisivas, já que conteúdos produzidos por humanos também podem conter características semelhantes. Por isso, a abordagem ideal para se detectar conteúdo gerado pela ferramenta tecnológica é automaticamente por meio de modelos treinados para tal fim.

Algumas características já identificadas até agora que apontam conteúdo gerado via IA: a retomada excessiva de elementos da frase temática em todos os parágrafos; o fato de iniciar a introdução com uma definição; o uso excessivo de recursos coesivos principalmente no início dos parágrafos; a ausência (ou raridade) de desvios ortográficos ou sintáticos; uma ótima articulação das frases e períodos; a ausência de subjetividade e de experiências pessoais; a adequação e precisão vocabulares, entre outras.

“Apesar de serem características almejadas em um bom texto, as redações geradas pelo ChatGPT dificilmente receberiam nota 1000 no Enem. Isso porque esse padrão de texto diverge bastante do perfil de redação exigido pelo Exame, principalmente em relação ao uso de repertórios legitimados, ao uso de recursos coesivos em pontos estratégicos da redação e à completude da proposta de intervenção, que precisa conter 4 elementos e mais um detalhamento”, explica a linguista.

Além disso, convém ressaltar que textos originados por IA também podem conter incoerências extralinguísticas (chamadas de alucinações), ou seja, podem “inventar” fatos e dados, fazer referência a teorias, conceitos, lugares ou pessoas que não existem; dar informação falsa, entre outros problemas que não são facilmente identificáveis pelo leitor humano.

Considerando o contexto da autoria da redação, o principal desafio é definir quais features (características) são comuns em textos gerados pela tecnologia e, a partir disso, treinar modelos que combinem essas features com modelos estatísticos de probabilidade de co-ocorrência das palavras.

“Se pensarmos em todos os tipos de textos que o ChatGPT é capaz de gerar, como manuais de instrução, processos jurídicos, anúncios publicitários, linhas de código (em linguagem de programação), redações escolares, dentre centenas de outros, é extremamente difícil encontrar alguma característica que identifique, de forma inequívoca, um texto gerado por IA. Mas, quando analisamos um tipo ou um gênero textual específico, como é o caso de redação ou, mais especificamente, redação do Enem, é possível encontrar alguns desses padrões”, comenta a linguista computacional da Redação Nota Mil.

Plataforma - Pensando neste grande dilema da atualidade, a equipe de automação da plataforma desenvolveu uma solução própria específica para detectar redação escolar gerada por Inteligência Artificial. A solução contempla basicamente o seguinte processo: o aluno submete sua redação à Redação Nota 1000 e esse conteúdo passa por um sistema que detecta se o texto foi escrito por humano ou gerado (total ou parcialmente) por alguma Inteligência Artificial.

Depois, o sistema devolve para o corretor humano um percentual em três níveis (alto, médio e baixo risco de ter sido gerado por IA). Se a redação tiver ‘alta probabilidade’, a Redação Nota Mil vai penalizar o aluno zerando sua redação, assim como faz nos casos de plágio. Se tiver nível médio, o corretor poderá orientar o aluno para um uso mais apropriado e ético da inteligência artificial em seus estudos, assim como o professor e/ou a escola poderão decidir se querem penalizar ou não.

Amanda Rassi finaliza ponderando que essas ferramentas têm sua utilidade. “O ChatGPT, assim como websites, livros e mecanismos de busca como o Google Search são úteis como fontes de pesquisa. Essas inteligências gerativas também pode ser um bom recurso para fazer revisões ortográfica e gramatical, já que dificilmente cometem desvios e geralmente usam a norma culta da língua. Outra possibilidade é pedir que o Chat avalie uma redação escrita pelo aluno, tanto de forma global como por competência ou dê dicas de como melhorar partes específicas da redação. Naturalmente, é preciso avaliar a relevância da resposta, mas ela pode colaborar para o processo de escrita e reescrita de textos, que é inerente ao processo de aprendizagem. O grande X da questão é saber a dosagem certa desta utilização”, finaliza.

Redação Nota Mil: Em operação desde 2014, a Redação Nota 1000 é a maior plataforma de prática e correção de redações do Brasil. Primeira ferramenta a oferecer correção de redações online, a empresa já atendeu mais de 2 milhões de alunos e cerca de 3,5mil escolas, entre renomadas instituições educacionais do país (Rede Anglo, Pitágoras, pH, Mackenzie e outras) e já soma mais de 6.8 milhões de redações corrigidas. Atualmente, a ferramenta compõe o portfólio de marcas e soluções oferecidas pela Somos Educação.

Reportar Erro

Veja também