Brasileiros criam detector de fake news no WhatsApp
Sistema identifica, com 90% de precisão, notícias que são totalmente verdadeiras ou falsas
Quantas vezes você já leu uma notícia circulando pela internet e gostaria de checar a veracidade do conteúdo? Agora, já é possível fazer essa verificação usando uma ferramenta criada por um grupo de pesquisadores da Universidade de São Paulo (USP) e da Universidade Federal de São Carlos (UFSCar). A plataforma está em fase de testes, mas já é possível acessá-la gratuitamente via web ou pelo WhatsApp.
Segundo os pesquisadores, no estado atual, o sistema identifica, com 90% de precisão, notícias que são totalmente verdadeiras ou falsas. "No entanto, as pessoas que propagam fake news costumam embasar suas mentiras em fatos verdadeiros. Nossa plataforma ainda não tem a capacidade de separar as informações com esse nível de refinamento, mas estamos trabalhando para isso", explica o professor Thiago Pardo, da USP.
O usuário pode acessar a ferramenta de duas formas - pelo seu navegador, ou pelo próprio WhatsApp. O primeiro modo é mais simples. Basta clicar neste link e depois copiar o texto de uma notícia na caixa indicada.
O sistema irá processar os dados para identificar características de escrita, como palavras usadas ou classes gramaticais mais frequentes, e utilizar essas informações em um modelo de aprendizado de máquina que classificará a notícia em verdadeira ou falsa.
A checagem pelo WhatsApp é feita por um bot (robô digital) que analisa as informações. Para ter acesso a ele basta clicar neste link por meio de um smartphone. Automaticamente, uma janela de troca de mensagens se abrirá. Depois, basta seguir as instruções indicadas.
A verificação de notícia verdadeira ou falsa não passa pela checagem humana. Para isso, o grupo de pesquisadores usou técnicas de machine learning para ensinar o bot a diferenciar os dois tipos de informação.
Em um primeiro momento, o grupo construiu um banco de dados com a mesma quantidade de notícias falsas e verdadeiras, 3,6 mil de cada, totalizando 7,2 mil exemplares entre entre janeiro de 2016 e janeiro de 2018.
As notícias são primordialmente sobre política (58% do total), mas envolvem outras áreas como celebridades e TV, ciência e tecnologia e até religião. Com isso, o grupo passou a avaliar variações como tamanho do texto, riqueza do vocabulário, número de cada classe gramatical (verbo, adjetivo, advérbio) e erros ortográficos.
A conclusão a que o grupo chegou é de que, em grande parte, o maior diferencial entre verdadeiro ou falso são as palavras escritas erradas. "Das 3,6 mil notícias falsas que coletamos, 36% possuíam algum erro ortográfico, enquanto apenas 3% das verdadeiras apresentavam esse problema", explica o doutorando Roney Lira, da USP.
LeiaJá também