“Estamos só no começo da machine learning”, diz pesquisadora do Google

A pesquisadora-sênior do Google Fernanda Viégas. Foto: divulgação

Clarice Cudischevitch

A área da computação vive, atualmente, mudanças de paradigmas que vêm reconstruindo a história da humanidade. A observação é da pesquisadora-sênior do Google Fernanda Viégas, que estará no Rio de Janeiro no dia 12 de novembro para falar sobre visualização de dados no segundo encontro de cientistas grantees do Instituto Serrapilheira.

No Google, a brasileira lidera o PAIR (People + AI Research), que desenvolve pesquisas em inteligência artificial. Ela é um dos maiores nomes mundiais da área de visualização de dados, conhecida como datavis – abreviação de data visualization. Seu objetivo, segundo Viégas, nada mais é do que “usar números para criar imagens”.

“A visualização faz com que qualquer pessoa, leiga ou não, consiga entender um número grande de dados ao mesmo tempo, usando a capacidade visual de entender padrões”, explica Viégas. Segundo a especialista, o cérebro humano é excelente nessa função: somos capazes de compreender uma coleção inteira de símbolos visuais. “Em vez de ter que prestar atenção em um monte de números de uma planilha, criamos uma imagem deles e, assim, compreendemos muito mais dos padrões que estão naqueles dados.”

Por isso, datavis tem o papel importante de tornar a informação, sobretudo, acessível e democrática. “Muitas pessoas não entendem conceitos estatísticos, mas se virem uma visualização, vão compreender o que é uma distribuição de dados, uma correlação, um ponto fora da curva sem que ninguém explique”, destaca Viégas. “Quando vemos um mapa das eleições no Brasil, imediatamente entendemos que o Nordeste votou de um jeito e o Sudeste de outro, mas ali há milhares de números. Imagina se a informação fosse dada em uma planilha?”

Ao mesmo tempo, a visualização consegue apresentar um cenário geral sem que se perca os detalhes. No exemplo do mapa das eleições, ainda que se veja como a maioria votou no Sudeste ou no Nordeste, é possível identificar que há pequenos pontos que foram para outros partidos. “Temos a visão do macro sem perder a noção do micro. Isso é superimportante para cientistas.”

“Linha do tempo da música”, um dos projetos de visualização de dados de Viégas, que observa como diferentes gêneros musicais se tornaram populares ao longo do tempo. Foto: divulgação

Mais do que facilitar a leitura de dados para qualquer pessoa, datavis pode ser uma ferramenta poderosa para pesquisadores. Viégas deu um exemplo de uma das visualizações mais famosas criadas pelo seu grupo, que exibe todas as correntes de vento nos Estados Unidos em tempo real. “São muitos dados sendo gerados a cada segundo por sensores de vento no país inteiro, medidos e transformados em uma imagem que qualquer um pode entender sem ter que olhar nenhum número.”

Na época, o mapa foi feito como um trabalho de arte. Acabou, no entanto, sendo útil para cientistas que estudam migração de pássaros e borboletas e nunca tinham visto antes uma imagem de padrões eólicos. “Eles consultam essa visualização todos os dias para ver como as correntes influenciam o padrão de migração desses animais”, conta Viégas, acrescentando que o mapa também é usado por pilotos e bombeiros. Ele está disponível em http://hint.fm/wind.

Machine learning

Seu grupo de pesquisa trabalha com datavis associada à área que, atualmente, é a maior fronteira tecnológica do Google: machine learning, a aprendizagem de máquinas. “Essa é uma tecnologia tão poderosa porque, pela primeira vez na história da computação e da humanidade, conseguimos mudar o paradigma de como construímos elementos computacionais.”

Até então, a computação se baseava em algoritmos, criando programas que explicassem para a máquina todas as regras para resolver um determinado problema. Em um programa de visualização de mapas, por exemplo, testa-se todas as ruas possíveis para ir do ponto A ao B. Se é encontrado um obstáculo, uma contramão, ele volta e tenta de novo. “Eu dito todas as regras de como o algoritmo deve se comportar em cada um dos cenários, tenho que explicar tudo para ele. É ótimo, mas só funciona quando conhecemos todas as regras, e muitas vezes não é assim.”

No caso de machine learning, em vez de serem programadas regras para todos os cenários, são apresentados à máquina milhares de exemplos – rostos de pessoas, por exemplo – e “ensina-se” ao computador o que é um rosto e o que não é. Aos poucos, ele aprende por si só a fazer a identificação. “Com isso, podemos começar a investigar computacionalmente muitos problemas que antes não tínhamos como.”

Viégas contou um episódio que aconteceu em uma área rural da Índia, onde uma equipe do Google Brain, outro grupo de pesquisa, foi testar um sistema que desenvolveu para diagnosticar retinopatia diabética. A partir de um exame de fundo de olho, é possível identificar se o paciente é candidato a ter diabetes ou não. Para a surpresa do grupo, no entanto, o sistema começou a aprender outros dois fatores não previstos ao observar os olhos dos indivíduos: o sexo deles e a predisposição a doenças cardiovasculares nos cinco anos seguintes.

“O que esses sistemas estão aprendendo olhando essas imagens que os médicos não conseguiram aprender?”, questionou a pesquisadora. É nesse ponto que datavis intersecciona com machine learning, ao ajudar na interpretação desses sistemas para entender o que e como eles estão aprendendo. “É como se a visualização fosse uma máquina de ressonância magnética que escaneasse o ‘cérebro’ da machine learning.”

Viégas relatou uma história, que nunca conseguiu descobrir se é uma lenda ou não, sobre um dos primeiros sistemas de machine learning bem-sucedidos. Ele deveria ser capaz de identificar tanques militares em imagens e, após vários testes, se revelou bastante preciso. No entanto, ao ser aplicado, com imagens de batalhas propriamente ditas, passou a falhar. “Viram, então, uma infeliz coincidência: nos testes, em todas as imagens usadas, o céu estava azul, mas, na prática, havia fotos com céu nublado, nas quais o sistema estava errando. Ou seja, ele não estava prestando atenção nos tanques, mas no dia ensolarado.”

De fato, ainda há muito a avançar. Apesar de inteligência artificial já existir há 50 anos, machine learning, que é uma parte desta disciplina, se desenvolveu há cerca de apenas dez anos. A área passou por um grande “inverno”, quando os computadores não eram potentes o bastante para aprender e não havia dados suficientes. “Esses sistemas ainda estão aprendendo coisas sobre o mundo. Estamos só no começo”, ressalta Viégas.