Visualização de dados, uma aliada da ciência

Fernanda Viégas. Foto: Francisco Costa

Clarice Cudischevitch

Como a visualização de dados pode ajudar na pesquisa científica? O terceiro dia do Encontros Serrapilheira reuniu 64 grantees para uma imersão nesta área que é responsável por “transformar números em imagens”. O workshop foi conduzido pela especialista Fernanda Viégas, pesquisadora-sênior do Google e co-líder de um grupo de pesquisa na empresa sobre inteligência artificial.

A visualização de dados é uma ferramenta poderosa para tornar dados, muitas vezes complexos, mais acessíveis, e pode ser útil não apenas para a ciência, mas para a comunicação e a arte. No Encontros Serrapilheira, os três foram reunidos para uma surpresa apresentada aos grantees, no início do dia: círculos coloridos, criados a partir das palavras mais frequentes de artigos publicados por eles, foram projetados nas paredes e no teto do salão, em uma experiência imersiva. A visualização também pode ser conferida no site do Serrapilheira.

Experiência imersiva de visualização de dados, com Fernanda Viégas à frente. Foto: Francisco Costa

No grupo de pesquisa PAIR (People + AI Research), Viégas lidera um time que desenha sistemas de inteligência artificial começando pelo fator humano. “Essa área tem muito de matemática e é preciso prestar atenção em números, mas primeiro vem a necessidade humana”, comentou.

Ela deu um exemplo de uma visualização criada a partir do mecanismo do Google que completa frases pesquisadas por usuários a partir das buscas mais frequentes. Enquanto na pesquisa “Meu marido está…” a frase é completada com “me traindo”, a frase “Minha esposa está” é finalizada com “depressiva”. “Pensamos em dados como coisas formais, governamentais, mas estamos lidando com vidas de pessoas.”

Muitas vezes, a visualização de dados possibilitou insights científicos, que permitiram grandes mudanças. No século 19, o médico inglês John Snow, um dos pais da epidemiologia moderna, analisou um mapa de Londres para buscar o motivo de um surto de cólera que, na época, acreditava-se que se propagava pelo ar. Ao ver as áreas das mortes pela doença, ele percebeu que se concentravam na região de um poço, descobrindo, que, na verdade, a cólera se pegava pela água.

“Fazer o difícil ficar fácil é difícil”, brincou Viégas, destacando que as informações em datavis (como é conhecida a visualização de dados) não são complicadas de se ler, mas de se fazer. Um de seus projetos mais emblemáticos foi a visualização da Wikipedia. Em 2003, quando era lançada a enciclopédia online, Viégas, então estagiária na IBM, e Martin Wattenberg, seu chefe à época e atual colega, fizeram um mapeamento da edição dos artigos no site.

Eles observaram diferentes padrões de edição – enquanto um usuário, por exemplo, só editava textos sobre vinhos e cervejas, outro colocava datas de nascimento e morte de pessoas. Viu, ainda, que artigos de letras do começo do alfabeto tinham probabilidade maior de serem editados. “A pessoa decidia editar artigos sobre mapas, começava da letra A, depois cansava e não continuava”, contou.

No workshop, Viégas desafiou os grantees a apresentarem propostas de visualização para uma tabela com dados complexos. Depois, apresentou algumas ferramentas úteis para se trabalhar com datavis. Alguns exemplos são D3 Library, uma biblioteca de visualização; Flourish, uma plataforma criada por jornalistas cujo objetivo é que o usuário não precise fazer programação; Color Brewer, para cartografia; Plottable.js; three.js; e uma ferramenta criada por seu grupo para o Google Spreadsheets, que traz, na aba “Explore”, muitos tipos de gráficos prontos para serem usados.