Mostrando postagens com marcador Armadilhas. Mostrar todas as postagens
Mostrando postagens com marcador Armadilhas. Mostrar todas as postagens

sábado, 28 de março de 2009

GRÁFICOS CIRCULARES - ARMADILHAS - PARTE ÚNICA

Tenha em mente que os gráficos circulares são para porcentagens, razões, frações, representações decimais ou qualquer outra aplicação para mostrar a relação de proporcionalidade entre a fatia e o todo. As tortas nunca devem ser usadas para mostrar valores absolutos.
Não está necessariamente errado indicar os valores absolutos juntamente com os valores de proporcionalidade, desde que estes estejam em primeiro plano. Quando as fatias das tortas são rotuladas com porcentagens ao invés de quantidades, o leitor irá focar corretamente na importância relativa das fatias ao invés de seus valores absolutos.

O gráfico circular a seguir indica o valor das fatias apenas pelos seus valores absolutos, dificultando ao leitor a comparação entre as partes, o que é justamente o objetivo deste tipo de desenho.

Gráfico circular comparando a mortalidade da tuberculose com a de outras doenças transmissíveis, indicando valores absolutos ao invés de uma medida de proporção. Valores absolutos em gráficos de torta dificultam o raciocínio do leitor. [Annuario de Estatística Demographo-Sanitaria de 1908, pelo Dr. Cássio de Rezende, Imprensa Nacional, Rio de Janeiro, 1910. Figura entre as páginas 26 e 27. Documento disponível em http://memoria.nemesis.org.br]

Além disso, como nos gráficos circulares os valores são sempre relativos ao total, não apresentam valores absolutos, e o valor do todo está quase sempre escondido de você; o que pode ser usado como um truque, ou como uma virtude deste tipo de gráfico. Quando você se perguntar qual o valor monetário de uma fatia que indica 26% num gráfico circular sobre vendas de um produto, você não saberá.

Por essas características, é importante saber quando é melhor usar um gráfico circular ou partir para outro tipo de representação gráfica. Para comparar valores, as retas, como no gráfico de barras, são muito mais eficazes. Para comparar apenas percentuais simples, use um gráfico circular.

Além disso, para pequenos conjuntos de dados, uma tabela quase sempre é melhor do que um gráfico de torta bobo, ou pior, vários deles. As tabelas são mais simples e ocupam menos espaço que gráficos de tortas, enquanto fazem o mesmo trabalho para conjuntos de poucos dados.

sexta-feira, 20 de março de 2009

GRÁFICOS DE BARRAS - ARMADILHAS - PARTE 3

O gráfico a seguir sofre do mesmo problema dos gráficos da postagem anterior, ou seja, o uso de figuras substituindo barras. Mas desta vez com a agravante do uso de uma perspectiva que distorce mais ainda o tamanho das figuras.

Na parte superior da figura, um gráfico compara o número de brasileiros deportados da Espanha entre 2000-2003 e 2004-2007, usando uma figura de mala como se fosse uma barra. Os números mostram um aumento de 43,4% nas deportações, como indicado pela seta que sai da mala menor à esquerda e se direciona para a mala maior à direita, e como representado quase que corretamente pela altura das malas, que indicam um aumento de 50% (isso sem considerar a altura das alças, um outro enfeite que confunde mais ainda o leitor).

Enquanto o que está sendo comparado é a altura das malas, o olho e a mente do leitor percebe o desenho inteiro e instintivamente compara a área das figuras, cuja diferença indica um aumento de 150%, três vezes mais que o real.

O mesmo ocorre com as malas na parte de baixo, que indicam um decréscimo de 53,9% na chegada de imigrantes brasileiros ilegais na Espanha, como é corretamente indicado pela altura das malas. Porém, as áreas sugerem um decréscimo de cerca de 76%.

Mas o uso das figuras de malas como barras não era o suficiente para envolver o leitor no clima de terminal de aeroporto. O produtor desenhou os gráficos sobre a figura de um passaporte aberto, cuja folha frontal não está paralela ao plano da imagem, mas ascende da esquerda para a direita. Esta inclinação produz uma perspectiva nas figuras, que contribui para que as malas da esquerda pareçam menores, ou pelo menos, visualmente menos importantes, que as malas da direita.

Há um bom indício de que o produtor do gráfico quer valorizar a notícia, exagerando a impressão sobre o número de deportados pelo Governo da Espanha, e minimizando o número de chegada de imigrantes ilegais brasileiros, induzindo o leitor à conclusão de que o aumento de rigor das ações do departamento de imigração do governo espanhol são injustificadas.

Esta conclusão pode até fazer sentido e ser o resultado final de uma análise mais detalhada do caso, porém não é tarefa do desenho do gráfico induzir o leitor a essa ou aquela conclusão. Cabe ao gráfico, e ao seu produtor, comunicar a informação da maneira mais neutra possível e evitar qualquer estratégia de desenho que distorça a representação visual.



Detalhe da figura de um passaporte aberto, cuja folha é representada em perspectiva. Sobre esta folha há o desenho de malas sendo usadas como barras, mas cuja variação da área não corresponde à variação da medida. [O Estado de São Paulo, 9 de março de 2008, pág. C1. Imagem digitalizada a partir do original]


Como discutido antes, os gráficos devem mostrar a variação nos dados, e não a variação do recipiente, ou se preferir, do desenho. Mas o uso de áreas e volumes vão contra este princípio. Usar áreas para mostrar dados unidimensionais é apenas um outro modo de confundir variação dos dados com variação de desenho. Variam-se duas ou três variáveis no desenho, para representar a variação de apenas uma medida.

Por isso Tufte [TUFTE, Edward Rolf, The Visual Display of Quantitative Information. Cheshire: Graphics Press, 2007, pág. 71] propõe o seguinte princípio: “O número de dimensões ilustradas carregando informação (variável) não deve exceder o número de dimensões nos dados”. Não use áreas ou volumes – ou seja, mais de uma dimensão - para demonstrar dados de uma variável.

Outras armadilhas são o uso de escalas diferentes entre as barras tanto no eixo de medida como no eixo da base, a utilização de eixos com valores de base diferentes de zero, ou o início das barras em posições diferentes. As escalas devem ser constantes, começar na mesma posição no eixo, e as escalas devem começar no zero.

sexta-feira, 13 de março de 2009

GRÁFICOS DE BARRAS - ARMADILHAS - PARTE 2

Mas nem todos os gráficos de barras são honestos. A comparação das barras confia na nossa percepção visual, e esta pode ser facilmente enganada. Olhe com suspeita para barras que mudam suas larguras junto com o seu comprimento quando representando somente um fator, para as barras que são truncadas, ou nas quais elas desenham objetos tridimensionais cujos volumes não são fáceis de comparar.

Gráfico no qual as barras são representadas por pirâmides, cujos volumes se alteram ao longo do comprimento. Duas variações de desenho para representar uma variável, que é a mortalidade causada pelo Beribéri no Rio de Janeiro entre 1874 e 1908, a cada 100.000 habitantes. [Annuario de Estatística Demographo-Sanitaria de 1908, pelo Dr. Cássio de Rezende, Imprensa Nacional, Rio de Janeiro, 1910. Figura entre as páginas 112 e 113. Documento disponível em http://memoria.nemesis.org.br/]

O uso de figuras substituindo as barras, com o alegado pretexto de ilustrar e tornar os gráficos mais atrativos, distorce a nossa percepção visual da quantidade sendo representada. Enquanto que geralmente é a altura da figura que está representando a medida, tanto a área quanto o volume aumentam mais rapidamente do que a altura, e sua mente percebe isso, mas isso não está de acordo com os números mostrados.

Um gráfico que mostra uma figura enorme ao lado de uma minúscula pode sugerir incorretamente uma diferença enorme, baseada no volume das figuras percebida pela sua mente; mas, no entanto, é a altura que está sendo comparada.

O uso de rótulos com valores numéricos é comum neste tipo de gráfico, para mitigar os efeitos da distorção das figuras, mas estas continuam mostrando somente valores relativos aproximados. Então para quê usar as figuras em primeiro lugar? Não seria melhor mostrar os números numa tabela, uma vez que as barras perderam o seu valor informativo?

Representação de uma variável, que aumenta em duas vezes. Em cada figura, a variação desta variável é representada pela variação de uma ou mais das dimensões das formas, a partir dos desenhos bases em (1) e (5).
A variação de cada medida deve ser representada pela variação de uma única dimensão no desenho, como no caso das barras de um gráfico de barras, no qual a medida é representada pela variação na altura, e a altura e a área da barra aumentam na mesma proporção (2). Quando isto não ocorre, há distorção na representação gráfica.

Um incremento de duas vezes na altura de uma figura em duas dimensões, sem distorcê-la, significa um incremento de duas vezes na largura, e com isso, a área que é uma função quadrada das dimensões, cresce quatro vezes, dando uma impressão visual de um aumento de quatro vezes, e não de duas vezes como os números do gráfico sugerem (3).

Mas se você utilizar uma figura tridimensional, a ilusão será maior, pois ao aumentar a sua altura em duas vezes, a largura e profundidade também aumentarão nessa proporção, e o volume variando ao cubo dessas dimensões irá sugerir visualmente um aumento de oito vezes, ao invés de quatro como no caso anterior (6).

No entanto, a variação de uma medida numa figura não necessariamente precisa ser representada pela altura, e pode ser representada também pela variação da área ou do volume. Nestes casos, a altura da figura será bem inferior a que seria se esta fosse a dimensão usada para representar a variável (4 e 7). Nestes casos o produtor deve deixar bem claro para o consumidor que a medida está sendo representada pela variação de área ou volume, para evitar que o leitor use o seu hábito de comparar a altura ao ver figuras colocadas lado a lado, como se fossem barras de um gráfico.

No gráfico a seguir é usada a figura de coluna para substituir as barras de um gráfico de barras. A variável (mortalidade por febre amarela) é representada pela altura das colunas, mas enquanto elas variam em altura, variam também em largura, e por conseqüência em área, passando a impressão visual de uma variação muito maior que a indicada pelos números. A coluna mais alta, referente aos anos de 1872-1876, indica 7754 mortes, enquanto que a coluna seguinte, dos anos 1877-1881, indica 2995 mortes, uma diminuição de cerca de 62%, corretamente representada pela altura das colunas. Mas o olho do leitor não percebe somente a altura, e sim a figura inteira, cuja variação de área sugere uma diminuição de 85%.




Gráfico mostrando a mortalidade de febre amarela no Rio de Janeiro entre 1867 a 1916. O uso da figura de coluna implica a variação da altura e largura, enquanto que a medida está sendo representada somente pela altura. [Annuario de Estatística Demographo-Sanitaria de 1915-1916, pelo Dr. Sampaio Vianna, Imprensa Nacional, Rio de Janeiro, 1926. Figura entre as páginas 114 e 115. Documento disponível em http://memoria.nemesis.org.br]

GRÁFICOS DE BARRAS - ARMADILHAS - PARTE 1

No entanto, enquanto barras horizontais são um meio matematicamente correto de representar quantidades, eles não comunicam a idéia eficazmente, pois desafiam a noção de que esquerda e direita denotam a passagem do tempo, e não quantidades, que são melhor representadas com variações verticais.

Como Jones [JONES, Gerald Everett. How to Lie with Charts: Second Edition: Second Edition. Santa Monica: La Puerta Productions, 2007, pág. 76 e 77] afirma, “deitar um gráfico vertical no seu lado pode ser uma forma sutil de mentira porque você confunde o significado intuitivo de em cima e em baixo e de esquerda e direita”. E complementa: “O formato horizontal é enganador por que a audiência irá precisar de um momento – mesmo que breve – para se ajustar ao desenho contra intuitivo”.

Mas as barras horizontais são um excelente meio de mostrar durações de tempo. Um exemplo dessa aplicação das barras horizontais são os gráficos de Grantt, que são largamente usados para gerenciar projetos, e geralmente podem ser gerados por programas de gerenciamento de projetos, como o Microsoft Project. Eles mostram a duração de cada tarefa e a relação no tempo entre cada uma; barras sobrepostas mostrando o tempo planejado para cada tarefa e o tempo realmente usado indicam facilmente a eficiência da execução da tarefa; além disso, o efeito do deslocamento de uma ou mais tarefas que são interligadas a outras pode ser claramente percebido por barras que avançam e empurram as demais à frente, mostrando o efeito do deslocamento dessas tarefas em particular com o prazo final para conclusão do projeto.


Exemplo de gráfico de Grantt gerado pelo Microsoft Project. O comprimento das barras indica a duração da tarefa, e as setas indicam as suas inter-relações.