terça-feira, 31 de março de 2009

TORTAS AZEDAS - CASO 3

Já o gráfico abaixo que mostra os benefícios a empregados de uma grande empresa brasileira, apresenta a rotulação direta ao invés da legenda, o que facilita a leitura. No entanto, há muitas fatias pequenas (entre elas há quatro fatias com o valor de 1%) que são difíceis de visualizar, o que dificulta a comparação entre cada fatia e o todo.

Este não é um caso extremo, como o dos gráficos de torta com dezenas de fatias; mesmo este tipo de gráfico ainda se mostra adequado para esta situação. Entretanto, o uso de uma tabela, ou um gráfico de barras, seriam outras boas opções.

Gráfico de barras do relatório social anual de uma grande empresa, mostrando os benefícios a empregados. Note a quantidade de fatias muito pequenas, que dificultam a comparação entre as partes e o todo.

segunda-feira, 30 de março de 2009

TORTAS AZEDAS - CASO 2

O gráfico a seguir é um caso onde não há erros, mas que poderia ser facilmente melhorado. Ele mostra o valor dos estoques de uma grande estatal brasileira, em gráfico de torta, com apenas quatro valores. Ele poderia ser facilmente rotulado diretamente, dispensando a legenda logo em baixo, facilitando a sua leitura e comparação entre as partes.

Gráfico de torta retirado do relatório anual de uma estatal brasileira. Ele poderia ser melhorado com uma rotulação direta, dispensando a legenda logo abaixo.

domingo, 29 de março de 2009

TORTAS AZEDAS - CASO 1

O gráfico a seguir é um exemplo de uso equivocado dos gráficos de tortas. Este tipo de desenho deve ser usado para representar proporções, relações, porcentagens, ou qualquer outra medida de relação entre um todo e suas partes.

Este gráfico não indica a relação entre as fatias e o todo. O leitor só sabe o valor absoluto de cada fatia. Para saber o valor absoluto de toda a torta, deverá somar o valor de todas as fatias, e caso deseje saber a relação entre as partes e o todo, deverá dividir o valor de cada fatia pelo valor total da torta. Depois de constatado todo este trabalho, não seria melhor ter apresentado os valores um uma tabela? Afinal, o objetivo deste tipo de gráfico, que é a comparação, foi totalmente derrubado pela inabilidade do produtor.

Gráfico retirado do relatório de um programa das Nações Unidas. Gráficos de tortas podem até indicar valores absolutos, desde que indiquem as relações em primeiro plano, para dar o enfoque correto ao leitor.

sábado, 28 de março de 2009

GRÁFICOS CIRCULARES - ARMADILHAS - PARTE ÚNICA

Tenha em mente que os gráficos circulares são para porcentagens, razões, frações, representações decimais ou qualquer outra aplicação para mostrar a relação de proporcionalidade entre a fatia e o todo. As tortas nunca devem ser usadas para mostrar valores absolutos.
Não está necessariamente errado indicar os valores absolutos juntamente com os valores de proporcionalidade, desde que estes estejam em primeiro plano. Quando as fatias das tortas são rotuladas com porcentagens ao invés de quantidades, o leitor irá focar corretamente na importância relativa das fatias ao invés de seus valores absolutos.

O gráfico circular a seguir indica o valor das fatias apenas pelos seus valores absolutos, dificultando ao leitor a comparação entre as partes, o que é justamente o objetivo deste tipo de desenho.

Gráfico circular comparando a mortalidade da tuberculose com a de outras doenças transmissíveis, indicando valores absolutos ao invés de uma medida de proporção. Valores absolutos em gráficos de torta dificultam o raciocínio do leitor. [Annuario de Estatística Demographo-Sanitaria de 1908, pelo Dr. Cássio de Rezende, Imprensa Nacional, Rio de Janeiro, 1910. Figura entre as páginas 26 e 27. Documento disponível em http://memoria.nemesis.org.br]

Além disso, como nos gráficos circulares os valores são sempre relativos ao total, não apresentam valores absolutos, e o valor do todo está quase sempre escondido de você; o que pode ser usado como um truque, ou como uma virtude deste tipo de gráfico. Quando você se perguntar qual o valor monetário de uma fatia que indica 26% num gráfico circular sobre vendas de um produto, você não saberá.

Por essas características, é importante saber quando é melhor usar um gráfico circular ou partir para outro tipo de representação gráfica. Para comparar valores, as retas, como no gráfico de barras, são muito mais eficazes. Para comparar apenas percentuais simples, use um gráfico circular.

Além disso, para pequenos conjuntos de dados, uma tabela quase sempre é melhor do que um gráfico de torta bobo, ou pior, vários deles. As tabelas são mais simples e ocupam menos espaço que gráficos de tortas, enquanto fazem o mesmo trabalho para conjuntos de poucos dados.

sexta-feira, 27 de março de 2009

GRÁFICOS CIRCULARES - INTRODUÇÃO

Os gráficos circulares também são conhecidos como gráficos de pizza ou de torta. Eles são utilizados quando queremos perceber a relação entre as partes e o todo. Mas também têm suas limitações.

Primeiramente, estes gráficos só devem ser usados com medidas de proporção, nunca com valores absolutos. Além disso, eles funcionam efetivamente apenas quando as fatias são substanciais; fatias demais resultam em porções impossíveis de comparar ou até de detectar. E também, a área do círculo é uma forma inadequada para comparar quantidades simples, porque é impossível compreender pelo olhar a relação entre o diâmetro e a área de um círculo.

Hoje os gráficos de tortas são muito populares, por serem muito fáceis de serem criados no computador. Ao mesmo tempo, são tão propensos a serem mal usados ou distorcerem os dados, que Jones [JONES, Gerald Everett. How to Lie with Charts: Second Edition: Second Edition. Santa Monica: La Puerta Productions, 2007, pág. 19] brinca ao escrever: “Tortas: quando estiver em dúvida, jogue uma neles!

Um bom exemplo de gráfico de torta, mostrando a distribuição das vagas de emprego nos setores do mercado de trabalho. Não há excesso de fatias, e nem fatias muito pequenas. Este tipo de comparação é o uso ideal para este tipo de gráfico. [O Estado de São Paulo, 16 de setembro de 2007, pág. Ce4. Imagem digitalizada a partir do original]

No gráfico circular a seguir, apenas as bordas do círculo são representadas, formando o que é conhecido como gráfico de rosca. Este tipo de gráfico tem a vantagem de evitar um problema intrínseco dos gráficos de torta, que é a dificuldade visual de se distinguir a relação entre o raio do círculo, que é constante, e a área do círculo que representa o valor da variável, e varia em uma proporção do quadrado do raio, portanto não linear.

Gráfico de rosca retirado do relatório anual de um grande banco brasileiro. Um bom exemplo de gráfico: simples, sem excesso de fatias, e com rotulação direta.

quinta-feira, 26 de março de 2009

BARRAS INDIGESTAS - CASO 2

Um outro exemplo é o gráfico abaixo retirado do relatório anual da mesma empresa do exemplo anterior. Nele são mostrados os custos dos produtos vendidos em Reais, por determinada unidade do produto.

Novamente a base diferente de zero passa a impressão errada quando comparamos e proporcionamos as barras do gráfico. As variações são visualmente exageradas quando comparadas com as variações dos números.

Gráfico com os custos dos produtos vendidos em R$ por determinada unidade do produto, com escala diferente de zero. Mais um exemplo de gráfico enganoso em relatórios anuais.

Este tipo de desenho enganoso é o mais comum. É largamente usado pelos produtores, pois é simples e pode facilmente ser justificado como inocente. Mas ao mesmo tempo, é facilmente detectado pelo leitor atento.

terça-feira, 24 de março de 2009

BARRAS INDIGESTAS - CASO 1

Gráficos que não começam no zero muitas vezes são propositalmente usados para enganar, pois exageram as variações. O gráfico abaixo do relatório anual de uma grande empresa brasileira ilustra a parcela do mercado a qual a empresa ocupa. Um olhar de relance no gráfico sugere que a sua parcela de participação no mercado cresceu cerca 2,5 vezes ou 250% de 2004 a 2006, mas prestando atenção na escala percebe-se que aumentou de fato cerca de 4% em relação a 2004. Este é um tipo de truque usado para enganar e confundir o leitor incauto.


Gráfico da participação de mercado retirado do relatório anual de uma grande empresa brasileira. Um exemplo de gráfico que não começa no zero, e faz parecer que as diferenças são maiores do que realmente são.

Gráficos como este são populares em relatórios anuais, pois podem facilmente fazer parecer que o faturamento da empresa aumentou em um terço, quando na realidade subiu apenas um vigésimo.

Dependendo do ponto que você escolhe como base, eles podem exagerar mais ou menos as variações, ou se concentrar em partes especialmente selecionadas da escala, a fim de corroborar o ponto de vista do produtor.

Embora eles sejam tecnicamente corretos, dão margem a conclusões contraditórias e a suspeitas sobre as intenções de quem os desenhou.

sexta-feira, 20 de março de 2009

GRÁFICOS DE BARRAS - ARMADILHAS - PARTE 3

O gráfico a seguir sofre do mesmo problema dos gráficos da postagem anterior, ou seja, o uso de figuras substituindo barras. Mas desta vez com a agravante do uso de uma perspectiva que distorce mais ainda o tamanho das figuras.

Na parte superior da figura, um gráfico compara o número de brasileiros deportados da Espanha entre 2000-2003 e 2004-2007, usando uma figura de mala como se fosse uma barra. Os números mostram um aumento de 43,4% nas deportações, como indicado pela seta que sai da mala menor à esquerda e se direciona para a mala maior à direita, e como representado quase que corretamente pela altura das malas, que indicam um aumento de 50% (isso sem considerar a altura das alças, um outro enfeite que confunde mais ainda o leitor).

Enquanto o que está sendo comparado é a altura das malas, o olho e a mente do leitor percebe o desenho inteiro e instintivamente compara a área das figuras, cuja diferença indica um aumento de 150%, três vezes mais que o real.

O mesmo ocorre com as malas na parte de baixo, que indicam um decréscimo de 53,9% na chegada de imigrantes brasileiros ilegais na Espanha, como é corretamente indicado pela altura das malas. Porém, as áreas sugerem um decréscimo de cerca de 76%.

Mas o uso das figuras de malas como barras não era o suficiente para envolver o leitor no clima de terminal de aeroporto. O produtor desenhou os gráficos sobre a figura de um passaporte aberto, cuja folha frontal não está paralela ao plano da imagem, mas ascende da esquerda para a direita. Esta inclinação produz uma perspectiva nas figuras, que contribui para que as malas da esquerda pareçam menores, ou pelo menos, visualmente menos importantes, que as malas da direita.

Há um bom indício de que o produtor do gráfico quer valorizar a notícia, exagerando a impressão sobre o número de deportados pelo Governo da Espanha, e minimizando o número de chegada de imigrantes ilegais brasileiros, induzindo o leitor à conclusão de que o aumento de rigor das ações do departamento de imigração do governo espanhol são injustificadas.

Esta conclusão pode até fazer sentido e ser o resultado final de uma análise mais detalhada do caso, porém não é tarefa do desenho do gráfico induzir o leitor a essa ou aquela conclusão. Cabe ao gráfico, e ao seu produtor, comunicar a informação da maneira mais neutra possível e evitar qualquer estratégia de desenho que distorça a representação visual.



Detalhe da figura de um passaporte aberto, cuja folha é representada em perspectiva. Sobre esta folha há o desenho de malas sendo usadas como barras, mas cuja variação da área não corresponde à variação da medida. [O Estado de São Paulo, 9 de março de 2008, pág. C1. Imagem digitalizada a partir do original]


Como discutido antes, os gráficos devem mostrar a variação nos dados, e não a variação do recipiente, ou se preferir, do desenho. Mas o uso de áreas e volumes vão contra este princípio. Usar áreas para mostrar dados unidimensionais é apenas um outro modo de confundir variação dos dados com variação de desenho. Variam-se duas ou três variáveis no desenho, para representar a variação de apenas uma medida.

Por isso Tufte [TUFTE, Edward Rolf, The Visual Display of Quantitative Information. Cheshire: Graphics Press, 2007, pág. 71] propõe o seguinte princípio: “O número de dimensões ilustradas carregando informação (variável) não deve exceder o número de dimensões nos dados”. Não use áreas ou volumes – ou seja, mais de uma dimensão - para demonstrar dados de uma variável.

Outras armadilhas são o uso de escalas diferentes entre as barras tanto no eixo de medida como no eixo da base, a utilização de eixos com valores de base diferentes de zero, ou o início das barras em posições diferentes. As escalas devem ser constantes, começar na mesma posição no eixo, e as escalas devem começar no zero.

sexta-feira, 13 de março de 2009

GRÁFICOS DE BARRAS - ARMADILHAS - PARTE 2

Mas nem todos os gráficos de barras são honestos. A comparação das barras confia na nossa percepção visual, e esta pode ser facilmente enganada. Olhe com suspeita para barras que mudam suas larguras junto com o seu comprimento quando representando somente um fator, para as barras que são truncadas, ou nas quais elas desenham objetos tridimensionais cujos volumes não são fáceis de comparar.

Gráfico no qual as barras são representadas por pirâmides, cujos volumes se alteram ao longo do comprimento. Duas variações de desenho para representar uma variável, que é a mortalidade causada pelo Beribéri no Rio de Janeiro entre 1874 e 1908, a cada 100.000 habitantes. [Annuario de Estatística Demographo-Sanitaria de 1908, pelo Dr. Cássio de Rezende, Imprensa Nacional, Rio de Janeiro, 1910. Figura entre as páginas 112 e 113. Documento disponível em http://memoria.nemesis.org.br/]

O uso de figuras substituindo as barras, com o alegado pretexto de ilustrar e tornar os gráficos mais atrativos, distorce a nossa percepção visual da quantidade sendo representada. Enquanto que geralmente é a altura da figura que está representando a medida, tanto a área quanto o volume aumentam mais rapidamente do que a altura, e sua mente percebe isso, mas isso não está de acordo com os números mostrados.

Um gráfico que mostra uma figura enorme ao lado de uma minúscula pode sugerir incorretamente uma diferença enorme, baseada no volume das figuras percebida pela sua mente; mas, no entanto, é a altura que está sendo comparada.

O uso de rótulos com valores numéricos é comum neste tipo de gráfico, para mitigar os efeitos da distorção das figuras, mas estas continuam mostrando somente valores relativos aproximados. Então para quê usar as figuras em primeiro lugar? Não seria melhor mostrar os números numa tabela, uma vez que as barras perderam o seu valor informativo?

Representação de uma variável, que aumenta em duas vezes. Em cada figura, a variação desta variável é representada pela variação de uma ou mais das dimensões das formas, a partir dos desenhos bases em (1) e (5).
A variação de cada medida deve ser representada pela variação de uma única dimensão no desenho, como no caso das barras de um gráfico de barras, no qual a medida é representada pela variação na altura, e a altura e a área da barra aumentam na mesma proporção (2). Quando isto não ocorre, há distorção na representação gráfica.

Um incremento de duas vezes na altura de uma figura em duas dimensões, sem distorcê-la, significa um incremento de duas vezes na largura, e com isso, a área que é uma função quadrada das dimensões, cresce quatro vezes, dando uma impressão visual de um aumento de quatro vezes, e não de duas vezes como os números do gráfico sugerem (3).

Mas se você utilizar uma figura tridimensional, a ilusão será maior, pois ao aumentar a sua altura em duas vezes, a largura e profundidade também aumentarão nessa proporção, e o volume variando ao cubo dessas dimensões irá sugerir visualmente um aumento de oito vezes, ao invés de quatro como no caso anterior (6).

No entanto, a variação de uma medida numa figura não necessariamente precisa ser representada pela altura, e pode ser representada também pela variação da área ou do volume. Nestes casos, a altura da figura será bem inferior a que seria se esta fosse a dimensão usada para representar a variável (4 e 7). Nestes casos o produtor deve deixar bem claro para o consumidor que a medida está sendo representada pela variação de área ou volume, para evitar que o leitor use o seu hábito de comparar a altura ao ver figuras colocadas lado a lado, como se fossem barras de um gráfico.

No gráfico a seguir é usada a figura de coluna para substituir as barras de um gráfico de barras. A variável (mortalidade por febre amarela) é representada pela altura das colunas, mas enquanto elas variam em altura, variam também em largura, e por conseqüência em área, passando a impressão visual de uma variação muito maior que a indicada pelos números. A coluna mais alta, referente aos anos de 1872-1876, indica 7754 mortes, enquanto que a coluna seguinte, dos anos 1877-1881, indica 2995 mortes, uma diminuição de cerca de 62%, corretamente representada pela altura das colunas. Mas o olho do leitor não percebe somente a altura, e sim a figura inteira, cuja variação de área sugere uma diminuição de 85%.




Gráfico mostrando a mortalidade de febre amarela no Rio de Janeiro entre 1867 a 1916. O uso da figura de coluna implica a variação da altura e largura, enquanto que a medida está sendo representada somente pela altura. [Annuario de Estatística Demographo-Sanitaria de 1915-1916, pelo Dr. Sampaio Vianna, Imprensa Nacional, Rio de Janeiro, 1926. Figura entre as páginas 114 e 115. Documento disponível em http://memoria.nemesis.org.br]

GRÁFICOS DE BARRAS - ARMADILHAS - PARTE 1

No entanto, enquanto barras horizontais são um meio matematicamente correto de representar quantidades, eles não comunicam a idéia eficazmente, pois desafiam a noção de que esquerda e direita denotam a passagem do tempo, e não quantidades, que são melhor representadas com variações verticais.

Como Jones [JONES, Gerald Everett. How to Lie with Charts: Second Edition: Second Edition. Santa Monica: La Puerta Productions, 2007, pág. 76 e 77] afirma, “deitar um gráfico vertical no seu lado pode ser uma forma sutil de mentira porque você confunde o significado intuitivo de em cima e em baixo e de esquerda e direita”. E complementa: “O formato horizontal é enganador por que a audiência irá precisar de um momento – mesmo que breve – para se ajustar ao desenho contra intuitivo”.

Mas as barras horizontais são um excelente meio de mostrar durações de tempo. Um exemplo dessa aplicação das barras horizontais são os gráficos de Grantt, que são largamente usados para gerenciar projetos, e geralmente podem ser gerados por programas de gerenciamento de projetos, como o Microsoft Project. Eles mostram a duração de cada tarefa e a relação no tempo entre cada uma; barras sobrepostas mostrando o tempo planejado para cada tarefa e o tempo realmente usado indicam facilmente a eficiência da execução da tarefa; além disso, o efeito do deslocamento de uma ou mais tarefas que são interligadas a outras pode ser claramente percebido por barras que avançam e empurram as demais à frente, mostrando o efeito do deslocamento dessas tarefas em particular com o prazo final para conclusão do projeto.


Exemplo de gráfico de Grantt gerado pelo Microsoft Project. O comprimento das barras indica a duração da tarefa, e as setas indicam as suas inter-relações.

sexta-feira, 6 de março de 2009

GRÁFICOS DE BARRAS - INTRODUÇÃO

Os gráficos de barras são usados para comparar quantidades. A altura ou comprimento das barras representa a quantidade. Se você tem uma reta, pode facilmente verificar se ela é duas vezes maior do que uma outra colocada ao lado.
Os gráficos de barras podem apresentar tanto barras verticais quanto horizontais, como nos exemplos abaixo:



Exemplo de um bom gráfico de barras vertical, mostrando a taxa de investimento no Brasil em relação ao PIB. Note que embora as variações sejam pequenas, o produtor do gráfico fez a escolha correta de manter a base das barras em zero. [O Estado de São Paulo, 16 de setembro de 2007, pág. B4. Imagem digitalizada a partir do original]





 




 











Exemplos de gráficos de barras horizontais. Á esquerda [O Estado de São Paulo, 16 de setembro de 2007, pág. B20. Imagem digitalizada a partir do original], mostrando o aumento de preço de diversos tipos de leite em relação a um índice que mede a inflação. À direita [Guia de Investimentos em Ações – BB Estilo. Imagem digitalizada a partir do original], a rentabilidade de diversos tipos de carteiras de investimento; a base não-zero faz parecer que as diferenças entre os valores são maiores do que realmente são.

Mas os gráficos de barras não se restringem ao uso de barras paralelas para comparação de comprimento. Uma aplicação bem interessante é apresentada em “Understanding USA”, no qual o arquiteto de informação Nigel Holmes apresenta um conceito novo em gráficos de barras. O valor é representado pela largura das barras, e várias barras podem se fundir para representar uma soma ou se dividir em várias outras para representar uma divisão, com as suas novas larguras representando o resultado dessas operações. Este tipo de representação é chamado de cosmográfico, e é particularmente eficiente em mostrar como entradas e saídas iguais são distribuídas, como por exemplo, em assuntos relacionados a dinheiro.






Gráfico de barras de Understanding USA [WURMAN, Richard Saul, DIVERSOS, 2000. Understanding USA. Excerto da pág. 4 do capítulo 2. Disponível em http://www.understandingusa.com], de Nigel Holmes, mostrando as despesas federais a partir da arrecadação. A espessura das barras denota o valor numérico, que pode ser visualmente comparado com a origem e as outras parcelas.

Este tipo de gráfico está sendo usado em relatórios anuais de algumas empresas, para representar as receitas e os gastos, pois é uma ótima maneira de conseguir visualmente relacionar as parcelas (diversas receitas) e o todo (o total de receitas e as reservas), e depois o todo e suas novas parcelas (os gastos e investimentos que saíram das receitas e reservas).