quarta-feira, 29 de abril de 2009

TORTAS AZEDAS - CASO 4

O gráfico de torta abaixo foi retirado do relatório social anual da mesma empresa do exemplo anterior, e mostra a relação dos valores distribuídos aos segmentos da sociedade. Este é um claro exemplo de uso desnecessário de uma perspectiva em 3D, que não adiciona nenhuma informação, somente “lixo de gráfico.”

Este gráfico sofre de “despenhadeirite”, que é esta representação de altura que aparece em torno da torta, mas que não traz nenhum valor numérico, e só confunde e distrai.

Gráfico retirado do relatório social anual de uma grande empresa, ilustrando a distribuição dos lucros nos segmentos da sociedade. Um exemplo de uso desnecessário de perspectiva em 3D.
Além disso, a representação em perspectiva dos gráficos em 3D distorce o tamanho relativo das partes do gráfico, conferindo maior tamanho às fatias que estão na frente, e relativamente diminuindo as fatias na parte de trás. As pessoas vão pensar que as fatias de baixo são as mais importantes.

No gráfico anterior, as fatias enfatizadas na parte da frente são os lucros repassados ao governo e aos funcionários, e a fatia que está na parte de trás é a dos lucros retidos pela empresa, uma coincidência bastante suspeita.

É um truque comum colocar a fatia que você quer enfatizar na parte de baixo da torta, e aumentar o quanto for possível a altura da torta, e incliná-la o máximo para trás, como no gráfico a seguir. Nele, a distorção das fatias é bastante evidente.

Gráfico retirado do relatório de um órgão governamental europeu. As distorções pela perspectiva são aumentadas com o aumento da altura e da inclinação da torta. Note que o produtor ainda teve o cuidado de adicionar a sombra da torta. Ao confeccionar este gráfico, acredito, já estava sofrendo de insolação.
Caso o produtor ainda não esteja satisfeito com o grau de distorção causada pela perspectiva num gráfico de torta, ele pode colocá-la na vertical e transformar a torta numa roda. As fatias da parte de baixo da roda são apresentadas com um tamanho relativo menor em comparação com as fatias da parte de cima.


Gráfico retirado do relatório anual de uma grande estatal brasileira. Colocar as tortas na vertical e transformá-las em roda agrava ainda mais os problemas do leitor, que além de continuar sendo enganado pela perspectiva, não está familiarizado com este desenho não usual.

Mesmo com todos os efeitos tridimensionais que os computadores nos oferecem ao esforço de um click, parece que essas opções não são mais suficientes para saciar a sede dos produtores que estão mais interessados em valorizar o recipiente do que o conteúdo, ao preço de adicionar mais “lixo de gráfico”. O produtor do gráfico a seguir não ficou satisfeito com a perspectiva em 3D do gráfico de torta, e decidiu adicionar imagens de fotos como textura para cada fatia.

Gráfico retirado do relatório anual da administradora de um porto brasileiro. As fatias ao invés de serem coloridas, são cobertas pela imagem de fotos. Mais um exemplo de preocupação com o estilo que supera a preocupação com a compreensão.
Não é porque os recursos computacionais disponíveis nos permitem criar tais “obras de arte” que devemos considerar que elas são as melhores opções para levarem ao entendimento, e nem devemos cair na tentação de usá-las nos casos em que não agregam informação. Gráficos mais bonitos não são intrinsecamente melhores. Quase todas as demandas por gráficos são satisfeitas por desenhos simples em duas dimensões, que não são tão chamativos, mas levam o leitor à compreensão.

segunda-feira, 27 de abril de 2009

BARRAS INDIGESTAS - CASO 7

O gráfico seguinte é da mesma empresa do exemplo anterior, mas de um relatório anual anterior. Além de apresentar o mesmo problema que foi descrito anteriormente, este gráfico apresenta outro. O gráfico mostra os valores dos ganhos anuais por ação de três anos consecutivos, representados por linhas, que juntas formam um desenho que lembra uma auto-estrada; a linha do meio é tracejada, lembrando a faixa que permite ultrapassagens nas estradas.

Este é um exemplo de como a preocupação com o estilo pode superar a preocupação com a compreensão. Embora realmente seja uma idéia muito criativa fazer um gráfico em forma de auto-estrada no relatório anual de uma empresa automobilística, o problema é que a linha tracejada dá um peso visual menor para o valor da linha do meio, diminuindo visualmente a sua importância relativa às outras linhas. Novamente uma escolha muito suspeita, considerando-se que o ano representado no centro foi o que teve o pior desempenho.

Gráfico dos ganhos anuais por ação de uma grande empresa automobilística dos EUA, cujas linhas que representam o valor de três anos consecutivos, formam o desenho de uma auto-estrada. Um exemplo de preocupação com o estilo ao invés da compreensão.

sexta-feira, 24 de abril de 2009

BARRAS INDIGESTAS - CASO 6

O próximo gráfico foi tirado do relatório anual de uma tradicional empresa automobilística dos EUA. O interessante deste gráfico é que a evolução dos ganhos por ação é mostrada com o ano mais recente à esquerda e os anos anteriores à direita, uma disposição inversa à nossa noção que a direção de leitura, ou seqüência, se realiza da esquerda para a direita, ou mesmo da nossa intuição de que o tempo deve ser representado passando da esquerda para a direita. Essa disposição é uma escolha bastante suspeita, considerando que a empresa não tem números bons para mostrar, e este gráfico pode fazer parecer que o grande número negativo à esquerda estava no passado, e que hoje a empresa voltou a ter resultados positivos, o que na realidade é exatamente o contrário.

Gráfico dos ganhos por ação do relatório anual de uma grande empresa automobilística dos EUA. Note que a evolução dos ganhos é mostrada com os anos decrescendo da esquerda para a direita, fazendo parecer que os ganhos estão subindo, enquanto na verdade se tornaram bem negativos no último ano.

quarta-feira, 22 de abril de 2009

BARRAS INDIGESTAS - CASO 5

O gráfico de barras a seguir apresenta a evolução do endividamento bruto em bilhões de Reais de uma grande estatal brasileira. As barras são divididas em três partes, mostrando parcelas de tipos diferentes de endividamento, e uma linha no alto de cada barra mostra o valor total para aquele ano. Cada parte de cada barra é separada da seguinte por um espaço, que tem o mesmo tamanho em todas as vezes que aparece.

O problema desse gráfico com barras flutuantes é que os espaços vazios aumentam a altura total da barra e inviabilizam a comparação direta entre cada componente da barra e o total, passando a impressão de que cada parte é menor do que realmente é em comparação ao todo, o que pode ser conveniente num gráfico de endividamento que mostra uma tendência de aumento.

As barras flutuantes impedem o leitor de comparar os valores numéricos pela simples comparação do comprimento de cada barra, que é justamente uma das principais vantagens desse tipo de gráfico.

Gráfico da evolução do endividamento bruto em bilhões de reais, retirado do relatório anual de uma grande estatal brasileira. O uso de barras flutuantes impede a comparação entre as partes e o total.

segunda-feira, 20 de abril de 2009

BARRAS INDIGESTAS - CASO 4

O gráfico abaixo, do relatório anual de uma grande empresa de entretenimento dos EUA, mostra a evolução das despesas de capital de um determinado departamento. Cada barra representa o valor das despesas de dois setores, e por isso elas são divididas em duas partes.

As barras são circundadas por uma moldura, com espessura considerável. Então o leitor se pergunta: quem fez o gráfico espera que eu leia o valor da barra incluindo a espessura da moldura, ou sem ela? De acordo com a escala, a espessura da moldura é equivalente a US$ 50 milhões, ou pouco mais de 4% do limite da escala. Uma quantia considerável para investidores e analistas de mercado. Mais um exemplo de “lixo de gráfico.”

Gráfico das despesas de capital de um setor de uma grande empresa de entretenimento dos EUA. O uso de uma moldura em torno das barras confunde o leitor.

sexta-feira, 17 de abril de 2009

BARRAS INDIGESTAS - CASO 3

Outro tipo de gráfico para o qual devemos estar atentos são aqueles que apresentam duas escalas no mesmo gráfico, ilustrando duas variáveis diferentes. Quando estas duas variáveis podem ser comparadas, como quando denotam a mesma grandeza ou unidade de medida, naturalmente tendemos a comparar as curvas ou barras, mas se elas estão em escalas diferentes, essa comparação será enganosa.

O gráfico abaixo mostra a evolução da quantidade de lixo reciclado por uma grande empresa brasileira, e publicado em seu relatório social anual. O eixo da esquerda e as barras ilustram a quantidade de lixo reciclado em toneladas, e o eixo da direita ilustra a porcentagem do total do lixo que é reciclado; ambas as escalas são de base não zero. Isso faz parecer que a quantidade de lixo reciclado aumentou em 400% entre 2004 e 2006, quando na verdade aumentou de menos de 7.000 toneladas para menos de 10.000, um aumento de menos da metade. A outra escala faz parecer que a porcentagem reciclada aumentou em 1/3 do valor anterior, quando na verdade aumentou 1/16 avos.

O problema quando se colocam essas duas medidas relacionadas entre si no mesmo gráfico, em escalas de base não zero, é que as duas escalas estão distorcidas em proporções diferentes. Assim a desinformação se estabelece tanto na comparação entre os anos da mesma variável, quanto entre as duas variáveis. Portanto, escalas mistas é outro item com que se deve tomar cuidado em gráficos e diagramas. A não ser que você seja muito vivo em estatística para notar que existem duas escalas diferentes para o mesmo espaço gráfico, poderá ser enganado.


Gráfico do relatório social anual de uma grande empresa brasileira, mostrando a evolução da reciclagem do seu lixo. A escala da esquerda é da quantidade de lixo reciclado, e a escala da direita mostra a porcentagem em relação ao total de lixo. Ambas as escalas são de base não-zero.

quarta-feira, 15 de abril de 2009

RELATÓRIOS ANUAIS E GRÁFICOS RUINS

Os relatórios anuais de empresas são divulgados para exibir o seu desempenho econômico e financeiro, para investidores e analistas de mercado. Recentemente também estão divulgando os relatórios sociais, nos quais são descritas as ações da empresa para a melhoria da comunidade e preservação do meio-ambiente. A maioria apresenta um estilo sofisticado e colorido, com muitas fotos de setores das fábricas, produtos, funcionários sorridentes, e grupos de diretores em ternos caros e sorrisos confiantes; mas poucos se preocupam em ser ferramentas eficazes de comunicação com sócios, acionistas, e analistas de mercado.

Esses documentos geralmente seguem o mesmo estilo de apresentação de números e gráficos ao longo de todo o relatório, embora a maioria das empresas não mantenha o mesmo estilo entre os relatórios de um ano e outro, forçando os seus leitores a se adaptarem a um novo modo de apresentar as informações a cada ano. São poucas as empresas que definem um estilo visual e o mantêm, apresentando uma coerência; a maioria parece que contrata um projetista de relatório diferente a cada ano, que decide projetar o relatório da maneira que acredita ser a mais adequada.

Estes relatórios corporativos, assim como relatórios governamentais que também serão usados como exemplos aqui, estão cheios de números e gráficos, que não por acaso são de grande interesse para o próprio produtor da informação. Certamente estes relatórios se encaixam na categoria em que o produtor da informação tem grande interesse nos resultados. Só isso já é o suficiente para atribuirmos uma boa dose de desconfiança aos seus números e gráficos, possíveis portadores de distorções e apresentações tendenciosas. Especialmente se a empresa em questão não tem bons números para mostrar, e está ávida para passar uma boa imagem, ou o governo quer justificar um aumento de impostos ou exagerar os progressos realizados.

É importante ressaltar que a precisão, a clareza e a coerência da representação visual dos dados é que estão sendo avaliados aqui, e não o estilo ou a aparência dos gráficos. Certamente muitos gráficos que têm uma representação visual correta poderiam tornar-se mais atrativos ou com uma leitura mais fácil e agradável caso adotassem outras estratégias de desenho, como as recomendadas por Tufte, mas isto não tira o seu mérito por informar corretamente e honestamente o leitor.

segunda-feira, 13 de abril de 2009

CUIDADOS AO PRODUZIR GRÁFICOS - PARTE 7 - USO DE GRÁFICOS 3D

Os gráficos em três dimensões são extremamente fáceis de elaborar no computador; tão fáceis quanto qualquer outro gráfico em duas meras dimensões. Então porque continuar usando os tradicionais e sem graça gráficos em 2D, se podemos usar gráficos em 3D que parecem muito mais legais e passam uma impressão de modernidade e sofisticação? Simples, porque para a grande maioria dos gráficos, não é necessário o uso de três dimensões, e o seu uso só adiciona complexidade e confunde o leitor. Use gráficos em 3D somente se a terceira dimensão adicionar alguma informação.

Como Wurman [WURMAN, Richard Saul. Ansiedade de Informação: Como transformar informação em compreensão. São Paulo: Cultura Editores Associados, 1991, pág. 301] descreve: “A possibilidade de os gráficos mostrarem profundidade cria mais confusão quando esta profundidade não tem valor numérico. Isso acontece tanto em gráficos circulares, como de barras, e bem como em mapas geográficos. Espera-se que você olhe o plano ou a profundidade? Isso serve apenas para confundir a sua percepção da informação.

E Jones [JONES, Gerald Everett. How to Lie with Charts: Second Edition. Santa Monica: La Puerta Productions, 2007, pág. XVII] é ainda mais enfático ao criticar os gráficos em 3D: “Quando você precisar escolher um tipo de gráfico no PowerPoint, se você quiser enganar e distorcer, escolha tortas ou barras dimensionais. É virtualmente impossível fazer gráficos 3D que não dão a impressão errada.”

Os gráficos em 3D também sofrem do problema que Wurman chama de “despenhadeirite”, que é essa profundidade adicionada aos gráficos, que na maioria das vezes parecem como despenhadeiros circundando-os, como no exemplo acima. São ainda mais graves quando aparecem em mapas 3D, pois passam a impressão de um verdadeiro despenhadeiro, que poderia ter muitos quilômetros de profundidade se medido na mesma escala do mapa.




Gráfico de torta em 3D retirado do prospecto de fundos de investimento de um grande banco brasileiro, mostrando a composição de determinada carteira. Exemplo do uso desnecessário de uma perspectiva em 3D em um gráfico simples, que passa a sofrer de “despenhadeirite.”

Quando você olha o gráfico, sabe que a profundidade não está representando nenhuma informação, mas a sua mente vê essa profundidade e tenta tirar algum significado disso, ou o compara com as outras medidas. O uso de uma dimensão a mais que não traz nenhuma informação numérica só distrai e confunde.

O uso de gráficos 3D quando não são necessários é mais um exemplo de “lixo gráfico”, que mostra uma estupidez gráfica e denigre a imagem do produtor.

Mas os gráficos em 3D podem ser muito úteis quando apropriadamente usados, e não é necessário nem um computador para isso; uma prova que somente ferramentas excelentes não fazem gráficos igualmente excelentes, e a responsabilidade pela sua qualidade ainda recai sobre os ombros do produtor.

O estatístico italiano Luigi Perozzo ficou conhecido na segunda metade do século XIX por seus excelentes diagramas em 3D. Em 1879 ele publicou o seu diagrama mais conhecido, uma representação da pirâmide da idade da Suécia, baseada nos dados estatísticos do censo sueco de 1750 a 1875.

Gráfico em 3 dimensões de Luigi Perozzo, 1880, mostrando a evolução da pirâmide de idades da população da Suécia entre 1750 e 1875. Um exemplo precoce de um bom gráfico em 3 dimensões. [Perozzo, Luigi. Statistica Grafica - Della rappresentazione grafica di una collettività di individui nella successione del tempo, e in particolare dei diagrammi a tre coordinate - Memoria di Luigi Perozzo. Annali di Statistica, Serie 2, Vol. 12, 1880 (Ministero d'Agricoltura, Industria e Commercio, Direzione di Statistica). Imagem disponível em http://www.math.yorku.ca/SCS/Gallery/images/stereo2.jpg]
O gráfico mostra a evolução da pirâmide de idades da população sueca, entre 1750 e 1875. O eixo vertical (altura) representa a quantidade de pessoas, o eixo longitudinal (profundidade) representa as faixas etárias, e o eixo lateral (largura) representa os anos, começando em 1750 e terminando em 1875.

A primeira linha no eixo de idades (mais ao fundo) representa os nascidos vivos, e ela se sobressai sobre o resto do gráfico. Podem-se notar dois fatos interessantes com essa linha: o primeiro fato é que a faixa etária seguinte apresenta uma queda expressiva em população, denotando uma alta mortalidade infantil, mas que tende a diminuir com o passar dos anos; o outro fato é a ascensão rápida do número de nascidos a partir de 1850, o que provoca um degrau na pirâmide dos anos seguintes. Ambos os fatos poderiam ser atribuídos à melhoria da qualidade de vida e aos avanços da ciência e da medicina.

quinta-feira, 9 de abril de 2009

CUIDADOS AO PRODUZIR GRÁFICOS - PARTE 6 - GRÁFICOS SOBRE DINHEIRO SÓ FAZEM SENTIDO SE OS VALORES TÊM A MESMA REFERÊNCIA

O valor do dinheiro muda com o tempo, devido à inflação. Como a inflação é quase sempre positiva, o dinheiro tende a desvalorizar com o tempo. Não faz sentido comparar o valor nominal atual e de vinte anos atrás do preço de um quilo de laranja ou de um quilo de carne. No entanto, faz sentido comparar o preço entre as laranjas e a carne hoje, e entre as laranjas e a carne há vinte anos, pois embora sejam produtos diferentes, apresentam a mesma base monetária, o que permite uma comparação de preços.

Um gráfico que apresenta os valores nominais dos preços no tempo apresenta além da variação da medida (o preço), uma variação no desenho (preços com valores reais diferentes). A escala vertical efetivamente muda, pois o valor do dinheiro muda com o tempo, distorcendo o gráfico. Então, o único modo de pensar claramente sobre dinheiro no tempo é fazer comparações usando unidades monetárias ajustadas pela inflação. Ajuste os valores do passado de acordo com a inflação do período, e assim você saberá que está apresentando os preços em valores reais, e não nominais.

Um exemplo que está constantemente nos noticiários é o preço do barril de petróleo. Os jornalistas estão a todo o momento anunciando, com um semblante de preocupação, a quebra de novos recordes no preço do barril de petróleo. Considerando que esse preço é cotado em dólares americanos, e há inflação nos Estados Unidos, então é de se esperar que com o passar do tempo o preço nominal seja reajustado e chegue a patamares inéditos, no entanto, sem implicar necessariamente num aumento real.

O gráfico a seguir mostra a variação do preço do barril de petróleo de Janeiro de 2000 a Janeiro de 2005. O observador perceberá uma clara tendência de aumento, e logo concluirá que deverá esperar por um aumento no preço dos combustíveis em breve.

O que pode passar despercebido é que o título do gráfico indica que estes são os valores nominais, e, portanto, sem o ajuste pela inflação. Se este gráfico tiver os valores do passado ajustados pela inflação, eles tornarão-se valores reais, o que geralmente significa valores absolutos maiores. Quanto mais no passado estiver o valor, maior a inflação acumulada no período, e maior será a diferença entre o valor nominal e o real.

O gráfico com os valores reais tenderá a ser mais plano, e a tendência de subida dos preços ficará menos evidente.

Gráfico retirado do relatório anual de uma grande estatal brasileira, mostrando a variação do preço nominal em dólares americanos por barril do petróleo entre Janeiro de 2000 e Janeiro de 2005, de acordo com três cotações. Valores de dinheiro no tempo não deflacionados causam uma variação no desenho, pois o eixo vertical muda.
Tufte [TUFTE, Edward Rolf, The Visual Display of Quantitative Information. Cheshire: Graphics Press, 2007, pág. 68] sugere o seguinte princípio para gráficos sobre dinheiro: “Em visualizações de dinheiro no tempo, unidades de medida monetárias deflacionadas e padronizadas são quase sempre melhores que unidades nominais.

Os gráficos orçamentários dos governos também devem considerar os efeitos da inflação, assim como uma segunda fonte de distorção: a variação da população. As medidas orçamentárias dos governos, como a arrecadação de impostos, as despesas com serviços públicos, ou os investimentos em determinado setor, são diretamente proporcionais à população que paga impostos, utiliza os serviços públicos ou indica um crescimento que requer novos investimentos.

Do mesmo modo que a comparação entre valores monetários em tempos diferentes requer a utilização de uma unidade padronizada de medida (como por exemplo, os preços deflacionados ou reais), a comparação de receitas e despesas do governo só fazem sentido quando reduzidas a uma unidade padronizada de medida que leve em consideração a população considerada. Em gráficos governamentais, faz muito mais sentido pensar em termos de unidades monetárias reais per capita.

Os gráficos de orçamentos e gastos governamentais geralmente dão a impressão de estarem subindo rapidamente, o que serve de material para muitas reportagens sensacionalistas e críticas ao governo. Entretanto é de se esperar que os valores de arrecadação e gastos dos governos constantemente cheguem a valores nominais inéditos, tanto pelo efeito da inflação, quanto pelo aumento da população. Este efeito só não ocorrerá em localidades com deflação, ou decréscimo populacional.

Assim, enquanto gráficos em valores nominais podem indicar um aumento de orçamento ou despesas, quando normalizados pela inflação e pelo aumento da população, podem indicar até uma queda.

Gráfico de evolução da receita do Governo do Estado de São Paulo entre 2000 e 2006, que indica um crescimento estabilizado. Note que os valores apresentados são nominais. Se as medidas deste gráfico fossem padronizadas em unidades monetárias reais per capita, poderiam indicar um nível constante ou até mesmo um decréscimo de receita. [Gráfico disponível em http://www.planejamento.sp.gov.br/PlanOrca/orca.asp]
A aplicação da aritmética faz possível levar em consideração a população e a inflação. Computar gastos em unidades monetárias reais per capita geralmente revela uma situação bem diferente e mais precisa do que os gráficos de medidas não padronizadas.

quarta-feira, 8 de abril de 2009

CUIDADOS AO PRODUZIR GRÁFICOS - PARTE 5 - GRÁFICOS EMPILHADOS PODEM ESCONDER INFORMAÇÕES

Gráficos de áreas ou barras empilhadas são uma boa maneira de aglomerar vários conjuntos de dados numa mesma área de desenho. Porém eles também têm potencial para enganos e mentiras.

A primeira pergunta que vem é: as barras ou áreas estão colocadas uma sobre as outras, ou uma atrás das outras? Jones [JONES, Gerald Everett. How to Lie with Charts: Second Edition. Santa Monica: La Puerta Productions, 2007, pág. 40]: explica bem este problema: “As áreas ou barras estão empilhadas verticalmente – como tijolos e argamassa – ou estão em camadas uma em cima do outra – como desenhos em folhas transparentes separadas, e cada nova área começando na mesma linha horizontal na parte de baixo do gráfico? Se as áreas estão realmente empilhadas, somente os dados de baixo terão uma linha de base plana. Cada nova área terá o topo da área precedente como a sua linha de base, e qualquer flutuação nesta linha irá distorcer os altos e baixos da área seguinte.



Gráfico de barras empilhadas (à esquerda), e de áreas empilhadas (à direita), retirados do relatório de um órgão governamental europeu. Note que somente o primeiro conjunto de dados, aquele cujas barras ou áreas se iniciam no eixo horizontal, é que apresentam a mesma linha de base.

Se os dados estiverem realmente empilhados como tijolos, significa que a o conjunto de dados seguinte usa como base a parte superior do conjunto de dados anterior. Portanto, é claro que quanto maior a variação do dado que é colocado na parte de baixo, maior será o efeito de flutuação do dado que está em cima. Este efeito pode ser minimizado pelo produtor bem intencionado, que coloca perto da base o conjunto de dados com menor variação, e, portanto que causará menos flutuação aos conjuntos acima. Mas caso o produtor queira gerar confusão ou confundir o leitor, poderá colocar a variável com maior flutuação na parte de baixo, e transformar a leitura do gráfico em uma árdua tarefa.

Já os gráficos que empilham os conjuntos de dados em camadas não apresentam este problema, pois todos os conjuntos de dados começam na mesma base, o eixo horizontal. No entanto, só funcionam bem se o conjunto de dados à frente apresenta sempre valores menores do que os conjuntos de dados atrás; caso em contrário, partes dos conjuntos de dados de trás ficarão escondidos, o que pode até ser conveniente para um produtor desonesto.

O gráfico a seguir é um bom exemplo deste tipo de representação em camadas. A anterior é a de nascimentos, a camada seguinte é a de óbitos, e a camada mais frontal é a de casamentos. Esta ordem foi uma escolha lógica, pois como geralmente uma população apresenta crescimento, o número de nascimentos será maior que o de óbitos. Já o número de casamentos implica a consideração de duas pessoas, o que quase sempre irá significar um número menor que o de nascimentos e óbitos (as pessoas se casam em pares, mas nascem e morrem individualmente).

Gráfico com as estatísticas de nascimentos, óbitos e casamentos em 1916, a cada mês. Um bom exemplo de gráfico empilhado em camadas, apesar da representação visual pesada gerada pelas hachuras. Além disso, o desenho não é neutro ao usar uma corrente e cadeados para demarcar a linha dos casamentos, e poderia gerar polêmica. [Annuario de Estatística Demographo-Sanitaria de 1915-1916, pelo Dr. Sampaio Vianna, Imprensa Nacional, Rio de Janeiro, 1926. Figura entre as páginas 30 e 31. Documento disponível em http://memoria.nemesis.org.br]

terça-feira, 7 de abril de 2009

CUIDADOS AO PRODUZIR GRÁFICOS - PARTE 4 - MUDANÇAS NA ESCALA HORIZONTAL OU NA LARGURA AFETAM A PERCEPÇÃO

A escolha da largura de um gráfico afeta a percepção da evidência dos dados. Gráficos estreitos e altos ajudam a enfatizar as variações. Gráficos largos ajudam a amenizar as variações. O produtor pode escolher a razão entre altura e largura que melhor conduzir ao significado que ele quer passar.

Se o produtor tem um gráfico que mostra muitas flutuações, ou tendências indesejadas de subida ou queda, basta alongar o gráfico para amenizar tais evidências visuais. Caso queira enfatizar tais variações, basta tornar o gráfico alto e estreito.

Um efeito parecido pode ser conseguido com um outro truque mais sutil, que é mudar o valor da escala no eixo horizontal, sem nenhum razão aparente. O leitor incauto não perceberá as escalas que variam de valor, e será conduzido somente pela evidência visual do gráfico.

O gráfico a seguir usa este truque de uma maneira bem leve. O tempo entre a primeira barra e a terceira barra equivale a dez anos; logo, o leitor supõe que a barra do meio, colocada igualmente espaçada entre as duas outras barras, representa um valor do meio, ou seja, de cinco anos; no entanto, a barra do meio representa seis anos. Neste caso, para passar uma evidência visual correta, esta barra deveria ser colocada ligeiramente para a direita, mais próximo à barra dos dez anos. O observador que não se atenta a essa mudança, tem a impressão de uma tendência de queda menor do que realmente é.

Gráfico retirado do relatório anual de uma grande companhia automobilística japonesa. As distâncias na escala horizontal não coincidem com os valores de tempo, e passam uma impressão de variação distorcida ao leitor.
O gráfico a seguir é um ótimo exemplo de como não fazer um gráfico, ou como cometer vários erros de representação visual em alguns centímetros quadrados.

Um dos seus problemas é bem comum, que é a escala que não começa no zero, o que dá uma impressão exagerada na taxa de mudança dos valores. Enquanto parece que o valor de mercado das empresas americanas despencou de um pico a zero (isso mesmo, o gráfico dá a impressão que as empresas não valem mais nada, uma vez que o final da linha de evolução encosta-se ao eixo horizontal), na verdade elas desvalorizaram cerca de 17% (de 17,054 para 14,082 trilhões de dólares).

Mas o problema mais grave está na escala horizontal, que divide o tempo analisado em três períodos: março a outubro, outubro a dezembro, e dezembro a março. Entretanto, as divisões não apresentam tamanhos iguais, e nem denotam o mesmo período de tempo.

A primeira divisão representa 6 meses (abril, maio, junho, julho, agosto e setembro), e tem 80% do tamanho da segunda divisão. A segunda divisão representa apenas 1 mês (novembro) e é maior que a primeira, que representa 6 meses, e ligeiramente maior que a terceira, que representa 2 meses (janeiro e fevereiro).

Caso este gráfico estivesse representado com um escala de tempo coerente e espacialmente proporcional ao tempo representado em cada período, poder-se-ia notar uma tendência de queda muito mais acentuada que a mostrada por este, o que corroboraria o ponto de vista da reportagem, que tenta chamar a atenção para a crise da bolsa de valores americana.

Este é provavelmente um caso em que o desenho de gráfico ruim atuou contra os interesses do seu produtor, amenizando, ou invés de exagerar, as evidências da notícia. Nestes casos pode-se afirmar, com certa dose de confiança, que o produtor sofreu de desinformação, falta de atenção ou ignorância.

Gráfico com problemas nas escalas vertical e horizontal. Na medida do tempo, não há coerência ao longo do eixo sobre a proporcionalidade entre a medida usada no desenho e o tempo representado. [O Estado de São Paulo, 23 de março de 2008, pág. B4. Imagem digitalizada a partir do original]
Mas o uso de mudanças nas escalas não é intrinsecamente incorreto, e nem sempre é desonesto. Desde que a mudança na escala seja claramente indicada ao leitor, e este esteja ciente de que a representação visual pode estar distorcida, não há problemas.

A seguir, no eixo vertical da direita (que indica porcentagens), há uma indicação de descontinuidade na escala. O símbolo de descontinuidade (≈) é uma solução muito mais honesta do que simplesmente começar a escala num valor diferente de zero.

Gráfico retirado do relatório anual de uma empresa automobilística japonesa, com uma indicação de descontinuidade na escala do eixo vertical direito. Um exemplo de uso honesto de escala descontínua.
O próximo exemplo faz um uso mais extensivo das descontinuidades, e ainda assim de forma honesta. A escala horizontal apresenta o símbolo de descontinuidade para enfatizar ao leitor que há uma diferença de escala entre os anos de “90” e “02”, que logo é seguido por anos consecutivos. Esta indicação é repetida na linha de evolução na área do gráfico, reforçando a indicação de mudança de escala. O mesmo acontece com a escala vertical, que apresenta duas linhas em paralelo que vão serpenteando através das barras para indicar uma descontinuidade na escala, que corretamente começou no zero. Um produtor desonesto teria usado uma escala de base não zero, ou mesmo esta descontinuidade, sem qualquer preocupação em indicar ou chamar a atenção sobre isto.

Gráfico retirado do relatório anual de uma empresa automobilística japonesa, com indicações de escalas descontínuas em ambos os eixos. Escalas descontínuas podem ser usadas honestamente, desde que indicadas ao leitor.

Usar escalas descontínuas sem evidenciar isto ao leitor é desonesto, pois fornece uma representação visual distorcida em relação ao que o leitor está esperando do desenho do gráfico.

Mas mesmo o uso de escalas descontínuas indicadas ao leitor deve ser usado com cuidado, pois mesmo sendo tecnicamente correto e honesto, continua distorcendo a imagem geral do gráfico e dificultando a análise. O leitor é obrigado a abstrair mentalmente como seria o gráfico se a escala fosse contínua, para ter uma noção mais realista das tendências e variações dos valores. Além disso, as descontinuidades nas escalas geram algumas perguntas incômodas: O que o autor está deixando de fora? O que há na área descontínua que poderia mudar a análise do gráfico? Se a escala fosse contínua o gráfico transmitiria outra mensagem?

segunda-feira, 6 de abril de 2009

CUIDADOS AO PRODUZIR GRÁFICOS - PARTE 3 - ADVINHANDO OS DADOS QUE FALTAM

Gráficos são meios eficientes de mostrar padrões e tendências em conjuntos de dados. A representação visual de linhas ou outras formas geométricas que parecem seguir determinada direção ou forma, é bastante persuasiva para que o produtor se sinta seguro, ou mesmo considere óbvio, o preenchimento de dados faltantes ou a projeção de dados futuros. Mas qualquer tentativa de expandir um conjunto de dados por meio de adivinhação de valores internos (processo chamado de interpolação) ou por identificar tendências e projetar valores futuros (processo chamado de extrapolação) é perigosa, sujeita a vários truques ou erros não intencionais.

Extrapolação: estender o passado no futuro.
Interpolação: preencher as lacunas.




Gráficos lineares podem ser facilmente completados com pontos de interpolação (valores internos) e extrapolação (valores futuros). Entretanto poucas situações apresentam tal simplicidade, exigindo do produtor métodos mais complexos para determinar estes pontos.

O problema começa quando o desenhista de um gráfico faz interpolações ou extrapolações baseadas em suposições erradas ou tendenciosas, por má fé ou uma inocente falta de habilidade, mas quase sempre convenientes ao resultado ao qual o produtor quer chegar. Se as suposições para um processo de interpolação ou extrapolação são escondidas ou omitidas do leitor, desconfie.

Na prática, a extrapolação e a interpolação são ferramentas úteis somente se os fenômenos observados podem ser descritos com precisão por fórmulas, que são usadas para definir os pontos em questão.

Como exemplos de situações que possuem fórmulas bem definidas e que podem fazer um uso honesto da interpolação ou extrapolação, estão: aplicações financeiras com rendimentos conhecidos, alguns comportamentos da economia, leis da natureza, alguns fenômenos biológicos, entre outros.

domingo, 5 de abril de 2009

CUIDADOS AO PRODUZIR GRÁFICOS - PARTE 2 - CONSIDERE OS PRECONCEITOS CULTURAIS SOBRE ORIENTAÇÕES

O produtor de gráficos deve ter em mente que as pessoas tem preconceitos e tendências culturais que as fazem intuitivamente dar certos significados às direções adotadas nos gráficos. A maioria das pessoas nem tem consciência de ter essas polarizações culturais, e mesmo as que sabem disso, não conseguem se desvencilhar dessas tendências tão arraigadas.

O bom produtor de gráficos deve estar ciente dessas polarizações e deve saber usá-las para reforçar a sua mensagem; ir contra elas apenas prejudicará a comunicação.

Para Jones [JONES, Gerald Everett. How to Lie with Charts: Second Edition: Second Edition. Santa Monica: La Puerta Productions, 2007, pág. 43 e 44], essas polarizações culturais surgem principalmente da direção de leitura de cada cultura. Para os ocidentais, ele as descreve assim:

As pessoas nas culturas ocidentais lêem da esquerda para a direita. Para estes leitores o movimento para a direita – a direção em que o olho varre a página – é associada com a passagem do tempo, e, portanto, com o movimento positivo, ou mesmo com a idéia de progresso”.
Inversamente, o movimento da direita para a esquerda é considerado retrogrado e negativo – mau! Dessas mesmas noções vem a raiz da palavra sinistro, que pode significar tanto esquerdo ou de mau agouro.”

Os gráficos que mostram a passagem do tempo, como os de evolução, usam essa noção que o tempo se move da esquerda para a direita.

Sobre os movimentos verticais, Jones [JONES, Gerald Everett. How to Lie with Charts: Second Edition: Second Edition. Santa Monica: La Puerta Productions, 2007, pág. 44] escreve:

Em muitas culturas, o movimento para cima é associado com aumento ou ganho, e para baixo com diminuição ou perda.” Portanto: “Gráficos que mostram flutuações em quantidades se baseiam na noção de que para cima significa ganho e para baixo significa perda.”

Esta noção também vem da direção em que as pessoas costumam ler os textos, que é de cima para baixo.


As quatro direções e suas conotações de acordo com a cultura ocidental. Essas conotações mudam com as culturas e podem influenciar na maneira de interpretar um gráfico.
Assim, nas culturas ocidentais, as pessoas intuitivamente entendem que para cima e para baixo significa quantidades e para a direita e para a esquerda significa tempo.

No entanto, essas predisposições para dar conotação às direções variam de acordo com a cultura e a direção de leitura de cada língua. Para quem lê hebreu ou árabe, cuja direção de leitura é da direita para a esquerda, um gráfico que mostra a passagem do tempo para a esquerda (o contrário dos ocidentais) pode parecer mais familiar. Já para os chineses que lêem de cima para baixo, as flutuações verticais de quantidades podem não parecer tão intuitivos assim.

Mas se você não estiver atento, mentirosos espertos poderão usar essas predisposições para conotar sentido às orientações, para comunicar um sentimento oposto ao que os dados transmitiriam. Você pode fazer um gráfico de lucros despencando não parecer tão mau assim se você inverter o sentido de fluxo do tempo. Um leitor desatento pode até acreditar que os lucros estão na verdade aumentando.

sábado, 4 de abril de 2009

CUIDADOS AO PRODUZIR GRÁFICOS - PARTE 1 - ESCALAS LOGARÍTMICAS SÃO TRAIÇOEIRAS

Sempre que possível, use escalas lineares. As escalas logarítmicas não são desonestas em si, mas por serem pouco intuitivas, podem ser facilmente manipuladas para enganar o público. O propósito honesto das escalas logarítmicas e que deve nos guiar no uso delas, é possibilitar que dados de uma faixa muito larga caibam em um gráfico relativamente compacto.

No entanto, tenha em mente que este tipo de escala não é facilmente entendido pelo público em geral. As escalas logarítmicas são usadas principalmente por cientistas e engenheiros, que tipicamente lidam com dados de faixa larga, como as distâncias astronômicas, parâmetros de elementos elétricos ou estruturais, fenômenos físicos, entre outros.

Usar escalas logarítmicas é um truque para fazer curvas exponenciais (geralmente associadas com situações de crise iminentes) se tornarem lineares ou tendendo a uma estabilização. Se você tem uma curva que sobe ou desce numa proporção chocante, e informar isso vai contra os seus interesses, basta colocar o eixo desta variável numa escala logarítmica apropriada para torná-la uma reta com uma suave subida ou descida, ou mostrar uma tendência de estabilização, o que vai parecer bem menos ameaçador. Você pode transformar uma notícia catastrófica numa notícia de pouco apelo.

A escala logarítmica pode ser aplicada em apenas um eixo (cujo gráfico fica conhecido como semi-log), ou nos dois eixos (cujo gráfico fica conhecido como log-log), este último sendo muito mais difícil de ser interpretado pelo público em geral.

A seqüência de gráficos a seguir ilustra o mesmo conjunto de dados desenhado com escalas diferentes. A escala do primeiro gráfico é linear e mostra que os dados apresentam uma tendência exponencial, subindo rapidamente. Caso seja de interesse do produtor, ele pode aplicar uma escala logarítmica no eixo vertical, e o mesmo conjunto de dados passa a sugerir uma tendência de estabilização. Se, no entanto, o produtor aplicar uma escala logarítmica no eixo horizontal também, os dados mostram uma reta, que parece bem mais familiar e menos chamativa.

O mesmo conjunto de dados desenhados em gráficos com escalas diferentes. À esquerda, uma escala linear mostrando uma curva exponencial; ao centro, um escala logarítmica no eixo vertical que mostra os dados com uma tendência de estabilização; à direita, escalas logarítmicas em ambos os eixos mostram os dados como uma reta.
Para fazer um uso honesto das escalas logarítmicas, certifique-se de indicar com clareza quais eixos estão usando este tipo de escala.

sexta-feira, 3 de abril de 2009

CUIDADOS AO PRODUZIR GRÁFICOS - INTRODUÇÃO

Quando você tiver que produzir gráficos, seja bom com os seus consumidores e tome alguns cuidados para não cair nas muitas armadilhas que obscurecem e confundem as informações.

O mais importante é não perder de vista o objetivo dos gráficos. É como Tufte [TUFTE, Edward Rolf, Visual and Statistical Thinking; Displays of Evidence for Making Decisions. Cheshire: Graphics Press, 2005, pág. 27] escreve: “Representações visuais de informações devem servir ao propósito analítico em questão; se uma questão importante é uma possível relação de causa e efeito, então os gráficos devem organizar os dados de uma forma a iluminar tal ligação. Não é uma idéia complicada, mas é profunda”.

Para servir ao seu propósito analítico, a lógica que orienta a produção do gráfico tem que ter afinidade com a lógica da análise que o produtor quer induzir no leitor.

Em seguida é necessário pensar nos aspectos estruturais e de desenho dos gráficos. Primeiro lembre-se dos elementos básicos de todo gráfico e verifique-os: título, legenda, eixos (nome, escala, marcações), dados, e a área de fundo.

O título deve indicar claramente, e logo em primeira mão, as variáveis que estão sendo representadas. Ao invés de colocar o título “Evolução do preço do café”, prefira “Preço do café (R$) x Último trimestre (dias)”.

Use a rotulação direta (aquela que rotula no próprio gráfico os valores ou a variável daquela indicação) tanto quanto possível, e use as legendas somente quando os dados forem muito complexos para a rotulação direta.

E por falar em legenda e rotulação, nunca se esqueça de colocá-los, assim como as unidades de medida e o que está sendo medido. Um número sem etiqueta é um número sem sentido. Geralmente uma etiqueta tem duas partes: uma unidade de medida e uma descrição do que está sendo medido. Escreva “Litros de água”, ou “Dólares de lucro”, ou “Toneladas de soja”; deve haver sempre uma unidade de medida e a descrição do que está sendo medido. Como uma regra, sempre que houver um número, deve haver um rótulo por perto o descrevendo.

Por mais óbvio que isto pareça, os rótulos são facilmente esquecidos pelo produtor que está tão familiarizado com o gráfico que não consegue imaginar que as outras pessoas não saibam o significado das cores ou siglas.

No entanto, essas legendas e rotulações não precisam ser exageradas ou ter um peso visual muito grande. O tamanho das letras em gráficos pode ser pequena, uma vez que as frases e sentenças não são longas – e, portanto, a fonte pequena não irá fatigar o leitor da mesma forma que faria em textos longos.

Prefira sempre que possível colocar no gráfico os dados, e não as estatísticas desses dados. Assim evita-se a necessidade de explicar as suas assunções para chegar em tais resultados estatísticos, aumenta a eficiência de mostrar os dados, e permite ao consumidor fazer as suas próprias conclusões, determinar se a análise do autor é apropriada, e fazer as suas próprias análises, uma vez que têm os dados brutos em mãos.

Deixe bem clara a relação de causa e efeito entre duas variáveis. Este é outro item que pode ser negligenciado pelo produtor muito familiarizado com os próprios gráficos. Na maioria dos casos um texto acompanhando o gráfico, com explicações, análises e conclusões, é tão importante quanto o gráfico em si. E se possível, devem estar na mesma página.

O gráfico na verdade não é nada mais que uma parte do texto que usa uma forma de comunicação visual, e, portanto, deve estar integrado no texto como qualquer outro parágrafo.

Use a menor quantidade possível de marcações na área do gráfico. Cada traço desenhado deve ter alguma finalidade informativa; se não tem, apague. Evite o já comentado “lixo de gráfico”, e deixe desenhado somente o essencial. Isso significa apagar enfeites, fundos de gráfico visualmente muito pesados, linhas e números de marcação de escala em excesso, legendas demais, e tudo o mais que polui e confunde.

Tenha em mente que a seleção dos eixos para cada variável, normalmente os eixos horizontal e vertical, irão influenciar como a informação é interpretada. Assim como a seleção da escala, que deve dar preferência para as escalas lineares, que são mais fáceis de compreender e comparar. Estes dois assuntos serão explicados com mais detalhe a seguir.

quinta-feira, 2 de abril de 2009

TABELAS - INTRODUÇÃO

Tabelas são o tipo de representação ideal quando precisamos saber valores exatos, ou representar grande quantidade de números. Nenhuma representação gráfica com escalas poderia fazer isso, a não ser que indicasse o valor numérico de cada medida ou ao longo de cada linha, o que é pouco prático.

Tabelas são muito usadas em aplicações que precisam de números exatos; os contadores e analistas precisam de tabelas em demonstrativos financeiros das empresas, economistas e investidores precisam de números exatos dos índices financeiros, e os engenheiros precisam realizar cálculos com precisão baseados em números igualmente precisos.

Além disso, para exibir grandes quantidades de números as tabelas conseguem ocupar muito menos espaço do que se os mesmos dados fossem representados por outro tipo de gráfico.


Detalhe de uma tabela de índices financeiros. As tabelas com os índices do mercado financeiro são exemplos comuns e efetivos de grande quantidade de informações mostradas em tabelas. No entanto o uso extensivo de abreviações e siglas faz com que somente quem conhece o mercado financeiro compreenda os seus significados. [Valor Econômico, 25 de setembro de 2007, pág. C9. Imagem digitalizada a partir do original]

As tabelas também são indicadas para pequenas quantidades de números, é preferível usar uma tabela a ocupar espaço com um gráfico simplório. Conjuntos de dados numéricos simples devem estar em tabelas ou integrados ao texto; gráficos (que não sejam tabelas) devem ser usados para dar sentido a conjuntos de dados grandes e complexos que não podem ser representados eficazmente de outra forma.

Alguém poderia afirmar que tabelas não são gráficos, pois não fazem uso de formas geométricas, eixos ou escalas; mas a partir do momento em que elas dispõem os números de uma maneira ordenada no espaço, pode-se dizer que são uma maneira visual de ordenar a informação.

Problemas comuns em tabelas estão ligados ao seu projeto: linhas em excesso e com peso visual muito grande parecem enredar os números; falta de alinhamento entre os números; uso de resoluções diferentes para os números de um mesmo parâmetro; falta das unidades de medida; e uso de abreviações em excesso, são alguns dos defeitos mais comuns.

quarta-feira, 1 de abril de 2009

GRÁFICOS DE EVOLUÇÃO - INTRODUÇÃO

Eles são chamados gráficos de evolução porque mostram a variação ao longo do tempo, e geralmente usam linhas, que sobem ou descem, e fazem uso da nossa percepção que para cima é mais, e para baixo é menos. Eles são ótimos para indicar tendências.




À esquerda [O Estado de São Paulo, 16 de setembro de 2007, pág. B4. Imagem digitalizada a partir do original], exemplo de um bom gráfico de evolução, mostrando as variações de investimento no Brasil desde o começo do plano Real em 1994. À direita [O Estado de São Paulo, 16 de setembro de 2007, pág. B20. Imagem digitalizada a partir do original], um gráfico mostrando a evolução da produção brasileira de leite; a base não-zero faz parecer ao leitor desatento que a produção aumentou em 12 vezes, mas na realidade aumentou em menos da metade.

Mas assim como nos gráficos de barras, se a escala dos gráficos de evolução não for constante ou não estiver claramente indicada, o resultado será um leitor confuso ou enganado.

Os gráficos de evolução facilmente aceitam outros tipos de escala que não a linear, como as escalas logarítmicas, que são muito úteis para exibir diferenças de valores enormes com alguma precisão, mas acabam totalmente com a imaginação; é muito difícil abstrair tendências corretas ou relações entre valores em tais escalas, a não ser que você seja muito treinado.