segunda-feira, 6 de abril de 2009

CUIDADOS AO PRODUZIR GRÁFICOS - PARTE 3 - ADVINHANDO OS DADOS QUE FALTAM

Gráficos são meios eficientes de mostrar padrões e tendências em conjuntos de dados. A representação visual de linhas ou outras formas geométricas que parecem seguir determinada direção ou forma, é bastante persuasiva para que o produtor se sinta seguro, ou mesmo considere óbvio, o preenchimento de dados faltantes ou a projeção de dados futuros. Mas qualquer tentativa de expandir um conjunto de dados por meio de adivinhação de valores internos (processo chamado de interpolação) ou por identificar tendências e projetar valores futuros (processo chamado de extrapolação) é perigosa, sujeita a vários truques ou erros não intencionais.

Extrapolação: estender o passado no futuro.
Interpolação: preencher as lacunas.




Gráficos lineares podem ser facilmente completados com pontos de interpolação (valores internos) e extrapolação (valores futuros). Entretanto poucas situações apresentam tal simplicidade, exigindo do produtor métodos mais complexos para determinar estes pontos.

O problema começa quando o desenhista de um gráfico faz interpolações ou extrapolações baseadas em suposições erradas ou tendenciosas, por má fé ou uma inocente falta de habilidade, mas quase sempre convenientes ao resultado ao qual o produtor quer chegar. Se as suposições para um processo de interpolação ou extrapolação são escondidas ou omitidas do leitor, desconfie.

Na prática, a extrapolação e a interpolação são ferramentas úteis somente se os fenômenos observados podem ser descritos com precisão por fórmulas, que são usadas para definir os pontos em questão.

Como exemplos de situações que possuem fórmulas bem definidas e que podem fazer um uso honesto da interpolação ou extrapolação, estão: aplicações financeiras com rendimentos conhecidos, alguns comportamentos da economia, leis da natureza, alguns fenômenos biológicos, entre outros.

domingo, 5 de abril de 2009

CUIDADOS AO PRODUZIR GRÁFICOS - PARTE 2 - CONSIDERE OS PRECONCEITOS CULTURAIS SOBRE ORIENTAÇÕES

O produtor de gráficos deve ter em mente que as pessoas tem preconceitos e tendências culturais que as fazem intuitivamente dar certos significados às direções adotadas nos gráficos. A maioria das pessoas nem tem consciência de ter essas polarizações culturais, e mesmo as que sabem disso, não conseguem se desvencilhar dessas tendências tão arraigadas.

O bom produtor de gráficos deve estar ciente dessas polarizações e deve saber usá-las para reforçar a sua mensagem; ir contra elas apenas prejudicará a comunicação.

Para Jones [JONES, Gerald Everett. How to Lie with Charts: Second Edition: Second Edition. Santa Monica: La Puerta Productions, 2007, pág. 43 e 44], essas polarizações culturais surgem principalmente da direção de leitura de cada cultura. Para os ocidentais, ele as descreve assim:

As pessoas nas culturas ocidentais lêem da esquerda para a direita. Para estes leitores o movimento para a direita – a direção em que o olho varre a página – é associada com a passagem do tempo, e, portanto, com o movimento positivo, ou mesmo com a idéia de progresso”.
Inversamente, o movimento da direita para a esquerda é considerado retrogrado e negativo – mau! Dessas mesmas noções vem a raiz da palavra sinistro, que pode significar tanto esquerdo ou de mau agouro.”

Os gráficos que mostram a passagem do tempo, como os de evolução, usam essa noção que o tempo se move da esquerda para a direita.

Sobre os movimentos verticais, Jones [JONES, Gerald Everett. How to Lie with Charts: Second Edition: Second Edition. Santa Monica: La Puerta Productions, 2007, pág. 44] escreve:

Em muitas culturas, o movimento para cima é associado com aumento ou ganho, e para baixo com diminuição ou perda.” Portanto: “Gráficos que mostram flutuações em quantidades se baseiam na noção de que para cima significa ganho e para baixo significa perda.”

Esta noção também vem da direção em que as pessoas costumam ler os textos, que é de cima para baixo.


As quatro direções e suas conotações de acordo com a cultura ocidental. Essas conotações mudam com as culturas e podem influenciar na maneira de interpretar um gráfico.
Assim, nas culturas ocidentais, as pessoas intuitivamente entendem que para cima e para baixo significa quantidades e para a direita e para a esquerda significa tempo.

No entanto, essas predisposições para dar conotação às direções variam de acordo com a cultura e a direção de leitura de cada língua. Para quem lê hebreu ou árabe, cuja direção de leitura é da direita para a esquerda, um gráfico que mostra a passagem do tempo para a esquerda (o contrário dos ocidentais) pode parecer mais familiar. Já para os chineses que lêem de cima para baixo, as flutuações verticais de quantidades podem não parecer tão intuitivos assim.

Mas se você não estiver atento, mentirosos espertos poderão usar essas predisposições para conotar sentido às orientações, para comunicar um sentimento oposto ao que os dados transmitiriam. Você pode fazer um gráfico de lucros despencando não parecer tão mau assim se você inverter o sentido de fluxo do tempo. Um leitor desatento pode até acreditar que os lucros estão na verdade aumentando.

sábado, 4 de abril de 2009

CUIDADOS AO PRODUZIR GRÁFICOS - PARTE 1 - ESCALAS LOGARÍTMICAS SÃO TRAIÇOEIRAS

Sempre que possível, use escalas lineares. As escalas logarítmicas não são desonestas em si, mas por serem pouco intuitivas, podem ser facilmente manipuladas para enganar o público. O propósito honesto das escalas logarítmicas e que deve nos guiar no uso delas, é possibilitar que dados de uma faixa muito larga caibam em um gráfico relativamente compacto.

No entanto, tenha em mente que este tipo de escala não é facilmente entendido pelo público em geral. As escalas logarítmicas são usadas principalmente por cientistas e engenheiros, que tipicamente lidam com dados de faixa larga, como as distâncias astronômicas, parâmetros de elementos elétricos ou estruturais, fenômenos físicos, entre outros.

Usar escalas logarítmicas é um truque para fazer curvas exponenciais (geralmente associadas com situações de crise iminentes) se tornarem lineares ou tendendo a uma estabilização. Se você tem uma curva que sobe ou desce numa proporção chocante, e informar isso vai contra os seus interesses, basta colocar o eixo desta variável numa escala logarítmica apropriada para torná-la uma reta com uma suave subida ou descida, ou mostrar uma tendência de estabilização, o que vai parecer bem menos ameaçador. Você pode transformar uma notícia catastrófica numa notícia de pouco apelo.

A escala logarítmica pode ser aplicada em apenas um eixo (cujo gráfico fica conhecido como semi-log), ou nos dois eixos (cujo gráfico fica conhecido como log-log), este último sendo muito mais difícil de ser interpretado pelo público em geral.

A seqüência de gráficos a seguir ilustra o mesmo conjunto de dados desenhado com escalas diferentes. A escala do primeiro gráfico é linear e mostra que os dados apresentam uma tendência exponencial, subindo rapidamente. Caso seja de interesse do produtor, ele pode aplicar uma escala logarítmica no eixo vertical, e o mesmo conjunto de dados passa a sugerir uma tendência de estabilização. Se, no entanto, o produtor aplicar uma escala logarítmica no eixo horizontal também, os dados mostram uma reta, que parece bem mais familiar e menos chamativa.

O mesmo conjunto de dados desenhados em gráficos com escalas diferentes. À esquerda, uma escala linear mostrando uma curva exponencial; ao centro, um escala logarítmica no eixo vertical que mostra os dados com uma tendência de estabilização; à direita, escalas logarítmicas em ambos os eixos mostram os dados como uma reta.
Para fazer um uso honesto das escalas logarítmicas, certifique-se de indicar com clareza quais eixos estão usando este tipo de escala.

sexta-feira, 3 de abril de 2009

CUIDADOS AO PRODUZIR GRÁFICOS - INTRODUÇÃO

Quando você tiver que produzir gráficos, seja bom com os seus consumidores e tome alguns cuidados para não cair nas muitas armadilhas que obscurecem e confundem as informações.

O mais importante é não perder de vista o objetivo dos gráficos. É como Tufte [TUFTE, Edward Rolf, Visual and Statistical Thinking; Displays of Evidence for Making Decisions. Cheshire: Graphics Press, 2005, pág. 27] escreve: “Representações visuais de informações devem servir ao propósito analítico em questão; se uma questão importante é uma possível relação de causa e efeito, então os gráficos devem organizar os dados de uma forma a iluminar tal ligação. Não é uma idéia complicada, mas é profunda”.

Para servir ao seu propósito analítico, a lógica que orienta a produção do gráfico tem que ter afinidade com a lógica da análise que o produtor quer induzir no leitor.

Em seguida é necessário pensar nos aspectos estruturais e de desenho dos gráficos. Primeiro lembre-se dos elementos básicos de todo gráfico e verifique-os: título, legenda, eixos (nome, escala, marcações), dados, e a área de fundo.

O título deve indicar claramente, e logo em primeira mão, as variáveis que estão sendo representadas. Ao invés de colocar o título “Evolução do preço do café”, prefira “Preço do café (R$) x Último trimestre (dias)”.

Use a rotulação direta (aquela que rotula no próprio gráfico os valores ou a variável daquela indicação) tanto quanto possível, e use as legendas somente quando os dados forem muito complexos para a rotulação direta.

E por falar em legenda e rotulação, nunca se esqueça de colocá-los, assim como as unidades de medida e o que está sendo medido. Um número sem etiqueta é um número sem sentido. Geralmente uma etiqueta tem duas partes: uma unidade de medida e uma descrição do que está sendo medido. Escreva “Litros de água”, ou “Dólares de lucro”, ou “Toneladas de soja”; deve haver sempre uma unidade de medida e a descrição do que está sendo medido. Como uma regra, sempre que houver um número, deve haver um rótulo por perto o descrevendo.

Por mais óbvio que isto pareça, os rótulos são facilmente esquecidos pelo produtor que está tão familiarizado com o gráfico que não consegue imaginar que as outras pessoas não saibam o significado das cores ou siglas.

No entanto, essas legendas e rotulações não precisam ser exageradas ou ter um peso visual muito grande. O tamanho das letras em gráficos pode ser pequena, uma vez que as frases e sentenças não são longas – e, portanto, a fonte pequena não irá fatigar o leitor da mesma forma que faria em textos longos.

Prefira sempre que possível colocar no gráfico os dados, e não as estatísticas desses dados. Assim evita-se a necessidade de explicar as suas assunções para chegar em tais resultados estatísticos, aumenta a eficiência de mostrar os dados, e permite ao consumidor fazer as suas próprias conclusões, determinar se a análise do autor é apropriada, e fazer as suas próprias análises, uma vez que têm os dados brutos em mãos.

Deixe bem clara a relação de causa e efeito entre duas variáveis. Este é outro item que pode ser negligenciado pelo produtor muito familiarizado com os próprios gráficos. Na maioria dos casos um texto acompanhando o gráfico, com explicações, análises e conclusões, é tão importante quanto o gráfico em si. E se possível, devem estar na mesma página.

O gráfico na verdade não é nada mais que uma parte do texto que usa uma forma de comunicação visual, e, portanto, deve estar integrado no texto como qualquer outro parágrafo.

Use a menor quantidade possível de marcações na área do gráfico. Cada traço desenhado deve ter alguma finalidade informativa; se não tem, apague. Evite o já comentado “lixo de gráfico”, e deixe desenhado somente o essencial. Isso significa apagar enfeites, fundos de gráfico visualmente muito pesados, linhas e números de marcação de escala em excesso, legendas demais, e tudo o mais que polui e confunde.

Tenha em mente que a seleção dos eixos para cada variável, normalmente os eixos horizontal e vertical, irão influenciar como a informação é interpretada. Assim como a seleção da escala, que deve dar preferência para as escalas lineares, que são mais fáceis de compreender e comparar. Estes dois assuntos serão explicados com mais detalhe a seguir.

quinta-feira, 2 de abril de 2009

TABELAS - INTRODUÇÃO

Tabelas são o tipo de representação ideal quando precisamos saber valores exatos, ou representar grande quantidade de números. Nenhuma representação gráfica com escalas poderia fazer isso, a não ser que indicasse o valor numérico de cada medida ou ao longo de cada linha, o que é pouco prático.

Tabelas são muito usadas em aplicações que precisam de números exatos; os contadores e analistas precisam de tabelas em demonstrativos financeiros das empresas, economistas e investidores precisam de números exatos dos índices financeiros, e os engenheiros precisam realizar cálculos com precisão baseados em números igualmente precisos.

Além disso, para exibir grandes quantidades de números as tabelas conseguem ocupar muito menos espaço do que se os mesmos dados fossem representados por outro tipo de gráfico.


Detalhe de uma tabela de índices financeiros. As tabelas com os índices do mercado financeiro são exemplos comuns e efetivos de grande quantidade de informações mostradas em tabelas. No entanto o uso extensivo de abreviações e siglas faz com que somente quem conhece o mercado financeiro compreenda os seus significados. [Valor Econômico, 25 de setembro de 2007, pág. C9. Imagem digitalizada a partir do original]

As tabelas também são indicadas para pequenas quantidades de números, é preferível usar uma tabela a ocupar espaço com um gráfico simplório. Conjuntos de dados numéricos simples devem estar em tabelas ou integrados ao texto; gráficos (que não sejam tabelas) devem ser usados para dar sentido a conjuntos de dados grandes e complexos que não podem ser representados eficazmente de outra forma.

Alguém poderia afirmar que tabelas não são gráficos, pois não fazem uso de formas geométricas, eixos ou escalas; mas a partir do momento em que elas dispõem os números de uma maneira ordenada no espaço, pode-se dizer que são uma maneira visual de ordenar a informação.

Problemas comuns em tabelas estão ligados ao seu projeto: linhas em excesso e com peso visual muito grande parecem enredar os números; falta de alinhamento entre os números; uso de resoluções diferentes para os números de um mesmo parâmetro; falta das unidades de medida; e uso de abreviações em excesso, são alguns dos defeitos mais comuns.