quarta-feira, 8 de abril de 2009

CUIDADOS AO PRODUZIR GRÁFICOS - PARTE 5 - GRÁFICOS EMPILHADOS PODEM ESCONDER INFORMAÇÕES

Gráficos de áreas ou barras empilhadas são uma boa maneira de aglomerar vários conjuntos de dados numa mesma área de desenho. Porém eles também têm potencial para enganos e mentiras.

A primeira pergunta que vem é: as barras ou áreas estão colocadas uma sobre as outras, ou uma atrás das outras? Jones [JONES, Gerald Everett. How to Lie with Charts: Second Edition. Santa Monica: La Puerta Productions, 2007, pág. 40]: explica bem este problema: “As áreas ou barras estão empilhadas verticalmente – como tijolos e argamassa – ou estão em camadas uma em cima do outra – como desenhos em folhas transparentes separadas, e cada nova área começando na mesma linha horizontal na parte de baixo do gráfico? Se as áreas estão realmente empilhadas, somente os dados de baixo terão uma linha de base plana. Cada nova área terá o topo da área precedente como a sua linha de base, e qualquer flutuação nesta linha irá distorcer os altos e baixos da área seguinte.



Gráfico de barras empilhadas (à esquerda), e de áreas empilhadas (à direita), retirados do relatório de um órgão governamental europeu. Note que somente o primeiro conjunto de dados, aquele cujas barras ou áreas se iniciam no eixo horizontal, é que apresentam a mesma linha de base.

Se os dados estiverem realmente empilhados como tijolos, significa que a o conjunto de dados seguinte usa como base a parte superior do conjunto de dados anterior. Portanto, é claro que quanto maior a variação do dado que é colocado na parte de baixo, maior será o efeito de flutuação do dado que está em cima. Este efeito pode ser minimizado pelo produtor bem intencionado, que coloca perto da base o conjunto de dados com menor variação, e, portanto que causará menos flutuação aos conjuntos acima. Mas caso o produtor queira gerar confusão ou confundir o leitor, poderá colocar a variável com maior flutuação na parte de baixo, e transformar a leitura do gráfico em uma árdua tarefa.

Já os gráficos que empilham os conjuntos de dados em camadas não apresentam este problema, pois todos os conjuntos de dados começam na mesma base, o eixo horizontal. No entanto, só funcionam bem se o conjunto de dados à frente apresenta sempre valores menores do que os conjuntos de dados atrás; caso em contrário, partes dos conjuntos de dados de trás ficarão escondidos, o que pode até ser conveniente para um produtor desonesto.

O gráfico a seguir é um bom exemplo deste tipo de representação em camadas. A anterior é a de nascimentos, a camada seguinte é a de óbitos, e a camada mais frontal é a de casamentos. Esta ordem foi uma escolha lógica, pois como geralmente uma população apresenta crescimento, o número de nascimentos será maior que o de óbitos. Já o número de casamentos implica a consideração de duas pessoas, o que quase sempre irá significar um número menor que o de nascimentos e óbitos (as pessoas se casam em pares, mas nascem e morrem individualmente).

Gráfico com as estatísticas de nascimentos, óbitos e casamentos em 1916, a cada mês. Um bom exemplo de gráfico empilhado em camadas, apesar da representação visual pesada gerada pelas hachuras. Além disso, o desenho não é neutro ao usar uma corrente e cadeados para demarcar a linha dos casamentos, e poderia gerar polêmica. [Annuario de Estatística Demographo-Sanitaria de 1915-1916, pelo Dr. Sampaio Vianna, Imprensa Nacional, Rio de Janeiro, 1926. Figura entre as páginas 30 e 31. Documento disponível em http://memoria.nemesis.org.br]

0 comentários:

Postar um comentário