O que são as medidas de dispersão e forma?
Continuaremos o artigo trazendo hoje as estatísticas que permitem calcular as medidas de dispersão e forma da distribuição de frequências.
A amplitude interquartil (AIQ), dada pela diferença entre o quartil superior e o quartil inferior, faz parte também das medidas de dispersão. A distribuição de frequências é dividida em quatro partes, de tal modo que o 1º quartil corresponde a 25%, o segundo a 50% e o terceiro a 75%.
A Figura 5 mostra os três quartis da distribuição de frequências dos dados da amostra normal.txt.
Figura 5: Quartis da distribuição de frequências dos dados da amostra normal.txt.
Assim, para os dados dessa amostra, a amplitude interquartil (AIQ) pode ser calculada como:
O segundo quartil que corresponde ao valor da variável a 50% da distribuição de frequências é a mediana:
O coeficiente de variação (CV) reflete também a dispersão dos dados em torno da média e é obtido como razão entre o desvio padrão e a média:
Para a distribuição de frequências Tabela 1, o coeficiente de variação é:
O resultado mostra que a dispersão é pequena, haja vista o coeficiente de variação poder apresentar resultados maiores ou iguais a 1,2. Segundo Rossi e Deutsch (2014, p. 16), distribuições de frequências com CV menores que 0,5 indicam conjuntos de dados razoavelmente bem comportados.
Entretanto, CV maiores que 2,0 ou 2,5 representam distribuições de frequências de dados com variabilidade significativa, de tal modo que alguns modelos de predição não podem ser apropriados (Rossi e Deutsch, 2014, p. 16). Koch e Link (1971, p. 364) relatam depósitos de ouro apresentando coeficientes de variação maiores que 2,6 até o máximo de 5,10.
Observe-se que o coeficiente de variação é adimensional e, portanto, esta estatística pode ser usada para comparar distribuições de frequências de unidades completamente diferentes.
As medidas de forma da distribuição de frequências são: assimetria e curtose. O coeficiente de assimetria pode ser calculado a partir do momento de 3ª ordem:
O momento de 3ª ordem pode ser positivo, negativo ou igual a zero. Geralmente, como os valores negativos anulam os positivos, o momento de 3ª ordem é sempre um número pequeno, o qual dividido pelo cubo do desvio padrão fica ainda menor.
O coeficiente de curtose mede o grau de achatamento da distribuição de frequências e pode ser calculado pelo momento de 4ª ordem:
O coeficiente de curtose é sempre uma quantidade positiva, pois é a média da somatória de diferenças elevadas a uma potência par. A curtose é usada preferencialmente para distribuições de frequências simétricas ou aproximadamente simétricas.
Os momentos de 3ª e 4ª ordens foram representados graficamente como barras proporcionais, conforme a Figura 6. Observe-se que os momentos de 2ª e 4ª ordens são simétricos em relação à média.
Figura 6: Representação gráfica dos momentos de 3ª ordem (A) e dos momentos de 4ª ordem (B).
Assim, com os momentos determinados, pode-se calcular os coeficientes de assimetria e curtose:
As estatísticas apresentadas permitem caracterizar numericamente a distribuição de frequências. O passo seguinte consiste em verificar o tipo de distribuição de probabilidades que melhor descreve a distribuição de frequências em estudo. Até o próximo post!
Referências:
Koch, G.S.; Link, R.F. 1970. Statistical analysis of geological data. New York, Dover Publications Inc. Vol. I. 375 p.; Vol. II. 438p.
Rossi, M.; Deutsch, C.V. 2014. Mineral resource estimation. Dordrecht, Springer. 332p.