em

Estatísticas descritivas: medidas de dispersão e forma

O que são as medidas de dispersão e forma?

Continuaremos o artigo trazendo hoje as estatísticas que permitem calcular as medidas de dispersão e forma da distribuição de frequências.

A amplitude interquartil (AIQ), dada pela diferença entre o quartil superior e o quartil inferior, faz parte também das medidas de dispersão. A distribuição de frequências é dividida em quatro partes, de tal modo que o 1º quartil corresponde a 25%, o segundo a 50% e o terceiro a 75%.

eq1

A Figura 5 mostra os três quartis da distribuição de frequências dos dados da amostra normal.txt.

fig6

Figura 5: Quartis da distribuição de frequências dos dados da amostra normal.txt.

Assim, para os dados dessa amostra, a amplitude interquartil (AIQ) pode ser calculada como:

eq2

O segundo quartil que corresponde ao valor da variável a 50% da distribuição de frequências é a mediana:

eq3

O coeficiente de variação (CV) reflete também a dispersão dos dados em torno da média e é obtido como razão entre o desvio padrão e a média:

eq4

Para a distribuição de frequências Tabela 1, o coeficiente de variação é:

eq5

O resultado mostra que a dispersão é pequena, haja vista o coeficiente de variação poder apresentar resultados maiores ou iguais a 1,2. Segundo Rossi e Deutsch (2014, p. 16), distribuições de frequências com CV menores que 0,5 indicam conjuntos de dados razoavelmente bem comportados.

Entretanto, CV maiores que 2,0 ou 2,5 representam distribuições de frequências de dados com variabilidade significativa, de tal modo que alguns modelos de predição não podem ser apropriados (Rossi e Deutsch, 2014, p. 16). Koch e Link (1971, p. 364) relatam depósitos de ouro apresentando coeficientes de variação maiores que 2,6 até o máximo de 5,10.

Observe-se que o coeficiente de variação é adimensional e, portanto, esta estatística pode ser usada para comparar distribuições de frequências de unidades completamente diferentes.

As medidas de forma da distribuição de frequências são: assimetria e curtose. O coeficiente de assimetria pode ser calculado a partir do momento de 3ª ordem:

eq6

O momento de 3ª ordem pode ser positivo, negativo ou igual a zero. Geralmente, como os valores negativos anulam os positivos, o momento de 3ª ordem é sempre um número pequeno, o qual dividido pelo cubo do desvio padrão fica ainda menor.

O coeficiente de curtose mede o grau de achatamento da distribuição de frequências e pode ser calculado pelo momento de 4ª ordem:

eq7

O coeficiente de curtose é sempre uma quantidade positiva, pois é a média da somatória de diferenças elevadas a uma potência par. A curtose é usada preferencialmente para distribuições de frequências simétricas ou aproximadamente simétricas.

Os momentos de 3ª e 4ª ordens foram representados graficamente como barras proporcionais, conforme a Figura 6. Observe-se que os momentos de 2ª e 4ª ordens são simétricos em relação à média.

fig5

Figura 6: Representação gráfica dos momentos de 3ª ordem (A) e dos momentos de 4ª ordem (B).

Assim, com os momentos determinados, pode-se calcular os coeficientes de assimetria e curtose:

eq8

As estatísticas apresentadas permitem caracterizar numericamente a distribuição de frequências. O passo seguinte consiste em verificar o tipo de distribuição de probabilidades que melhor descreve a distribuição de frequências em estudo. Até o próximo post!

Referências:

Koch, G.S.; Link, R.F. 1970. Statistical analysis of geological data. New York, Dover Publications Inc. Vol. I. 375 p.; Vol. II. 438p.

Rossi, M.; Deutsch, C.V. 2014. Mineral resource estimation. Dordrecht, Springer. 332p.

 

Escrito por Jorge Kazuo Yamamoto

Prof. Dr. Jorge Kazuo Yamamoto, fundador da Geokrigagem, é geólogo, foi pesquisador do IPT e docente do Instituto de Geociências da USP, onde se aposentou como Professor Titular do Departamento de Geologia Sedimentar e Ambiental. Atualmente, atua como Professor Sênior do Departamento de Engenharia de Minas e de Petróleo – Escola Politécnica – USP. É responsável pela disciplina “Métodos geoestatísticos” na Pós-Graduação do IPT – Investigação do subsolo: Geotecnia e Meio Ambiente. Dedica-se ao ensino de geoestatística, com ênfase no desenvolvimento de algoritmos e pesquisa de novas aplicações, tais como: variância de interpolação, cálculo da variância global de depósitos minerais e correção do efeito de suavização da krigagem. Ultimamente, seu interesse está voltado para o ensino e divulgação da linguagem R.

Deixe uma resposta

O seu endereço de e-mail não será publicado. Campos obrigatórios são marcados com *

estatísticas descritivas básicas

Estatísticas descritivas: tendência central e dispersão

distribuições de probabilidades contínuas

Distribuições de probabilidades contínuas