Conceitos básicos de distribuições teóricas de probabilidade:
Os modelos de distribuição de probabilidades são importantes na geoestatística para o entendimento da correlação espacial, por meio do variograma. A distribuição teórica de frequências é um modelo usado para representar as observações (Koch e Link, 1970). Dado um espaço amostral S com N eventos simples, todos igualmente possíveis, e sendo A um evento de S composto de m eventos simples, a probabilidade de A é definida por (Dantas, 1997):
Na verdade, as probabilidades estão intimamente associadas a proporções (Rossi e Deutsch, 2014). A distribuição de probabilidade de uma variável aleatória discreta X, definida em um espaço amostral S, é uma tabela que associa a cada valor de X, sua probabilidade (Dantas, 1997).
O espaço amostral associado a um evento é o conjunto de seus resultados possíveis, enquanto evento é definido como todo resultado ou subconjunto de resultados de um experimento. A função densidade de probabilidade de uma variável aleatória contínua é uma função, tal que (Dantas, 1997):
A probabilidade de uma variável aleatória X pertencer a um intervalo (a,b] é dada por (Dantas, 1997):
A função de distribuição acumulada que se aplica tanto a variáveis aleatórias contínuas como também às discretas, permite descrever como as probabilidades são associadas aos valores ou aos intervalos de valores de uma variável aleatória (Dantas, 1997):
Para variáveis aleatórias discretas, a função de distribuição acumulada pode ser escrita como:
ou em termos da função densidade de probabilidade para variáveis aleatórias contínuas:
A função de distribuição acumulada tem as seguintes propriedades (Dantas, 1997): monotônica crescente; contínua à direita;
A Figura 1 ilustra as funções de distribuição acumulada para variáveis aleatórias discretas (A) e para contínuas (B), nas quais se observa as propriedades mencionadas anteriormente.
Figura 1: Funções de distribuição acumulada para variáveis aleatórias discretas (A) e contínuas (B).
Na Geoestatística
Usa-se alguns modelos teóricos, dos quais os mais importantes são: normal, lognormal, uniforme e triangular. As duas primeiras são importantes para reconhecer o modelo que explica a distribuição de frequências observadas. As outras duas são empregadas em métodos de simulação estocástica.
No próximo post falaremos sobre a distribuição normal. Até lá!
Referências:
Dantas, C.A.B. 1997. Probabilidade: um curso introdutório. São Paulo, EDUSP. 253p.
Koch, G.S.; Link, R.F. 1970. Statistical analysis of geological data. New York, Dover Publications Inc. Vol. I. 375 p.; Vol. II. 438p.
Rossi, M.; Deutsch, C.V. 2014. Mineral resource estimation. Dordrecht, Springer. 332p.