em ,

Probabilidade Condicional: Fórmula de Bayes

A colocação do problema, conforme segue, foi baseada inteiramente em Caers (2011, p. 19). A probabilidade de encontrar diamante em uma região é uma probabilidade incondicional. Mas, à medida que mais dados se tornam disponíveis (por exemplo, a rocha é kimberlítica e granadas são encontradas), a probabilidade de um evento irá aumentar ou diminuir, cuja magnitude é governada pela fórmula de Bayes (Caers, 2011, p. 19).

Sejam dois eventos A e B, com P(A) > 0, denomina-se probabilidade condicional P(B|A) a probabilidade de B dado que A ocorreu (Spiegel et al. 2013, p. 7). Um valor de probabilidade calculado sob a suposição que um outro evento tenha ocorrido é chamado de probabilidade condicional, segundo Lapin (1998, p. 79).

(1)

Como a conjunção é comutativa para quaisquer eventos A e B (Downey, 2012, p. 3), ou seja:

            Pode-se escrever:

(2)

            Dividindo-se (1) por (2), tem-se a fórmula de Bayes (Downey, 2012, p. 4):

(3)

A regra de Bayes é um método rigoroso para interpretação de evidência no contexto de experiência prévia ou conhecimento (Stone, 2013, p. 1).

Qual é a probabilidade de um depósito de diamante ser economicamente viável?

Para ilustrar uma aplicação prática da Fórmula de Bayes, considere-se o exemplo dado por Caers (2011, p. 20), com adaptações livres desse Autor. Um geólogo que trabalhou por 30 anos na indústria do diamante sabe da sua experiência que 1/10 dos depósitos que estudou são economicamente viáveis. Agora, ele precisa avaliar um novo depósito e calcular a probabilidade que esse depósito é viável. Ele sabe que a probabilidade de a granada ser maior que 5 ppm em depósitos viáveis é 4/5, enquanto para aqueles não viáveis é apenas 2/5. Então, nesse novo depósito, o conteúdo de granada é 6,5 ppm.

Para a solução desse problema, sejam os seguintes eventos: E1 = o depósito é viável; E2 = o depósito não é econômico; F1 = teor de granada é > que 5 ppm; F2 = o teor de granada é £ 5 ppm (Caers, 2011, p. 20).

Pela fórmula de Bayes, deve-se determinar a probabilidade que o depósito é viável, dado que o teor de granada é maior que 5 ppm, isto é:

Na verdade, há necessidade de se determinar P(F1), o teor de granada que pode ser maior que 5 ppm, tanto em depósitos viáveis como naqueles não econômicos. Nesse caso, usamos a Lei das Probabilidades Totais (Devore, 2000, p. 81), que diz que se existem duas maneiras exclusivas que algo pode acontecer, então se pode somar as probabilidades, como a expressão a seguir (Downey, 2012, p. 6). Desta forma, para calcular P(F1), soma-se as probabilidades, conforme:

Segundo Caers (2011, p. 20), sabe-se que a probabilidade a priori P(E1)=1/10 e, portanto, P(E2)=9/10. Também, tem-se que P(F1|E1)=4/5 e P(F1|E2)=2/5. Logo, P(F1) pode ser calculada como:

Conclusão

Portanto, sabendo que o teor de granada é maior que 5 ppm, a chance de o depósito ser economicamente viável é quase duas vezes mais (0,18 em relação a 0,10). De fato, a razão da probabilidade a posteriori sobre a probabilidade a priori é 1,81 (Caers, 2011, p. 20).

Observação: este artigo foi derivado Yamamoto (2020) “Conceitos de probabilidade e estatística”.

Referências bibliográficas

Caers, J. 2011. Modeling uncertainty in the Earth Sciences. Sussex, Wiley-Blackwell. 229p.

Devore, J.L. 2000. Probability and statistics for engineering and the sciences. Pacific Grove, Duxbury. 775p.

Downey, A.B. 2012. Think Bayes. Bayesian statistics made simple. Needham, Green Tea Press. 195p.

Lapin, L.L. 1998. Probability and statistics for modern engineering. Prospect Heights, Waveland Press. Inc. 810p.

Spiegel, M.T.; Schiller, J.J.; Srinivasan, R.A. 2013. Probability and Statistics. New York, Mc Graw Hill. 424p.

Yamamoto, J.K. 2020. Conceitos de probabilidade e estatística. In: Yamamoto, J.K. Estatística, análise e interpolação de dados geoespaciais. São Paulo, JK Yamamoto. 355p. Lançamento para julho/agosto de 2020.

Escrito por Jorge Kazuo Yamamoto

Prof. Dr. Jorge Kazuo Yamamoto, fundador da Geokrigagem, é geólogo, foi pesquisador do IPT e docente do Instituto de Geociências da USP, onde se aposentou como Professor Titular do Departamento de Geologia Sedimentar e Ambiental. Atualmente, atua como Professor Sênior do Departamento de Engenharia de Minas e de Petróleo – Escola Politécnica – USP. É responsável pela disciplina “Métodos geoestatísticos” na Pós-Graduação do IPT – Investigação do subsolo: Geotecnia e Meio Ambiente. Dedica-se ao ensino de geoestatística, com ênfase no desenvolvimento de algoritmos e pesquisa de novas aplicações, tais como: variância de interpolação, cálculo da variância global de depósitos minerais e correção do efeito de suavização da krigagem. Ultimamente, seu interesse está voltado para o ensino e divulgação da linguagem R.

Deixe uma resposta

O seu endereço de e-mail não será publicado. Campos obrigatórios são marcados com *

Como posso calcular a moda de minha distribuição de frequências?

Migração De Algoritmos para a Linguagem R