em ,

Por que aprender Geoestatística?

Em tempos de grandes transformações e mudanças cada vez mais rápidas no planeta, os dados geoespaciais têm importância crescente para a tomada de decisão, e o correto tratamento deles é a chave para a extração de informações de valor(Freitas, 2020). Ainda segundo Freitas (2020), se há poucos anos a coleta de dados geoespaciais se mostrava um obstáculo para os profissionais, hoje há abundância de dados (drones, imagens de satélites, sensores em solo, mapeamento móvel, internet das coisas etc.) e o novo desafio torna-se buscar sentido em um mar de informação, em distintas áreas, como agricultura de precisão, resolução de crimes, monitoramento ambiental, distribuição espacial de doenças, entre tantas outras que têm na geografia um importante aliado.

Como muito bem introduzido por Freitas (2020), deve-se proceder a um correto tratamento dos dados geoespaciais visando à extração de informações de valor. Nesse sentido, a geoestatística proporciona um conjunto de ferramentas para o estudo da distribuição e variabilidade espaciais da variável de interesse.

A Figura 1 ilustra o processo de extração de informação a partir dos dados, com base no conhecimento, entendimento e sabedoria.

Figura 1: Esquema mostrando a transformação de dados em informação, baseado em Marjoribanks (2010, p. vii).

Vale a pena lembrar que (Marjoribanks, 2010, p. vii):

  • Dado não é informação;
  • Informação não é conhecimento;
  • Conhecimento não é entendimento; e
  • Entendimento não é sabedoria.

A geoestatística proporciona um conjunto de ferramentas que podem ser aplicadas para extração de informações a partir de dados geoespaciais. Georges Matheron em 1962-1963 formaliza a Teoria das Variáveis Regionalizadas e é considerado o criador da geoestatística. Segundo Matheron (1971), a Teoria das Variáveis Regionalizadas tem dois objetivos: teoricamente, descrever a correlação espacial; na prática, resolver problemas de estimativa de uma variável regionalizada com base em uma amostra.

A correlação espacial pode ser descrita por meio do modelo de variograma e a estimativa pode ser feita por meio da krigagem. Neste artigo, vamos focar nos dois objetivos principais da geoestatística, segundo Matheron (1971). A geoestatística foi definida por Matheron (1971) como a aplicação da Teoria das Variáveis Regionalizadas para a estimativa de depósitos minerais no sentido amplo. Entretanto, atualmente a geoestatística encontra aplicações nos mais diversos campos do conhecimento, entre os quais (Medeiros, 2020):

  • Geografia;
  • Geologia;
  • Biologia;
  • Ecologia;
  • Mineração;
  • Engenharias diversas (de minas, civil, ambiental, florestal, sanitária, elétrica etc.);
  • Arquitetura;
  • Meio ambiente;
  • Zootecnia;
  • Veterinária;
  • Epidemiologia;
  • Agricultura de precisão;
  • Agrimensura;
  • Arqueologia;
  • Segurança pública.

Em conclusão, a geoestatística é multiprofissional e pode ser exercida pelos profissionais habilitados nas áreas de conhecimento mencionadas. Para isso, há necessidade de uma formação complementar em geoestatística que pode ser adquirida em disciplinas de graduação, especialização ou pós-graduação. Mas, essa formação complementar pode ser obtida individualmente por esforço próprio usando recursos disponíveis na Web e literatura especializada. Por exemplo, o estudante de Geologia, Alexander Maciel, nos brindou com um depoimento espontâneo, em 04/07/2020, conforme os trechos, a seguir:

Tudo bem Professor Kazuo? Meu nome é Alex sou estudante de Geologia da Universidade Federal de Uberlândia. Como frequentador assíduo da Geokrigagem (geokrigagem.com.br) notei que o site está com cara nova e que o senhor resolveu investir no marketing digital da empresa.


Professor Kazuo, sou eternamente grato ao senhor pelo pouco que sei de geoestatística. Foi através do seu livro Geoestatística: conceitos e aplicações e dos materiais disponibilizados pelo senhor no site, que dei início ao meu estudo em geoestatística. Isso foi fundamental para minha carreira como Geólogo, a partir disso ela começou a fazer algum sentido. Seus ensinamentos mudaram minha vida, professor. Se hoje tenho um bom estágio foi graças a esse pouco que aprendi com o senhor. Eu vou fazer seu curso presencial e poder agradecê-lo pessoalmente. Vou adquirir seu novo livro que trata de geoestatística com linguagem R. Por ser um software livre ele tem um grande potencial.

Por onde começar…

Assim como o Alex, eu comecei a estudar geoestatística apoiado em um livro intitulado “Mining geostatistics”, de Journel e Huijbregts, publicado em 1978. Além das técnicas geoestatísticas, o livro continha programas de computador em Fortran IV. Interpretando o código em Fortran IV, comecei a entender a teoria apresentada no livro. Por exemplo, foi possível assimilar a técnica para o cálculo de variogramas experimentais para dados irregularmente distribuídos quando analisei o programa denominado GAMA3, que permitiu fazer a conexão entre a teoria e a prática. Este foi o meu começo.

Dessa forma, tomo a liberdade de sugerir ao Leitor os seguintes passos para aprender geoestatística:

  • Escolher uma linguagem de programação, de preferência open source (R ou Python). Se escolher R, temos vários artigos da série R na prática;
  • Estudar um tópico de geoestatística, usando recursos disponíveis na Web, por nesse exemplo, ou em livro texto;
  • Aplicar um script relativo ao tópico estudado;
  • Ver como as fórmulas são aplicadas no script. Esta conexão entre a teoria e a prática é fundamental no aprendizado da geoestatística.

Por que open source?

Open source significa usar programa de código aberto, valendo-se do desenvolvimento feito por terceiros e deixando o seu código disponível para a comunidade no sistema colaborativo que caracteriza as plataformas open source. Além disso, o programa é totalmente grátis e, portanto, livre de licenças e taxas de manutenção. A utilização de um programa não registrado é uma infração grave à Lei dos Direitos Autorais.

Variograma

Como mencionado inicialmente, o variograma é ferramenta utilizada na geoestatística para descrever o modelo de correlação espacial. Apenas a título de ilustração, a Figura 2 representa um variograma típico com patamar e identificação das suas propriedades.

Figura 2: Propriedades de um variograma típico com patamar (Yamamoto, 2020, p. 120).

Krigagem

A partir do modelo de correlação espacial, pode-se estimar valores da variável de interesse em pontos ou blocos não amostrados (Figura 3). A krigagem é um nome genérico dado a uma família de estimadores lineares baseados na minimização da variância do erro.

Figura 3: Desenho esquemático mostrando a krigagem pontual e a krigagem de bloco (fonte: Yamamoto, 2020, p. 188).

Os resultados da krigagem podem ser representados em mapas imagem, como o exemplo mostrado na Figura 4. Na Figura 4A, tem-se o mapa interpolado por krigagem simples e na Figura 4B, o mapa da distribuição das incertezas. No caso, a variância de krigagem simples é usada como uma medida de incerteza. Lembrando que qualquer estimativa para ser completa, ela deve ser acompanhada da sua incerteza. Na verdade, a krigagem foi a primeira técnica de estimativa a proporcionar uma medida de incerteza, por meio da variância de krigagem.

Figura 4: Resultados da krigagem simples: mostrando a distribuição espacial da variável de interesse (A) e a variância de krigagem simples (B). Fonte: Yamamoto (2020, p. 191).

Estatística, análise e interpolação de dados geoespaciais

Neste livro, dois capítulos são dedicados à geoestatística: Capítulo 5: Análise geoestatística e Capítulo 7: Krigagem.

O Capítulo 6 contempla os métodos de interpolação de dados 2D, onde são apresentados os conceitos básicos (malha regular, fronteira convexa, pesquisa de vizinhos próximos, validação cruzada) e os métodos globais (superfícies de tendência, equações multiquádricas e inverso da distância) e os métodos locais de interpolação (funções de base radial, inverso da distância, triangulação de Delaunay e vizinho mais próximo), bem como a interpolação de dados categóricos (tipos de solo, grau de alteração etc.).

No Capítulo 8, tem-se mais de 50 scripts em R, que abrangem praticamente todo o conteúdo teórico do livro. Além disso, tem-se o Capítulo Bônus contendo elementos de programação em linguagem R. Este livro procura fazer a conexão entre a teoria e a prática na análise e interpolação de dados geoespaciais, por meio de scripts em R.

Conclusão

A geoestatística se tornou um campo de atuação profissional que pode ser exercida por graduados nas mais distintas áreas do conhecimento, que usam dados geoespaciais. A atuação profissional pode ser tanto acadêmica como empresarial. O profissional com conhecimento de geoestatística tem uma perspectiva para sua colocação no mercado de trabalho. Algumas áreas já estão consolidadas como, por exemplo, geologia, mineração, agricultura de precisão, meio ambiente, petróleo e geotecnia, mas outras poderão ser estabelecidas no futuro. O aprendizado da geoestatística pode ser facilitado imensamente quando se conhece uma linguagem de programação. Para aqueles que pretendem começar em geoestatística, variograma e krigagem são os tópicos básicos e essenciais.

Agradecimentos

O Autor expressa seus agradecimentos ao Anderson Medeiros pela autorização para publicação deste artigo, que foi tema de uma live promovida pela ClickGeo em 16 de novembro de 2020.

Referências bibliográficas

Freitas, E. 2020. Sinopse do livro “Estatística, análise e interpolação de dados geoespaciais”. São Paulo, Gráfica Paulo’s. 344 p.

Journel, A.G.; Huijbregts, C.J. 1978. Mining geostatistics. London, Academic Press. 600p.

Marjoribanks, R. 2010. Geological methods in mineral exploration and mining. Heidelberg, Springer. 238p.

Matheron, G. 1971. The theory of regionalized variables. Paris, ENSMP. 211p.

Medeiros, A.M.L. 2020. Prefácio do livro “Estatística, análise e interpolação de dados geoespaciais”. São Paulo, Gráfica Paulo’s. 344 p.

Yamamoto, J.K. 2020. Estatística, análise e interpolação de dados geoespaciais. São Paulo, Gráfica Paulo’s. 344 p.

Escrito por Jorge Kazuo Yamamoto

Prof. Dr. Jorge Kazuo Yamamoto, fundador da Geokrigagem, é geólogo, foi pesquisador do IPT e docente do Instituto de Geociências da USP, onde se aposentou como Professor Titular do Departamento de Geologia Sedimentar e Ambiental. Atualmente, atua como Professor Sênior do Departamento de Engenharia de Minas e de Petróleo – Escola Politécnica – USP. É responsável pela disciplina “Métodos geoestatísticos” na Pós-Graduação do IPT – Investigação do subsolo: Geotecnia e Meio Ambiente. Dedica-se ao ensino de geoestatística, com ênfase no desenvolvimento de algoritmos e pesquisa de novas aplicações, tais como: variância de interpolação, cálculo da variância global de depósitos minerais e correção do efeito de suavização da krigagem. Ultimamente, seu interesse está voltado para o ensino e divulgação da linguagem R.

2 Comments

Deixe uma resposta

Deixe uma resposta

O seu endereço de e-mail não será publicado. Campos obrigatórios são marcados com *

Gráficos em R (R na Prática – Parte 18)

R na Prática – Parte 19