em , ,

R na Prática – Parte 27

Gráficos em R

1.3.7  Função qqplot()

A função qqplot() é usada para comparar duas distribuições de dados. Ao se fazer a busca desta função na Web, verifica-se que, além da própria função do R, existem dois outros pacotes que proporcionam a função qqplot(): “car” e “EnvStats”.

Neste item, a função qqplot() disponível no R é aplicada, conforme descrição e argumentos da Tabela P27.1. Para consultar esta função digite ?qqplot na linha de comando do R.

Tabela P27.1: Descrição e argumentos básicos da função qqplot().

Os dados disponibilizados por Goovaerts (1997, p. 4-6) configuram a situação ideal para utilização da função qqplot(). Do total de 359 pontos de amostragem, 259 são usados como dados de predição e os outros 100 são os dados de validação (Goovaerts, 1997, p. 5). Para ilustrar a distribuição dos dois conjuntos de dados, tem-se o Script P27.1 que gera o mapa de localização (Figura P27.1).

Para a leitura correta do arquivo, faça a adequação do diretório em que estiver os arquivos de dados: jura_prediction.csv e jura_validation.csv, por meio do comando setwd(), conforme a linha 1. Caso o Leitor queira direcionar a saída gráfica para um dispositivo do tipo jpeg, deve-se tirar os comentários (#) das linhas 8-10 e da linha 18, lembrando que o diretório também deve estar compatível com a organização do seu computador (linha 8).

Como se pode observar os pontos da validação com os de predição se encontram intercalados e muito próximos, apesar da escala do mapa em km. Assim, espera-se que as distribuições dos teores dos metais pesados também estejam próximas entre si. O Script P27.2 faz a plotagem do diagrama QQ-plot (Figura P27.2), que confirma as distribuições de Cr para os conjuntos de predição e validação são realmente muito semelhantes. A reta bissetriz (1:1) traçada por meio da função abline() mostra a boa correlação existente entre essas distribuições.

Referência Bibliográfica

Goovaerts, P. 1997. Geostatistics for natural resources evaluation. New York, Oxford University Press. 483p.

Próximo Artigo

 Na linguagem R existem muitas funções de alto nível que não necessitam de quase ou nenhuma intervenção do usuário. Um exemplo deste tipo de função é contour(), que permite gerar curvas de isovalores a partir de uma matriz de dados.

Na demonstração que será feita no próximo artigo, serão considerados os dados de topografia do Vulcão Maunga Whau de Auckland obtidos em uma malha regular de 10 por 10m (dados disponíveis na instalação do R).

Escrito por Jorge Kazuo Yamamoto

Prof. Dr. Jorge Kazuo Yamamoto, fundador da Geokrigagem, é geólogo, foi pesquisador do IPT e docente do Instituto de Geociências da USP, onde se aposentou como Professor Titular do Departamento de Geologia Sedimentar e Ambiental. Atualmente, atua como Professor Sênior do Departamento de Engenharia de Minas e de Petróleo – Escola Politécnica – USP. É responsável pela disciplina “Métodos geoestatísticos” na Pós-Graduação do IPT – Investigação do subsolo: Geotecnia e Meio Ambiente. Dedica-se ao ensino de geoestatística, com ênfase no desenvolvimento de algoritmos e pesquisa de novas aplicações, tais como: variância de interpolação, cálculo da variância global de depósitos minerais e correção do efeito de suavização da krigagem. Ultimamente, seu interesse está voltado para o ensino e divulgação da linguagem R.

Deixe uma resposta

O seu endereço de e-mail não será publicado. Campos obrigatórios são marcados com *

Script – Parte 26.4 (Série R na Prática)

R na Prática – Parte 28