em ,

Geoestatística no R – Lição 7: Análises descritivas dos dados

R propõe várias ferramentas para realizar análises descritivas de um conjunto de dados. Nesta lição, usaremos exemplos com dados aleatórios de uma distribuição poisson e, construiremos uma tabela de frequências para quatro variáveis e assim obteremos, medidas de tendência central, medidas de dispersão e posição entre outras, além disso, representamos a tabela de freqüência por meio de gráficos já visto na lição 5.

A tabela a seguir mostra os comandos básicos que usamos na lição,para análise de dados:

No primeiro exemplo, para calcular as diferentes medidas propostas no quadro anterior, construímos, principalmente, as variáveis no script de R-project e consecutivamente, converter o objeto vetorial em objeto fator, que é a maneira como R armazena os variáveis categóricos.

  • A tabela a seguir mostra 16 pessoas da idade entre 20 a 40 anos, onde foram questionadas sobre sexo, nível de estudo superior e classe social.

Tabela 1

Variáveis:

Sexo

(Mulher(1), Homem(2))

Estudo superior

(Graduação(2), Mestre(3), Doutorado(4))

Classe social

(Elite(A), Alto media (B),Media(C),Remediados(D),Pobres(E))

As variáveis escritas no script de R, na forma de um vetor.

Mudar o vetor em fator por meio da seguinte expressão:

A criação de tabelas unidimensionais, de frequência cruzada ou de contingência para duas variáveis categóricas e tabelas de proporções são usadas as funções table() e prop.table(), respectivamente.

Cálculo de estatística descritiva

Usando os comandos da tabela 1

A função summary() fornece um resumo descritivo dos dados. Se é um vetor numérico, a função calcula o máximo, o mínimo, a média, a mediana e os três quartis dos dados. Se a variável é um fator, a função indica o número de observações em cada nível.

A representação gráfica dos dados será projetada por meio dos comandos vistos na lição 5, tais como: hist(), boxplot, e barplot()

 

 

  • para o segundo exemplo, usamos dados aleatórios, a partir de uma distribuição poisson, e obteremos uma análise descritiva dos dados, usando alguns funções presentes na tabela de comandos.

Escrito por Equipe Geokrigagem

Deixe uma resposta

O seu endereço de e-mail não será publicado. Campos obrigatórios são marcados com *

Geoestatística no R – Lição 6: Paleta de Cores

Preservação da qualidade dos dados na mineração