em , ,

R na Prática – parte 16

Exercícios resolvidos em R

Em continuação aos artigos sobre R na Prática, iremos resolver os exercícios propostos no artigo anterior.

1) Verificando número de linhas e colunas em “diamonds” e “mpg”:

2) Gravação e leitura do arquivo “mesesX3.csv”. Lembrando que arquivos csv gravados no R têm a vírgula (,) como separador.

3) Vá direto à url indicada e abra o arquivo ANDES.TXT. Verifique o header do arquivo e conte quantas palavras ocorrem e quantas colunas existem no arquivo de dados. No header desse arquivo há 7 palavras separadas por espaços em branco, mas como se tem apenas 4 colunas na matriz de dados, ocorre o erro.

4) Sequência de 1 até 15 com passo de 0,25.

5) Peso médio dos diamantes conforme o corte:

6) Array de 60 valores em 5 matrizes de 3 por 4.

7) Matriz com 21 elementos, distribuídos em 3 linhas e 7 colunas, transformada em um vetor com os 21 elementos em sequência. Vide aplicação da função t().

8) Adicionando duas colunas extras ao dataframe com os produtos do comprimento e largura de sépalas e pétalas.

9) Calcule a média do comprimento das sépalas por espécie, usando a função tapply().

10) Usando o mesmo conjunto de dados “iris”, pede-se escrever um procedimento para calcular as médias e desvios padrão por espécie. Lembrando que existem várias formas de desenvolver este procedimento, mas os resultados devem ser iguais aos obtidos anteriormente.

Vale comentar que para o cálculo do desvio padrão, o denominador da fórmula deve ser igual a (n-1), pois se trata do desvio padrão amostral. Na verdade, usa-se a seguinte fórmula para cálculo da variância amostral:

11a) 20 números primos, iniciando em 5;

11b) 20 números de Fibonacci, começando por 0 e 1;

Observação: os dois últimos exercícios foram resolvidos com base em funções publicadas na Web. Trata-se de exemplos simples, mas em algoritmos mais complexos esta possibilidade pode abreviar muito o tempo de desenvolvimento.

Escrito por Jorge Kazuo Yamamoto

Prof. Dr. Jorge Kazuo Yamamoto, fundador da Geokrigagem, é geólogo, foi pesquisador do IPT e docente do Instituto de Geociências da USP, onde se aposentou como Professor Titular do Departamento de Geologia Sedimentar e Ambiental. Atualmente, atua como Professor Sênior do Departamento de Engenharia de Minas e de Petróleo – Escola Politécnica – USP. É responsável pela disciplina “Métodos geoestatísticos” na Pós-Graduação do IPT – Investigação do subsolo: Geotecnia e Meio Ambiente. Dedica-se ao ensino de geoestatística, com ênfase no desenvolvimento de algoritmos e pesquisa de novas aplicações, tais como: variância de interpolação, cálculo da variância global de depósitos minerais e correção do efeito de suavização da krigagem. Ultimamente, seu interesse está voltado para o ensino e divulgação da linguagem R.

Deixe uma resposta

O seu endereço de e-mail não será publicado. Campos obrigatórios são marcados com *

R na Prática – Parte 15

Introdução à série R na Prática