em , ,

R na Prática – Parte 15

Exercícios R

Em continuidade à série “R na prática”, que encerrou o tópico intitulado “Elementos de programação em linguagem R”, este artigo visa aplicar alguns exercícios para serem resolvidos após a leitura dos 14 artigos precedentes. A resolução dos exercícios será apresentada no próximo artigo.

1) Faça a instalação do pacote ggplot2 e verifique para os conjuntos de dados “diamonds” e “mpg”, os números de linhas e de colunas:

2) Execute o script a seguir que faz a gravação do arquivo .csv denominado mesesX3.csv no diretório especificado.

Em seguida, faça a leitura do arquivo criado e obtenha o conteúdo no console.

3) No script a seguir, tem-se os  comandos para fazer o download de arquivos da internet. Porém ao tentar executar o script (linhas em vermelho sem o prompt >), ocorrerá um erro.

Descubra a causa do erro. Examine o arquivo andes1.txt e conte quantas variáveis aparecem no header. Lembrando que cada variável é separada por espaço(s) em branco. Assim, elimine os espaços em branco dentro do nome de cada variável que aparece no header e execute novamente.

4) Crie um vetor x variando de 1 até 15 com passos de 0,25. Em seguida, calcule o somatório e o produtório do vetor x (vide nosso artigo “R na prática – parte 7”

5) Com base no conjunto de dados “diamonds”, calcule o peso médio (carat), conforme o corte (cut), usando a função tapply(). Um exemplo de aplicação da função tapply() pode ser verificada no exemplo a seguir, que usa os teores de metais (Cr, Ni e V) em folhelhos do Pensilvaniano Superior (Davis, 2002, p. 39), pode-se calcular as médias desses metais por meio da função tapply(), como segue:

Lembrando que para acessar os vetores individuais em “diamonds”, usa-se o operador $, como, por exemplo, para o peso: diamonds$carat.

6) Crie um array com 60 valores (de 1 até 60) distribuídos em 5 matrizes de 3 linhas por 4 colunas. Identifique os elementos neste array nas seguintes posições:

Por que não é possível localizar o elemento em i=3, j=4 e k=6?

7) Crie uma matriz com 21 elementos, distribuídos em 3 linhas e 7 colunas, com a opção byrow=T. Transforme esta matriz em um vetor com os 21 elementos em sequência.

8) Ao carregar o R em seu computador, verificará que há um conjunto de dados denominado “iris”, que é composto por medidas de comprimento e largura de sépalas e pétalas de três espécies de íris (setosa, versicolor e virginica). Pede-se criar duas colunas adicionais ao data frame com os produtos do comprimento e largura de sépalas e pétalas.

9) Calcule a média do comprimento das sépalas por espécie, usando a função tapply().

10) Usando o mesmo conjunto de dados “iris”, pede-se escrever um procedimento para calcular as médias e desvios padrão por espécie. Lembrando que existem várias formas de desenvolver este procedimento, mas os resultados devem ser iguais aos obtidos anteriormente.

Vale comentar que para o cálculo do desvio padrão, o denominador da fórmula deve ser igual a (n-1), pois se trata do desvio padrão amostral.

11) Pede-se calcular uma sequência com 20 valores de:

  1. Números primos, iniciando em 5;
  2. Números de Fibonacci, começando por 0 e 1;

Escrito por Jorge Kazuo Yamamoto

Prof. Dr. Jorge Kazuo Yamamoto, fundador da Geokrigagem, é geólogo, foi pesquisador do IPT e docente do Instituto de Geociências da USP, onde se aposentou como Professor Titular do Departamento de Geologia Sedimentar e Ambiental. Atualmente, atua como Professor Sênior do Departamento de Engenharia de Minas e de Petróleo – Escola Politécnica – USP. É responsável pela disciplina “Métodos geoestatísticos” na Pós-Graduação do IPT – Investigação do subsolo: Geotecnia e Meio Ambiente. Dedica-se ao ensino de geoestatística, com ênfase no desenvolvimento de algoritmos e pesquisa de novas aplicações, tais como: variância de interpolação, cálculo da variância global de depósitos minerais e correção do efeito de suavização da krigagem. Ultimamente, seu interesse está voltado para o ensino e divulgação da linguagem R.

Deixe uma resposta

O seu endereço de e-mail não será publicado. Campos obrigatórios são marcados com *

Interpolação – Parte 3

R na Prática – parte 16