Exercícios R
Em continuidade à série “R na prática”, que encerrou o tópico intitulado “Elementos de programação em linguagem R”, este artigo visa aplicar alguns exercícios para serem resolvidos após a leitura dos 14 artigos precedentes. A resolução dos exercícios será apresentada no próximo artigo.
1) Faça a instalação do pacote ggplot2 e verifique para os conjuntos de dados “diamonds” e “mpg”, os números de linhas e de colunas:
2) Execute o script a seguir que faz a gravação do arquivo .csv denominado mesesX3.csv no diretório especificado.
Em seguida, faça a leitura do arquivo criado e obtenha o conteúdo no console.
3) No script a seguir, tem-se os comandos para fazer o download de arquivos da internet. Porém ao tentar executar o script (linhas em vermelho sem o prompt >), ocorrerá um erro.
Descubra a causa do erro. Examine o arquivo andes1.txt e conte quantas variáveis aparecem no header. Lembrando que cada variável é separada por espaço(s) em branco. Assim, elimine os espaços em branco dentro do nome de cada variável que aparece no header e execute novamente.
4) Crie um vetor x variando de 1 até 15 com passos de 0,25. Em seguida, calcule o somatório e o produtório do vetor x (vide nosso artigo “R na prática – parte 7”
5) Com base no conjunto de dados “diamonds”, calcule o peso médio (carat), conforme o corte (cut), usando a função tapply(). Um exemplo de aplicação da função tapply() pode ser verificada no exemplo a seguir, que usa os teores de metais (Cr, Ni e V) em folhelhos do Pensilvaniano Superior (Davis, 2002, p. 39), pode-se calcular as médias desses metais por meio da função tapply(), como segue:
Lembrando que para acessar os vetores individuais em “diamonds”, usa-se o operador $, como, por exemplo, para o peso: diamonds$carat.
6) Crie um array com 60 valores (de 1 até 60) distribuídos em 5 matrizes de 3 linhas por 4 colunas. Identifique os elementos neste array nas seguintes posições:
Por que não é possível localizar o elemento em i=3, j=4 e k=6?
7) Crie uma matriz com 21 elementos, distribuídos em 3 linhas e 7 colunas, com a opção byrow=T. Transforme esta matriz em um vetor com os 21 elementos em sequência.
8) Ao carregar o R em seu computador, verificará que há um conjunto de dados denominado “iris”, que é composto por medidas de comprimento e largura de sépalas e pétalas de três espécies de íris (setosa, versicolor e virginica). Pede-se criar duas colunas adicionais ao data frame com os produtos do comprimento e largura de sépalas e pétalas.
9) Calcule a média do comprimento das sépalas por espécie, usando a função tapply().
10) Usando o mesmo conjunto de dados “iris”, pede-se escrever um procedimento para calcular as médias e desvios padrão por espécie. Lembrando que existem várias formas de desenvolver este procedimento, mas os resultados devem ser iguais aos obtidos anteriormente.
Vale comentar que para o cálculo do desvio padrão, o denominador da fórmula deve ser igual a (n-1), pois se trata do desvio padrão amostral.
11) Pede-se calcular uma sequência com 20 valores de:
- Números primos, iniciando em 5;
- Números de Fibonacci, começando por 0 e 1;