No artigo anterior, vimos como executar um código R em 3 passos, nesse artigo, veremos que quando se programa em alguma linguagem de computador, é fundamental saber como se faz a leitura e a gravação de arquivos.
Neste texto, todos os arquivos, sejam de entrada ou de saída, serão padronizados para o formato CSV do Excel. Assim, os comandos descritos a seguir se referem a esse formato de arquivo. Tanto para leitura, como para gravação de arquivos há necessidade de se definir o diretório no qual se encontra o arquivo para leitura ou o destino de gravação.
Assim, geralmente os comandos de leitura e/ou gravação são precedidos do comando para definição do diretório (set working directory). Para leitura, faça:
O primeiro comando define o diretório onde está o arquivo chamado simetrica225.csv. Observe-se que o caminho para o arquivo está separado por duas barras invertidas. Em seguida, tem-se o comando read.csv() que faz a leitura do arquivo, sendo definido o separador de valores igual a ponto e vírgula (;) e a opção header igual a TRUE.
Quando o header é TRUE significa que a primeira linha do arquivo contém a identificação das variáveis correspondentes às colunas do arquivo de entrada. Com relação ao separador, no Brasil, o Excel gera o arquivo CSV com valores separados por ponto e vírgula.
A leitura faz a atribuição para um objeto chamado dados. A leitura de um arquivo no R transforma automaticamente em um objeto (que será descrito no item seguinte). O processo de leitura e atribuição para um objeto pode ser observado na Figura 4.
Para a gravação de um arquivo de saída, pode-se usar o seguinte comando:
Nesse caso, o arquivo será gravado sem os nomes das colunas. O header obrigatoriamente será gravado no arquivo de saída. No R, o CSV gravado tem a vírgula (,) como separador de valores. Então, ao ler um arquivo gravado em algum script do R, deve-se alterar o separador para vírgula.
Para não depender de nenhum arquivo de entrada, vamos fazer primeiro uma gravação e depois a sua leitura usando os comandos descritos.
O exemplo a seguir gera um data frame chamado arquivo. Grava-se o data frame com o comando write.csv(), em seguida, faz-se a leitura como um data frame chamado dados. Na leitura do arquivo, deve-se informar o separador que agora passa a ser “,”, pois foi o arquivo foi gravado a partir de uma execução de um script. O resultado da execução é mostrado a seguir.
Próximo Artigo
No próximo artigo, iremos tratar dos objetos em R. Para mostrar um pequeno exemplo, vamos considerar o seguinte código que gera três objetos que são combinados na forma de um data frame, que é uma estrutura de dados muito comum na linguagem R.
Neste script, criamos os objetos x e y e uma sequência de letras minúsculas. Depois, combinamos esses objetos como um data frame chamado dados. A funcao cbind() é usada para combinar objetos por colunas. Observar que estamos introduzindo novas funções a cada artigo, mesmo que alguns só venham a ser tratados posteriormente.
Um Comentário
Deixe uma respostaOne Ping
Pingback:R na prática – Parte 5 – Elementos de Programação em Linguagem R