em , ,

R na Prática – parte 4 – Elementos de Programação em Linguagem R

No artigo anterior, vimos como executar um código R em 3 passos, nesse artigo, veremos que quando se programa em alguma linguagem de computador, é fundamental saber como se faz a leitura e a gravação de arquivos.

Neste texto, todos os arquivos, sejam de entrada ou de saída, serão padronizados para o formato CSV do Excel. Assim, os comandos descritos a seguir se referem a esse formato de arquivo. Tanto para leitura, como para gravação de arquivos há necessidade de se definir o diretório no qual se encontra o arquivo para leitura ou o destino de gravação.

Assim, geralmente os comandos de leitura e/ou gravação são precedidos do comando para definição do diretório (set working directory). Para leitura, faça:

script 1

O primeiro comando define o diretório onde está o arquivo chamado simetrica225.csv. Observe-se que o caminho para o arquivo está separado por duas barras invertidas. Em seguida, tem-se o comando read.csv() que faz a leitura do arquivo, sendo definido o separador de valores igual a ponto e vírgula (;) e a opção header igual a TRUE.

Quando o header é TRUE significa que a primeira linha do arquivo contém a identificação  das variáveis correspondentes às colunas do arquivo de entrada. Com relação ao separador, no Brasil, o Excel gera o arquivo CSV com valores separados por ponto e vírgula.

A leitura faz a atribuição para um objeto chamado dados. A leitura de um arquivo no R transforma automaticamente em um objeto (que será descrito no item seguinte). O processo de leitura e atribuição para um objeto pode ser observado na Figura 4.

Figura 4: Leitura de arquivo tipo CSV e conversão para um objeto do R.

  Para a gravação de um arquivo de saída, pode-se usar o seguinte comando:

script 2

Nesse caso, o arquivo será gravado sem os nomes das colunas. O header obrigatoriamente será gravado no arquivo de saída. No R, o CSV gravado tem a vírgula (,) como separador de valores. Então, ao ler um arquivo gravado em algum script do R, deve-se alterar o separador para vírgula.

Para não depender de nenhum arquivo de entrada, vamos fazer primeiro uma gravação e depois a sua leitura usando os comandos descritos.

O exemplo a seguir gera um data frame chamado arquivo. Grava-se o data frame com o comando write.csv(), em seguida, faz-se a leitura como um data frame chamado dados. Na leitura do arquivo, deve-se informar o separador que agora passa a ser “,”, pois foi o arquivo foi gravado a partir de uma execução de um script. O resultado da execução é mostrado a seguir.

script 3

Próximo Artigo

No próximo artigo, iremos tratar dos objetos em R. Para mostrar um pequeno exemplo, vamos considerar o seguinte código que gera três objetos que são combinados na forma de um data frame, que é uma estrutura de dados muito comum na linguagem R.

script 4

Neste script, criamos os objetos x e y e uma sequência de letras minúsculas. Depois, combinamos esses objetos como um data frame chamado dados. A funcao cbind() é usada para combinar objetos por colunas. Observar que estamos introduzindo novas funções a cada artigo, mesmo que alguns só venham a ser tratados posteriormente.

Jorge Kazuo Yamamoto

Escrito por Jorge Kazuo Yamamoto

Prof. Dr. Jorge Kazuo Yamamoto, fundador da Geokrigagem, é geólogo, foi pesquisador do IPT e docente do Instituto de Geociências da USP, onde se aposentou como Professor Titular do Departamento de Geologia Sedimentar e Ambiental. Atualmente, atua como Professor Sênior do Departamento de Engenharia de Minas e de Petróleo – Escola Politécnica – USP. É responsável pela disciplina “Métodos geoestatísticos” na Pós-Graduação do IPT – Investigação do subsolo: Geotecnia e Meio Ambiente. Dedica-se ao ensino de geoestatística, com ênfase no desenvolvimento de algoritmos e pesquisa de novas aplicações, tais como: variância de interpolação, cálculo da variância global de depósitos minerais e correção do efeito de suavização da krigagem. Ultimamente, seu interesse está voltado para o ensino e divulgação da linguagem R.

Deixe uma resposta

O seu endereço de e-mail não será publicado. Campos obrigatórios são marcados com *

R na Prática – parte 3 – Elementos de Programação em Linguagem R

R na prática – Parte 5 – Elementos de Programação em Linguagem R