Tipos de objetos: Data Frame e List
Na linguagem R, o data frame pode ser idealizado como uma matriz com n linhas (observações) por m colunas (variáveis) com a diferença que as colunas podem conter não apenas valores numéricos, mas também caracteres, números complexos e variáveis lógicas (Tabela 8).
Trata-se do tipo de objeto de grande uso na linguagem R. Assim, torna-se importante destacar como se pode gerar um “data frame” a partir de vetores de comprimentos iguais. No exemplo a seguir, tem-se três vetores x, y e z criados com tamanhos iguais a 10, sendo x uma sequência de valores de 1 a 10, y uma sequência variando de 1 até 5.5, mas divididos por π e z o vetor que é o produto de x por y.
O script anterior mostrou como se pode gerar um data frame a partir de três vetores numéricos de comprimentos iguais. Um exemplo mais completo pode ser mostrado a partir da leitura de um arquivo de dados denominado Jura (Goovaerts, 1997, p. 4-6).
Trata-se de um caso ideal para demonstrar um data frame, pois este conjunto é composto por 359 pontos de dados, nos quais foram medidas as concentrações de sete metais pesados (cádmio, cobalto, cromo, cobre, níquel, chumbo e zinco), bem como duas variáveis categóricas: uso do solo e tipo de rocha.
Esses dados têm sido intensivamente utilizados por diversos trabalhos acadêmicos e, nesse sentido, serão empregados neste livro para ilustrar os procedimentos numéricos expostos.
Agora, pode-se fazer a leitura do arquivo jura_validation.csv, conforme os comandos seguintes. O resultado da execução mostra que a estrutura lida do arquivo já é reconhecida como um data frame.
Observe-se que cada uma das colunas do data frame pode ser acessada por meio do nome da variável: dados$Xloc, dados$Yloc, dados$Landuse, dados$Rock, dados$Cd, dados$Co, dados$Cr, dados$Cu, dados$Ni, dados$Pb e dados$Zn.
Pode-se verificar que as variáveis no data frame são identificadas pelo nome do objeto (dados), seguido do símbolo $ e do nome da coluna, como lido no arquivo CSV.
Antes de prosseguir, seria interessante introduzir a função table(), de acordo com a descrição na Tabela 9.
Aplicando-se a função table() para as variáveis dados$Rock e dados$Landuse, tem-se os resultados apresentados a seguir.
A função list() permite combinar vetores de diferentes tipos em um único objeto (Tabela 10)
O código a seguir tem um exemplo de uso da função list() que combina três vetores: “num”, “nomes” e “logico”.
Referência bibliográfica
Goovaerts, P. 1997. Geostatistics for natural resources evaluation. New York, Oxford University Press. 483p.
Próximo artigo sobre Linguagem R
Em continuidade, o próximo artigo irá tratar dos operadores usados na linguagem R. Como nas demais linguagens de programação, tem-se os operadores aritméticos, relacionais e lógicos.
Para ter acesso ao artigo anterior, acesso o nosso blog.