O ensino de geoestatística deve ser acompanhado da prática em computador, seja por meio de programas comerciais ou elaborados pelos próprios leitores. A conexão entre a teoria e prática consolida o aprendizado das técnicas geoestatísticas. O conhecimento de uma linguagem de programação deveria ser um pré-requisito para o geoestatístico.
Da teoria à prática
A elaboração de um programa de computador requer um sólido conhecimento da teoria e de algoritmos, mas durante a implementação podem surgir dúvidas que são solucionadas recorrendo aos conceitos teóricos. Por isso, a programação consolida o conhecimento da teoria e, sobretudo, permite fazer aplicações práticas. Nesse sentido, deve-se ter uma linguagem de programação que permita atingir esses objetivos. Existem dezenas de linguagens de programação, que requerem muito estudo e principalmente a prática para sua utilização.
Pelas razões descritas a seguir, a linguagem R foi escolhida para fazer as aplicações práticas das técnicas geoestatísticas. A grande vantagem da linguagem R é a imensa quantidade de pacotes disponíveis, disponibilizados pela comunidade e intensamente testados, tornando-a extremamente confiável. Além disso, a facilidade e simplicidade de sua linguagem permitem o rápido aprendizado de R, tornando-a bastante popular. A imagem abaixo apresenta o tráfego no site da Stackoverflow, que é especializado em perguntas e respostas de programadores nas mais diversas linguagens.
Como se pode verificar nesta figura, a linguagem R e C apresentam praticamente o mesmo tráfego no sítio da Stackoverflow, em meados de 2017. Contudo, a linguagem R tem desenvolvimento recente com o início do Projeto R por Robert Gentleman e Ross Ihaka do Departamento de Estatística da Universidade de Auckland em 1995 (Owen, 2010, p. 1). Assim, apesar de ter praticamente o mesmo número de acessos, naquele período, a linguagem R mostra um crescimento impressionante.
Por que escolher o R como sua linguagem de programação?
A linguagem R é um ambiente integrado de pacotes que permitem a manipulação de dados, realização de cálculos e representação gráfica (Venables et al. 2020, p. 2). Segundo esses autores, a linguagem R oferece as seguintes facilidades:
- tratamento efetivo de dados e facilidade de armazenamento;
- um conjunto de operadores para cálculo em matrizes;
- uma enorme coleção de ferramentas integradas e coerentes para análise de dados;
- facilidades gráficas para análise de dados e representação diretamente no console ou em arquivos;
- uma linguagem de programação bem desenvolvida, simples e efetiva que inclui comandos condicionais, de laço, funções recursivas definidas pelo usuário e recursos de entrada e saída.
Nesta série de artigos, pretende-se descrever os elementos básicos da linguagem R, não só para apoiar a leitura e interpretação dos scripts que serão desenvolvidos nos próximos artigos, mas também para dar suporte ao Leitor para praticar a programação de seus próprios algoritmos.
Observação: este artigo foi derivado do livro Elementos de programação em linguagem R, de Jorge Kazuo Yamamoto, com previsão de lançamento para final de 2020.
Confira nossos livros clicando aqui.
Referências bibliográficas
Owen, W.J. 2010. The R guide. Richmond, Department of Mathematics and Computer Science. 57p. https://cran.r-project.org/doc/contrib/Owen-TheRGuide.pdf. Acessado em 03/04/2020.
Robinson, D. 2017. The impressive growth of R. https://stackoverflow.blog/2017/10/10/impressive-growth-r/ Acessado em 03/04/2020.
Venables, W.N. ; Smith, D.M.; R Core Team. 2018. An introduction to R. https://cran.r-project.org/doc/manuals/r-release/R-intro.pdf. Acessado em 03/04/2020.
Yamamoto, J.K. 2020. Elementos de programação em linguagem R. São Paulo, JK Yamamoto. (em preparação).