em , ,

Análise de Variância (Anova) E Regressão Linear Múltipla – Parte 3

Scripts Em R Para Anova – Um Fator

Neste artigo, apresentaremos um script para fazer a análise de variância de um critério, seguindo a metodologia descrita no artigo anterior. Os resultados da execução desse script estão de acordo com os cálculos efetuados manualmente. Os dados de lixiviação bacteriana (Tabela 1 – artigo anterior) são introduzidos como objetos f1, f2 e f3 (linhas 2-4). A variável nt indica o número de níveis do fator. Os valores n1, n2 e n3 representam os tamanhos dos objetos f1, f2 e f3, respectivamente. As médias m1, m2 e m3 são calculadas por meio da função mean() do R. A variável mg recebe a grande média ou média geral (linha 9). Feito isso, calcula-se as somas dos quadrados (linhas 11 e 12). Observe-se que no R, pode-se fazer uma somatória de diferenças ao quadrado usando um único comando. Por exemplo, se não houvesse essa possibilidade o comando equivalente seria efetuar a somatória para calcular sqf1:

A natureza orientada a objetos da linguagem R torna mais simples a programação, além de deixar o código mais claro.

Em seguida, passa-se ao cálculo dos quadrados médios que são obtidos pela divisão da soma de quadrados pelos graus de liberdade (linhas 25-27). A razão F é determinada na linha 18, cujo valor é usado para calcular o valor-p, por meio da função pf() da biblioteca do R.

script GK8

Usando os recursos da linguagem R, pode-se fazer uma regressão, cujos resultados podem ser sumariados na forma de uma análise de variância, como se encontra no Script GK9. O script anterior nos auxilia a entender o procedimento da análise de variância com um fator. O entendimento do processo é importante para analisar e interpretar os resultados. Evidentemente, após o conhecimento da metodologia, pode-se usar diretamente a função de biblioteca do R.

Script GK9

No Script GK9, a análise de variância foi feita a partir dos resultados da regressão obtida por meio da função lm() do R. Nos resultados do Script GK9, verifica-se o valor do intercepto igual a 36,7143 que é exatamente igual à média m1. Os demais coeficientes combinados dão origem às demais médias, como será abordado nos próximos artigos.

Próximo artigo

Como foi mencionado, a regressão linear múltipla pode ser usada para fazer a análise de variância de um fator. Tendo em vista que a variável independente é um fator (categórica) com vários níveis, procede-se à codificação indicadora, como será descrito no próximo artigo.

Jorge Kazuo Yamamoto

Escrito por Jorge Kazuo Yamamoto

Prof. Dr. Jorge Kazuo Yamamoto, fundador da Geokrigagem, é geólogo, foi pesquisador do IPT e docente do Instituto de Geociências da USP, onde se aposentou como Professor Titular do Departamento de Geologia Sedimentar e Ambiental. Atualmente, atua como Professor Sênior do Departamento de Engenharia de Minas e de Petróleo – Escola Politécnica – USP. É responsável pela disciplina “Métodos geoestatísticos” na Pós-Graduação do IPT – Investigação do subsolo: Geotecnia e Meio Ambiente. Dedica-se ao ensino de geoestatística, com ênfase no desenvolvimento de algoritmos e pesquisa de novas aplicações, tais como: variância de interpolação, cálculo da variância global de depósitos minerais e correção do efeito de suavização da krigagem. Ultimamente, seu interesse está voltado para o ensino e divulgação da linguagem R.

Deixe uma resposta

O seu endereço de e-mail não será publicado. Campos obrigatórios são marcados com *

Análise de Variância (Anova) E Regressão Linear Múltipla – Parte 2

Análise de variância (anova) e regressão linear múltipla – parte 4