Cap. 4 ANOVA no R
Este capítulo começa com uma boa notícia. O R conta com diversos pacotes desenvolvidos que realizam toda a sequência de uma análise de variância, tanto para o caso balanceado, quanto para o caso desbalanceado. Ao longo deste livro serão utilizados dois pacotes:
ExpDes.pt
easyanova
Os pacotes no R são desenvolvidos e disponibilizados de forma oficial no repositório chamado de CRAN. Embora um pacote precise seguir determinadas regras mínimas para ser disponibilizado no repositório oficial, o estilo de cada desenvolvedor leva a diferenças significativas nas características e no funcionamento dos pacotes.
4.1 Pacote ExpDes.pt
O pacote ExpDes.pt
(e sua versão em inglês ExpDes
) foi desenvolvido por uma equipe da Universidade de Alfenas (Unifal) composta por Eric Batista Ferreira, Pórtya Piscitelli Cavalcanti, Denismar Alves Nogueira e outros. Este pacote realiza a análise de diversos delineamentos experimentais e desdobramentos tanto de fatores qualitativos quanto de fatores quantitativos. Para instalar o ExpDes.pt
:
O pacote ExpDes.pt
ao ser instalado trás diversas funções para analisar os seguintes delineamentos experimentais:
- DIC: delineamento inteiramente casualizado
- DBC: delineamento em blocos casualizados
- DQL: delineamento em quadrado latino
- Experimentos em esquema de fatorial duplo (em DIC e DBC)
- Experimentos em esquema de parcelas subdivididas (em DIC e DBC)
- Experimentos em esquema de fatorial duplo com um tratamento adicional (em DIC e DBC)
- Experimentos em esquema de fatorial triplo (em DIC e DBC)
- Experimentos em esquema de fatorial triplo com um tratamento adicional (em DIC e DBC)
O pacote permite ainda o desdobramento de níveis quantitativos a partir de modelos de regressão até o terceiro grau. No caso de níveis qualitativos, o desdobramento ocorre por testes de comparação múltipla incluindo:
- Teste de Tukey
- Teste de Student-Newman-Keuls (SNK)
- Teste de Scott-Knott
- Teste de Duncan
- Teste t (LSD)
- Teste t de Bonferroni (LSD protegido)
- Teste Bootstrap
Mesmo depois de instalados, os pacotes precisam ser ativados antes de serem utilizados. A ativação pode ser feita pelo comando:
## Loading required package: ExpDes.pt
## Warning: package 'ExpDes.pt' was built under R version
## 4.0.3
Uma vez ativado, as funções do pacote passam a estar disponíveis para o usuário. Para conhecer os parâmetros e o funcionamento da função, a página de ajuda pode ser consultada digitando no console ?
seguido do nome da função:
Toda função no R é composta por parâmetros obrigatórios e parâmetros opcionais. Esta indicação será obtida analisando a sintaxe da função, também disponível na página de ajuda. Como exemplo, consultando a página de ajuda da função dic
, nota-se que a sintaxe básica da funçao é:
Pela sintaxe apresentada acima, dois parâmetros são obrigatórios: trat
e resp
. Estes parâmetros correspondem às colunas da nossa base de dados em que trat
indica tratamento e resp
indica variável resposta. Os demais parâmetros não são obrigatórios pois já estão pré-definidos. Por exemplo, o parâmetro quali
está pré-definido como TRUE
. Isto implica que os níveis do tratamento serão interpretados como qualitativos. Assim, se o experimento possuir tratamento com níveis quantitativos, como por exemplo dosagem de nutrientes, o parâmetro quali
deverá ser definido como FALSE
. Os demais parâmetros optativos indicam:
mcomp
: o teste de média que será aplicado caso seja necessário realizar o desdobramento dos tratamentos. O parâmetro vem pré-definido como Teste de Tukey (tukey
).sigT
: o nível de significância para o teste de médias. Pré-definido como 5% (0,05
).sigF
: o nível de significância para o teste F da análise de variância. Pré-definido como 5% (0,05
).
O pacote ExpDes.pt
só é capaz de computar a ANOVA do Tipo I, e é por isto que os experimentos desbalanceados que possuam interação não serão analisados por meio desse pacote.
4.2 Pacote easyanova
O pacote easyanova
foi desenvolvido pelo professor Emmanuel Arnhold, que leciona disciplinas de estatística aplicada à experimentação agropecuária em nível de graduação e pós-graduação na Universidade Federal de Goiás (UFG). O pacote easyanova
pode ser utilizado para qualquer tipo de experimento - balanceado e desbalanceado - já que possui um mecanismo que define o tipo de ANOVA com base na estrutura dos dados apresentados. Para instalar o easyanova
:
Estando o pacote instalado, a sua ativação pode ser feita através da função require()
:
## Loading required package: easyanova
## Warning: package 'easyanova' was built under R version
## 4.0.3
Diferentemente do pacote ExpDes.pt
, o easyanova possui apenas duas funções básicas para análise de experimentos:
ea1()
ea2()
A definição do delineamento e/ou do esquema é feito através de um parâmetro dentro destas duas funções. Assim, através da definição do parâmetro design
, a função ea1()
é capaz de analisar os seguintes delineamentos:
- inteiramente casualizado
- blocos casualizados
- quadrado latino
- several latin squares
- análise de covariância (dic)
- análise de covariância (dbc)
- blocos incompletos tipo I e II
- blocos incompletos tipo III ou blocos aumentados
- blocos incompletos tipo III em experimentos com animais
- lattice (intra-blocos)
- lattice (inter-blocos)
- switchback
- switchback em blocos
- teste Kruskal-Wallis
- teste Friedman
Já a função ea2()
é capaz, através da definição do parâmetro design
, de analisar os seguintes delineamentos:
- fatorial duplo inteiramente casualizado
- fatorial duplo em blocos casualizados
- fatorial duplo em quadrados latinos
- parcela subdividida inteiramente casualizado
- parcela subdividida em blocos casualizados
- parcela dividida em quadrados latinos
- fatorial triplo inteiramente casualizado
- fatorial triplo em blocos casualizados
- fatorial duplo em parcela subdividida (DIC)
- fatorial duplo em parcela subdividida (DBC)
- blocos hierárquicos
- quadrado latino com linhas hierárquicas
- quadrado latino com linhas e colunas hierárquicas
Uma diferença importante entre os pacotes ExpDes.pt
e easyanova
é a forma de apresentação dos dados. No ExpDes.pt
apresenta-se os vetores correspondentes às fontes de variação isoladamente: um vetor com os tratamentos (ex: dic2$Tratamento
), depois um vetor com a variável de interesse (ex: dic2$Altura
).
Já no pacote easyanova
, as fontes de variação devem ser apresentadas em forma de dataframe contendo exatamente as fontes de variação, variável de interesse e a repetição. Para cada um dos delineamentos suportados, o pacote easyanova
apresenta uma base exemplo que pode ser verificada via página de ajuda: ?ea1
ou ?ea2
.
Como exemplo, o experimento em delineamento inteiramente casualizado seria analisado através da função ea1()
cuja sintaxe básica é:
O parâmetro design
vem pré-definido como 1. Assim, fique atento em defini-lo de acordo com o delineamento correto do seu experimento.
Embora pela sintaxe acima, o único parâmetro obrigatório seja a base de dados - data
, fica evidente que o design
também precisa ser corretamente informado, de acordo com o delineamento do experimento a ser analisado. Um outro parâmetro opcional que vale a pena ser mencionado aqui é o plot
. Três opções podem ser utilizadas para este parâmetro:
1
- indicando gráfico boxplot dos resíduos.
2
- indicando gráfico de dispersão dos resíduos padronizados em função dos dados sequenciais.
3
- indicando gráfico de dispersão dos resíduos padronizados em função dos quantis teóricos.
As funções ea1()
e ea2()
retornam uma lista contendo a análise de variância, os desdobramentos e os testes de comparações múltiplas. O conteúdo da lista serão apresentados durante os exemplos dos capítulos subsequentes.
Lembre-se! Delineamentos balanceados serão analisados no pacote ExpDes.pt
(ou sua versão com saídas em inglês ExpDes
). Já os delineamentos desbalanceados serão analisados com o pacote easyanova
.