Cap. 4 ANOVA no R

Este capítulo começa com uma boa notícia. O R conta com diversos pacotes desenvolvidos que realizam toda a sequência de uma análise de variância, tanto para o caso balanceado, quanto para o caso desbalanceado. Ao longo deste livro serão utilizados dois pacotes:

  • ExpDes.pt
  • easyanova

Os pacotes no R são desenvolvidos e disponibilizados de forma oficial no repositório chamado de CRAN. Embora um pacote precise seguir determinadas regras mínimas para ser disponibilizado no repositório oficial, o estilo de cada desenvolvedor leva a diferenças significativas nas características e no funcionamento dos pacotes.

4.1 Pacote ExpDes.pt

O pacote ExpDes.pt (e sua versão em inglês ExpDes) foi desenvolvido por uma equipe da Universidade de Alfenas (Unifal) composta por Eric Batista Ferreira, Pórtya Piscitelli Cavalcanti, Denismar Alves Nogueira e outros. Este pacote realiza a análise de diversos delineamentos experimentais e desdobramentos tanto de fatores qualitativos quanto de fatores quantitativos. Para instalar o ExpDes.pt:

O pacote ExpDes.pt ao ser instalado trás diversas funções para analisar os seguintes delineamentos experimentais:

  • DIC: delineamento inteiramente casualizado
  • DBC: delineamento em blocos casualizados
  • DQL: delineamento em quadrado latino
  • Experimentos em esquema de fatorial duplo (em DIC e DBC)
  • Experimentos em esquema de parcelas subdivididas (em DIC e DBC)
  • Experimentos em esquema de fatorial duplo com um tratamento adicional (em DIC e DBC)
  • Experimentos em esquema de fatorial triplo (em DIC e DBC)
  • Experimentos em esquema de fatorial triplo com um tratamento adicional (em DIC e DBC)

O pacote permite ainda o desdobramento de níveis quantitativos a partir de modelos de regressão até o terceiro grau. No caso de níveis qualitativos, o desdobramento ocorre por testes de comparação múltipla incluindo:

  • Teste de Tukey
  • Teste de Student-Newman-Keuls (SNK)
  • Teste de Scott-Knott
  • Teste de Duncan
  • Teste t (LSD)
  • Teste t de Bonferroni (LSD protegido)
  • Teste Bootstrap

Mesmo depois de instalados, os pacotes precisam ser ativados antes de serem utilizados. A ativação pode ser feita pelo comando:

## Loading required package: ExpDes.pt
## Warning: package 'ExpDes.pt' was built under R version
## 4.0.3

Uma vez ativado, as funções do pacote passam a estar disponíveis para o usuário. Para conhecer os parâmetros e o funcionamento da função, a página de ajuda pode ser consultada digitando no console ? seguido do nome da função:

Toda função no R é composta por parâmetros obrigatórios e parâmetros opcionais. Esta indicação será obtida analisando a sintaxe da função, também disponível na página de ajuda. Como exemplo, consultando a página de ajuda da função dic, nota-se que a sintaxe básica da funçao é:

Pela sintaxe apresentada acima, dois parâmetros são obrigatórios: trat e resp. Estes parâmetros correspondem às colunas da nossa base de dados em que trat indica tratamento e resp indica variável resposta. Os demais parâmetros não são obrigatórios pois já estão pré-definidos. Por exemplo, o parâmetro quali está pré-definido como TRUE. Isto implica que os níveis do tratamento serão interpretados como qualitativos. Assim, se o experimento possuir tratamento com níveis quantitativos, como por exemplo dosagem de nutrientes, o parâmetro quali deverá ser definido como FALSE. Os demais parâmetros optativos indicam:

  • mcomp: o teste de média que será aplicado caso seja necessário realizar o desdobramento dos tratamentos. O parâmetro vem pré-definido como Teste de Tukey (tukey).
  • sigT: o nível de significância para o teste de médias. Pré-definido como 5% (0,05).
  • sigF: o nível de significância para o teste F da análise de variância. Pré-definido como 5% (0,05).

O pacote ExpDes.pt só é capaz de computar a ANOVA do Tipo I, e é por isto que os experimentos desbalanceados que possuam interação não serão analisados por meio desse pacote.

4.2 Pacote easyanova

O pacote easyanova foi desenvolvido pelo professor Emmanuel Arnhold, que leciona disciplinas de estatística aplicada à experimentação agropecuária em nível de graduação e pós-graduação na Universidade Federal de Goiás (UFG). O pacote easyanova pode ser utilizado para qualquer tipo de experimento - balanceado e desbalanceado - já que possui um mecanismo que define o tipo de ANOVA com base na estrutura dos dados apresentados. Para instalar o easyanova:

Estando o pacote instalado, a sua ativação pode ser feita através da função require():

## Loading required package: easyanova
## Warning: package 'easyanova' was built under R version
## 4.0.3

Diferentemente do pacote ExpDes.pt, o easyanova possui apenas duas funções básicas para análise de experimentos:

  • ea1()
  • ea2()

A definição do delineamento e/ou do esquema é feito através de um parâmetro dentro destas duas funções. Assim, através da definição do parâmetro design, a função ea1() é capaz de analisar os seguintes delineamentos:

  1. inteiramente casualizado
  2. blocos casualizados
  3. quadrado latino
  4. several latin squares
  5. análise de covariância (dic)
  6. análise de covariância (dbc)
  7. blocos incompletos tipo I e II
  8. blocos incompletos tipo III ou blocos aumentados
  9. blocos incompletos tipo III em experimentos com animais
  10. lattice (intra-blocos)
  11. lattice (inter-blocos)
  12. switchback
  13. switchback em blocos
  14. teste Kruskal-Wallis
  15. teste Friedman

Já a função ea2() é capaz, através da definição do parâmetro design, de analisar os seguintes delineamentos:

  1. fatorial duplo inteiramente casualizado
  2. fatorial duplo em blocos casualizados
  3. fatorial duplo em quadrados latinos
  4. parcela subdividida inteiramente casualizado
  5. parcela subdividida em blocos casualizados
  6. parcela dividida em quadrados latinos
  7. fatorial triplo inteiramente casualizado
  8. fatorial triplo em blocos casualizados
  9. fatorial duplo em parcela subdividida (DIC)
  10. fatorial duplo em parcela subdividida (DBC)
  11. blocos hierárquicos
  12. quadrado latino com linhas hierárquicas
  13. quadrado latino com linhas e colunas hierárquicas

Uma diferença importante entre os pacotes ExpDes.pt e easyanova é a forma de apresentação dos dados. No ExpDes.pt apresenta-se os vetores correspondentes às fontes de variação isoladamente: um vetor com os tratamentos (ex: dic2$Tratamento), depois um vetor com a variável de interesse (ex: dic2$Altura).

Já no pacote easyanova, as fontes de variação devem ser apresentadas em forma de dataframe contendo exatamente as fontes de variação, variável de interesse e a repetição. Para cada um dos delineamentos suportados, o pacote easyanova apresenta uma base exemplo que pode ser verificada via página de ajuda: ?ea1 ou ?ea2.

Como exemplo, o experimento em delineamento inteiramente casualizado seria analisado através da função ea1() cuja sintaxe básica é:

O parâmetro design vem pré-definido como 1. Assim, fique atento em defini-lo de acordo com o delineamento correto do seu experimento.

Embora pela sintaxe acima, o único parâmetro obrigatório seja a base de dados - data, fica evidente que o design também precisa ser corretamente informado, de acordo com o delineamento do experimento a ser analisado. Um outro parâmetro opcional que vale a pena ser mencionado aqui é o plot. Três opções podem ser utilizadas para este parâmetro:

1 - indicando gráfico boxplot dos resíduos.

2 - indicando gráfico de dispersão dos resíduos padronizados em função dos dados sequenciais.

3 - indicando gráfico de dispersão dos resíduos padronizados em função dos quantis teóricos.

As funções ea1() e ea2() retornam uma lista contendo a análise de variância, os desdobramentos e os testes de comparações múltiplas. O conteúdo da lista serão apresentados durante os exemplos dos capítulos subsequentes.

Lembre-se! Delineamentos balanceados serão analisados no pacote ExpDes.pt (ou sua versão com saídas em inglês ExpDes). Já os delineamentos desbalanceados serão analisados com o pacote easyanova.