- Comparador de Tukey e tabela
- Experimentos desequilibrados
- Caso de exemplo
- Exercício resolvido
- Referências
O teste de Tukey é um método que visa comparar médias individuais a partir de uma análise de variância de várias amostras submetidas a diferentes tratamentos.
O teste, apresentado em 1949 por John.W. Tukey, permite-nos discernir se os resultados obtidos são significativamente diferentes ou não. Também é conhecido como teste de diferença significativa honestamente de Tukey (teste HSD de Tukey).
Figura 1. O teste de Tukey nos permite discernir se as diferenças nos resultados entre três ou mais tratamentos diferentes aplicados a três ou mais grupos com as mesmas características, têm valores médios significativamente e honestamente diferentes.
Em experimentos onde três ou mais tratamentos diferentes aplicados ao mesmo número de amostras são comparados, é necessário discernir se os resultados são significativamente diferentes ou não.
Um experimento é considerado balanceado quando o tamanho de todas as amostras estatísticas é o mesmo para cada tratamento. Quando o tamanho das amostras é diferente para cada tratamento, então um experimento não balanceado é feito.
Às vezes não é suficiente com uma análise de variância (ANOVA) para saber se na comparação de diferentes tratamentos (ou experimentos) aplicados a várias amostras eles cumprem a hipótese nula (Ho: "todos os tratamentos são iguais") ou, pelo contrário, cumpre a hipótese alternativa (Ha: "pelo menos um dos tratamentos é diferente").
O teste de Tukey não é único, existem muitos mais testes para comparar médias amostrais, mas este é um dos mais conhecidos e aplicados.
Comparador de Tukey e tabela
Na aplicação deste teste é calculado um valor w denominado comparador de Tukey, cuja definição é a seguinte:
w = q √ (MSE / r)
Onde o fator q é obtido de uma tabela (Tabela de Tukey), que consiste em linhas de valores de q para diferentes números de tratamentos ou experimentos. As colunas indicam o valor do fator q para diferentes graus de liberdade. Normalmente, as tabelas disponíveis têm significância relativa de 0,05 e 0,01.
Nessa fórmula, dentro da raiz quadrada aparece o fator MSE (Mean Square of Error) dividido por r, que indica o número de repetições. O MSE é um número normalmente obtido a partir de uma análise de variâncias (ANOVA).
Quando a diferença entre dois valores médios ultrapassa o valor w (comparador de Tukey), conclui-se que são médias diferentes, mas se a diferença for menor que o número de Tukey, então são duas amostras com valor médio estatisticamente idêntico.
O número w também é conhecido como número HSD (Honestly Significant Difference).
Este único número comparativo pode ser aplicado se o número de amostras aplicadas para o teste de cada tratamento for o mesmo em cada um deles.
Experimentos desequilibrados
Quando por algum motivo o tamanho das amostras é diferente em cada tratamento a ser comparado, então o procedimento descrito acima difere um pouco e é conhecido como teste de Tukey-Kramer.
Agora, um número comparador w é obtido para cada par de tratamentos i, j:
w (i, j) = q √ (½ MSE / (ri + rj))
Nessa fórmula, o fator q é obtido da tabela de Tukey. Este fator q depende do número de tratamentos e dos graus de liberdade do erro. r i é o número de repetições no tratamento i, enquanto r j é o número de repetições no tratamento j.
Caso de exemplo
Um criador de coelhos deseja fazer um estudo estatístico confiável que lhe diga qual das quatro marcas de comida para engordar coelhos é a mais eficaz. Para o estudo, formou quatro grupos com seis coelhos de um mês e meio que até então apresentavam as mesmas condições de alimentação.
Os motivos foram que nos grupos A1 e A4 as mortes ocorreram por causas não atribuíveis à alimentação, uma vez que um dos coelhos foi picado por um inseto e, no outro caso, a morte foi certamente por causa de um defeito congênito. Então os grupos estão desequilibrados e então é necessário aplicar o teste de Tukey-Kramer.
Exercício resolvido
Para não alongar muito os cálculos, um caso de experimento equilibrado será considerado um exercício resolvido. O seguinte será considerado como dado:
Neste caso, existem quatro grupos correspondentes a quatro tratamentos diferentes. Porém, observamos que todos os grupos possuem o mesmo número de dados, portanto é um caso balanceado.
Para realizar a análise ANOVA, foi utilizada a ferramenta incorporada na planilha do Libreoffice. Outras planilhas como o Excel possuem essa ferramenta incorporada para análise de dados. Abaixo está uma tabela de resumo que resultou após a análise de variância (ANOVA) ter sido realizada:
Da análise de variância também temos o valor P, que para o exemplo é 2,24E-6, bem abaixo do nível de significância 0,05, o que leva diretamente à rejeição da hipótese nula: Todos os tratamentos são iguais.
Ou seja, entre os tratamentos, alguns possuem valores médios diferentes, mas é necessário saber quais são os diferentes estatisticamente significantes e honestamente (HSD) por meio do teste de Tukey.
Para encontrar o número wo, como o número HSD também é conhecido, precisamos encontrar o quadrado médio do erro MSE. A partir da análise ANOVA, obtém-se que a soma dos quadrados dentro dos grupos é SS = 0,2; e o número de graus de liberdade dentro dos grupos é df = 16 com esses dados, podemos encontrar MSE:
MSE = SS / df = 0,2 / 16 = 0,0125
Também é necessário encontrar o fator q de Tukey, usando a tabela. A coluna 4, que corresponde aos 4 grupos ou tratamentos a serem comparados, e a linha 16 são pesquisadas, uma vez que a análise ANOVA rendeu 16 graus de liberdade dentro dos grupos. Isso nos leva a um valor de q igual a: q = 4,33 correspondendo a 0,05 de significância ou 95% de confiabilidade. Finalmente, o valor para a "diferença honestamente significativa" é encontrado:
w = HSD = q √ (MSE / r) = 4,33 √ (0,0125 / 5) = 0,2165
Para saber quais são os grupos ou tratamentos honestamente diferentes, você tem que saber os valores médios de cada tratamento:
Também é necessário conhecer as diferenças entre os valores médios dos pares de tratamentos, o que é mostrado na tabela a seguir:
Conclui-se que os melhores tratamentos, em termos de maximização do resultado, são T1 ou T3, os quais são indiferentes do ponto de vista estatístico. Para escolher entre T1 e T3, seria necessário procurar outros fatores fora da análise aqui apresentada. Por exemplo, preço, disponibilidade, etc.
Referências
- Cochran William e Cox Gertrude. 1974. Projetos experimentais. Debulha. México. Terceira reimpressão. 661p.
- Snedecor, GW e Cochran, WG 1980. Métodos estatísticos. Sétimo Ed. Iowa, The Iowa State University Press. 507p.
- Steel, RGD e Torrie, JH 1980. Principles and procedures of Statistics: A Biometrical Approach (2nd Ed.). McGraw-Hill, Nova York. 629p.
- Tukey, JW 1949. Comparando médias individuais na análise de variância. Biometrics, 5: 99-114.
- Wikipedia. Teste de Tukey. Recuperado de: en.wikipedia.com