- Vantagens e desvantagens
- Desvantagens de alcance como medida de dispersão
- Intervalo interquartil, quartis e exemplo trabalhado
- - Cálculo de quartis
- Primeiro quartil
- Segundo quartil ou mediana
- Terceiro quartil
- Exemplo trabalhado
- Solução para
- Solução b
- Solução c
- Referências
O intervalo, intervalo ou amplitude, nas estatísticas, é a diferença (subtração) entre o valor máximo e o valor mínimo de um conjunto de dados de uma amostra ou população. Se o intervalo for representado pela letra R e os dados forem representados por x, a fórmula para o intervalo é simplesmente:
R = x max - x min
Onde x max é o valor máximo dos dados e x min é o mínimo.
Figura 1. Faixa de dados correspondente à população de Cádiz nos últimos dois séculos. Fonte: Wikimedia Commons.
O conceito é muito útil como uma medida simples de dispersão para avaliar rapidamente a variabilidade dos dados, pois indica a extensão ou duração do intervalo onde estes se encontram.
Por exemplo, suponha que a altura de um grupo de 25 estudantes de engenharia do primeiro ano de uma universidade seja medida. O aluno mais alto do grupo tem 1,93 me o mais baixo 1,67 m. Esses são os valores extremos dos dados de amostra, portanto, seu caminho é:
R = 1,93 - 1,67 m = 0,26 m ou 26 cm.
A altura dos alunos neste grupo é distribuída ao longo desta faixa.
Vantagens e desvantagens
O intervalo é, como dissemos antes, uma medida de quão dispersos os dados estão. Um pequeno intervalo indica que os dados estão mais ou menos próximos e o spread é baixo. Por outro lado, um intervalo maior é indicativo de que os dados estão mais dispersos.
As vantagens de calcular o intervalo são óbvias: é muito fácil e rápido de encontrar, pois é uma diferença simples.
Também possui as mesmas unidades dos dados com os quais trabalha e o conceito é muito fácil de interpretar para qualquer observador.
No exemplo da altura dos alunos de engenharia, se o intervalo fosse de 5 cm, diríamos que os alunos são todos aproximadamente do mesmo tamanho. Mas com um intervalo de 26 cm, assumimos imediatamente que há alunos de todas as alturas intermediárias na amostra. Esta suposição está sempre correta?
Desvantagens de alcance como medida de dispersão
Se olharmos com atenção, pode ser que em nossa amostra de 25 estudantes de engenharia, apenas um deles mede 1,93 e os 24 restantes têm alturas próximas a 1,67 m.
E, no entanto, o alcance permanece o mesmo, embora o oposto seja perfeitamente possível: que a altura da maioria seja de cerca de 1,90 me apenas uma tenha 1,67 m.
Em ambos os casos, a distribuição dos dados é bastante diferente.
As desvantagens do intervalo como medida de dispersão são porque ele usa apenas valores extremos e ignora todos os outros. Como a maioria das informações é perdida, você não tem ideia de como os dados de amostra são distribuídos.
Outra característica importante é que o intervalo da amostra nunca diminui. Se adicionarmos mais informações, ou seja, considerarmos mais dados, o intervalo aumenta ou permanece o mesmo.
E em qualquer caso, só é útil quando se trabalha com pequenas amostras, seu uso exclusivo como medida de dispersão em grandes amostras não é recomendado.
O que se deve fazer é complementá-lo com o cálculo de outras medidas de dispersão que levem em consideração as informações fornecidas pelos dados totais: amplitude interquartil, variância, desvio padrão e coeficiente de variação.
Intervalo interquartil, quartis e exemplo trabalhado
Percebemos que a fragilidade do intervalo como medida de dispersão é que ele apenas faz uso dos valores extremos da distribuição dos dados, omitindo os demais.
Para evitar esse transtorno, são utilizados quartis: três valores conhecidos como medidas de posição.
Eles distribuem os dados desagrupados em quatro partes (outras medidas de posição amplamente utilizadas são decis e percentis). Estas são suas características:
-O primeiro quartil Q 1 é o valor dos dados tal que 25% de todos eles é menor que Q 1.
-O segundo quartil Q 2 é a mediana da distribuição, o que significa que metade (50%) dos dados é inferior a este valor.
-Finalmente, o terceiro quartil Q 3 indica que 75% dos dados são inferiores a Q 3.
Então, o intervalo interquartil ou intervalo interquartil é definido como a diferença entre o terceiro quartil Q 3 e o primeiro quartil Q 1 dos dados:
Faixa interquartil = R Q = Q 3 - Q 1
Desta forma, o valor do intervalo R Q não é tão afetado por valores extremos. Por esse motivo, é aconselhável usá-lo ao lidar com distribuições distorcidas, como aquelas de alunos muito altos ou muito baixos descritas acima.
- Cálculo de quartis
Existem várias formas de calculá-los, aqui iremos propor uma, mas em qualquer caso é necessário saber o número de ordem "N o ", que é a posição que o respetivo quartil ocupa na distribuição.
Ou seja, se por exemplo o termo que corresponde a Q 1 é o segundo, o terceiro ou o quarto e assim por diante da distribuição.
Primeiro quartil
N ou (Q 1) = (N + 1) / 4
Segundo quartil ou mediana
N ou (Q 2) = (N + 1) / 2
Terceiro quartil
N ou (Q 3) = 3 (N + 1) / 4
Onde N é o número de dados.
A mediana é o valor que está bem no meio da distribuição. Se o número de dados for ímpar, não haverá problema em encontrá-lo, mas se for par, a média dos dois valores centrais será convertida em um.
Uma vez que o número do pedido foi calculado, uma destas três regras é seguida:
-Se não houver decimais, busca-se o dado indicado na distribuição e esse será o quartil procurado.
-Quando o número do pedido está a meio caminho entre dois, os dados indicados pela parte inteira são calculados em média com os dados a seguir, e o resultado é o quartil correspondente.
- Em qualquer outro caso, é arredondado para o número inteiro mais próximo e essa será a posição do quartil.
Exemplo trabalhado
Em uma escala de 0 a 20, um grupo de 16 alunos de matemática I obteve as seguintes notas (pontos) em um exame de meio do semestre:
16, 10, 12, 8, 9, 15, 18, 20, 9, 11, 1, 13, 17, 9, 10, 14
Encontrar:
a) O intervalo ou intervalo dos dados.
b) Os valores dos quartis Q 1 e Q 3
c) O intervalo interquartil.
Figura 2. As pontuações neste teste de matemática têm tanta variabilidade? Fonte: Pixabay.
Solução para
A primeira coisa a fazer para encontrar a rota é ordenar os dados em ordem crescente ou decrescente. Por exemplo, em ordem crescente você tem:
1, 8, 9, 9, 9, 10, 10, 11, 12, 13, 14, 15, 16, 17, 18, 20
Usando a fórmula dada no início: R = x max - x min
R = 20 - 1 pontos = 19 pontos.
De acordo com o resultado, essas classificações têm uma grande dispersão.
Solução b
N = 16
N ou (Q 1) = (N + 1) / 4 = (16 + 1) / 4 = 17/4 = 4,25
É um número com decimais, cuja parte inteira é 4. Em seguida, vamos à distribuição, procuramos os dados que ocupam a quarta posição e seu valor é calculado com a média da quinta posição. Como ambos têm 9, a média também é 9 e assim:
Q 1 = 9
Agora, repetimos o procedimento para encontrar Q 3:
N ou (Q 3) = 3 (N + 1) / 4 = 3 (16 +1) / 4 = 12,75
Novamente é um decimal, mas como não está na metade, é arredondado para 13. O quartil procurado ocupa a décima terceira posição e é:
Q 3 = 16
Solução c
R Q = Q 3 - Q 1 = 16 - 9 = 7 pontos.
Que, como podemos ver, é muito menor do que o intervalo de dados calculado na seção a), pois a pontuação mínima foi de 1 ponto, valor bem mais distante dos demais.
Referências
- Berenson, M. 1985. Statistics for management and economics. Interamericana SA
- Canavos, G. 1988. Probabilidade e Estatística: Aplicações e métodos. McGraw Hill.
- Devore, J. 2012. Probability and Statistics for Engineering and Science. 8º. Edição. Cengage.
- Exemplos de quartis. Recuperado de: matematicas10.net.
- Levin, R. 1988. Statistics for Administrators. 2ª Edição. Prentice Hall.
- Walpole, R. 2007. Probabilidade e Estatística para Engenharia e Ciências. Pearson.