- Exemplos de quase-variância
- Por que dividir por n-1?
- Maneira alternativa de calcular quasivariância
- A pontuação padrão
- Exercício resolvido
- Solução para
- Solução b
- Referências
O quasivariance, variância ou quase variância imparcial é uma medida estatística da dispersão da amostra de dados em relação à média. A amostra, por sua vez, consiste em uma série de dados retirados de um universo maior, denominado população.
É denotado de várias maneiras, aqui s c 2 foi escolhido e a seguinte fórmula é usada para calculá-lo:
Figura 1. A definição de quase-variância. Fonte: F. Zapata.
Onde:
A quase-variância é semelhante à variância s 2, com a única diferença de que o denominador da variância é n-1, enquanto o denominador da variância é dividido apenas por n. É evidente que quando n é muito grande, os valores de ambos tendem a ser os mesmos.
Quando você conhece o valor da quase-variância, pode saber imediatamente o valor da variância.
Exemplos de quase-variância
Muitas vezes você deseja conhecer as características de qualquer população: pessoas, animais, plantas e em geral qualquer tipo de objeto. Mas analisar toda a população pode não ser uma tarefa fácil, especialmente se o número de elementos for muito grande.
Em seguida, são feitas amostragens, na esperança de que seu comportamento reflita o da população e, assim, possamos fazer inferências sobre ela, graças às quais os recursos são otimizados. Isso é conhecido como inferência estatística.
Aqui estão alguns exemplos em que a quase-variância e o desvio quase-padrão associado servem como um indicador estatístico, indicando a que distância os resultados obtidos estão da média.
1.- O diretor de marketing de uma empresa fabricante de baterias automotivas precisa estimar, em meses, a vida média de uma bateria.
Para fazer isso, ele seleciona aleatoriamente uma amostra de 100 baterias compradas dessa marca. A empresa mantém um registro dos detalhes dos compradores e pode entrevistá-los para saber quanto tempo as baterias duram.
Figura 2. Quase-variância é útil para fazer inferências e controle de qualidade. Fonte: Pixabay.
2.- A direção acadêmica de uma instituição universitária deve estimar as matrículas do ano seguinte, analisando o número de alunos que se espera que sejam aprovados nas disciplinas que cursam.
Por exemplo, em cada uma das seções atualmente cursando Física I, a administração pode selecionar uma amostra de alunos e analisar seu desempenho nessa cadeira. Desta forma, você pode inferir quantos alunos farão Física II no próximo período.
3.- Um grupo de astrônomos concentra sua atenção em uma parte do céu, onde se observa um certo número de estrelas com certas características: tamanho, massa e temperatura, por exemplo.
É de se perguntar se estrelas em outra região semelhante terão as mesmas características, até mesmo estrelas em outras galáxias, como as vizinhas Nuvens de Magalhães ou Andrômeda.
Por que dividir por n-1?
Na quase-variância, ela é dividida por n-1 ao invés de n e isso ocorre porque a quasivariada é um estimador não enviesado, como foi dito no início.
Acontece que de uma mesma população é possível extrair muitas amostras. A variância de cada uma dessas amostras também pode ser calculada, mas a média dessas variâncias não chega a ser igual à variância da população.
Na verdade, a média das variâncias da amostra tende a subestimar a variância da população, a menos que n-1 seja usado no denominador. Pode-se verificar que o valor esperado da quase-variância E (s c 2) é precisamente s 2.
Por esse motivo, diz-se que a quasivariada é não viesada e é o melhor estimador da variância populacional s 2.
Maneira alternativa de calcular quasivariância
É facilmente mostrado que a quasivariância também pode ser calculada da seguinte forma:
s c 2 = -
A pontuação padrão
Tendo o desvio da amostra, podemos dizer quantos desvios padrão um determinado valor x tem, acima ou abaixo da média.
Para isso, a seguinte expressão adimensional é usada:
Pontuação padrão = (x - X) / s c
Exercício resolvido
863 903 957 1041 1138 1204 1354 1624 1698 1745 1802 1883
a) Use a definição de quase-variância fornecida no início e também verifique o resultado usando a forma alternativa fornecida na seção anterior.
b) Calcule a pontuação padrão da segunda parte dos dados, lendo de cima para baixo.
Solução para
O problema pode ser resolvido manualmente com o auxílio de uma calculadora simples ou científica, para a qual é necessário proceder em ordem. E para isso, nada melhor do que organizar os dados em uma tabela como a mostrada abaixo:
Graças à tabela, a informação é organizada e as quantidades que vão ser necessárias nas fórmulas encontram-se no final das respectivas colunas, prontas a serem utilizadas de imediato. As somas são indicadas em negrito.
A coluna média se repete sempre, mas vale a pena porque é conveniente ter o valor em vista, para preencher cada linha da tabela.
Por fim, é aplicada a equação para a quase-variável dada no início, apenas os valores são substituídos e quanto ao somatório, já a temos calculada:
s c 2 = 1.593.770 / (12-1) = 1.593.770 / 11 = 144.888,2
Este é o valor da quasivariada e suas unidades são "dólares ao quadrado", o que não faz muito sentido prático, então o desvio quase padrão da amostra é calculado, que nada mais é do que a raiz quadrada da quasivariada:
s c = (√ 144.888,2) $ = $ 380,64
É imediatamente confirmado que este valor também é obtido com a forma alternativa de quase-variância. A soma necessária está no final da última coluna à esquerda:
s c 2 = - = -
= 2.136.016,55 - 1.991.128,36 = $ 144.888 ao quadrado
É o mesmo valor obtido com a fórmula dada no início.
Solução b
O segundo valor de cima para baixo é 903, sua pontuação padrão é
Pontuação padrão de 903 = (x - X) / s c = (903 - 1351) /380,64 = -1,177
Referências
- Canavos, G. 1988. Probabilidade e Estatística: Aplicações e métodos. McGraw Hill.
- Devore, J. 2012. Probability and Statistics for Engineering and Science. 8º. Edição. Cengage.
- Levin, R. 1988. Statistics for Administrators. 2ª Edição. Prentice Hall.
- Medidas de dispersão. Recuperado de: thales.cica.es.
- Walpole, R. 2007. Probabilidade e Estatística para Engenharia e Ciências. Pearson.