- Fórmulas e equações
- Como calcular o erro de amostragem
- Para um nível de confiança
- Exemplos
- - Exemplo 1
- Solução
- - Exemplo 2
- Solução
- - Exemplo 3
- Solução
- - Exemplo 4
- Solução
- - Exercício 5
- Solução
- Referências
O erro de amostragem ou erro de amostragem nas estatísticas é a diferença entre o valor médio de uma amostra e o valor médio da população total. Para ilustrar a ideia, vamos imaginar que a população total de uma cidade seja de um milhão de pessoas, da qual você deseja o tamanho médio de um calçado, para o qual uma amostra aleatória de mil pessoas é retirada.
O tamanho médio que emerge da amostra não coincidirá necessariamente com o da população total, embora se a amostra não for enviesada o valor deve ser próximo. Essa diferença entre o valor médio da amostra e o da população total é o erro amostral.
Figura 1. Como a amostra é um subconjunto da população total, a média da amostra tem uma margem de erro. Fonte: F. Zapata.
O valor médio da população total geralmente é desconhecido, mas existem técnicas para reduzir esse erro e fórmulas para estimar a margem de erro de amostragem que serão discutidas neste artigo.
Fórmulas e equações
Digamos que desejamos saber o valor médio de uma determinada característica mensurável x em uma população de tamanho N, mas como N é um número grande, não é viável realizar o estudo na população total, então procedemos para obter uma amostra aleatória de tamanho n <
O valor médio da amostra é denotado por
Suponha que m amostras sejam retiradas da população total N, todas de tamanho igual n com valores médios
Esses valores médios não serão idênticos entre si e estarão todos em torno do valor médio da população μ. A margem de erro de amostragem E indica a separação esperada dos valores médios
A margem de erro padrão ε da amostra de tamanho n é:
ε = σ / √n
onde σ é o desvio padrão (a raiz quadrada da variância), que é calculado usando a seguinte fórmula:
σ = √
O significado da margem de erro padrão ε é o seguinte:
Valor médio
Como calcular o erro de amostragem
Na seção anterior, foi dada a fórmula para encontrar a margem de erro padrão de uma amostra de tamanho n, onde a palavra padrão indica que se trata de uma margem de erro com 68% de confiança.
Isso indica que, se muitas amostras do mesmo tamanho n forem tomadas, 68% delas darão valores médios
Existe uma regra simples, chamada de regra 68-95-99,7, que nos permite encontrar facilmente a margem de erro amostral E para níveis de confiança de 68%, 95% e 99,7%, uma vez que esta margem é 1⋅ ε, 2 ⋅ ε e 3⋅ ε respectivamente.
Para um nível de confiança
Se o nível de confiança γ não for um dos acima, então o erro de amostragem é o desvio padrão σ multiplicado pelo fator Zγ, que é obtido pelo seguinte procedimento:
1.- Primeiramente, é determinado o nível de significância α, que é calculado a partir do nível de confiança γ através da seguinte relação: α = 1 - γ
2.- A seguir devemos calcular o valor 1 - α / 2 = (1 + γ) / 2, que corresponde à frequência normal acumulada entre -∞ e Zγ, numa distribuição normal ou gaussiana tipificada F (z), cuja definição pode ser visto na figura 2.
3.- A equação F (Zγ) = 1 - α / 2 é resolvida por meio das tabelas da distribuição normal (cumulativa) F, ou por meio de uma aplicação informática que tenha a função gaussiana inversa F -1.
No último caso, temos:
Zγ = G -1 (1 - α / 2).
4.- Finalmente, esta fórmula é aplicada para o erro de amostragem com um nível de confiabilidade γ:
E = Zγ ⋅ (σ / √n)
Figura 2. Tabela de distribuição normal. Fonte: Wikimedia Commons.
Exemplos
- Exemplo 1
Calcule a margem de erro padrão no peso médio de uma amostra de 100 recém-nascidos. O cálculo do peso médio foi
Solução
A margem de erro padrão é ε = σ / √n = (1.500 kg) / √100 = 0,15 kg. Isso significa que com esses dados pode-se inferir que o peso de 68% dos recém-nascidos está entre 2.950 kg e 3,25 kg.
- Exemplo 2
Determine a margem de erro amostral E e a faixa de peso de 100 recém-nascidos com nível de confiança de 95% se o peso médio for 3.100 kg com desvio padrão σ = 1.500 kg.
Solução
Se a regra 68 se aplicar; 95; 99,7 → 1⋅ ε; 2⋅ ε; 3⋅ ε, temos:
E = 2⋅ε = 2⋅0,15 kg = 0,30 kg
Ou seja, 95% dos recém-nascidos terão peso entre 2.800 kg e 3.400 kg.
- Exemplo 3
Determine a faixa de pesos dos recém-nascidos no Exemplo 1 com uma margem de confiança de 99,7%.
Solução
O erro de amostragem com 99,7% de confiança é 3 σ / √n, que para nosso exemplo é E = 3 * 0,15 kg = 0,45 kg. Daqui decorre que 99,7% dos recém-nascidos terão pesos entre 2.650 kg e 3.550 kg.
- Exemplo 4
Determine o fator Zγ para um nível de confiança de 75%. Determine a margem de erro de amostragem com este nível de confiabilidade para o caso apresentado no Exemplo 1.
Solução
O nível de confiança é γ = 75% = 0,75, que está relacionado ao nível de significância α por meio da relação γ = (1 - α), de forma que o nível de significância é α = 1 - 0,75 = 0, 25.
Isso significa que a probabilidade normal cumulativa entre -∞ e Zγ é:
P (Z ≤ Zγ) = 1 - 0,125 = 0,875
Que corresponde a um valor Zγ de 1,1503, conforme mostrado na Figura 3.
Figura 3. Determinação do fator Zγ correspondente a um nível de confiança de 75%. Fonte: F. Zapata por Geogebra.
Em outras palavras, o erro de amostragem é E = Zγ ⋅ (σ / √n) = 1,15 ⋅ (σ / √n).
Quando aplicado aos dados do exemplo 1, dá um erro de:
E = 1,15 * 0,15 kg = 0,17 kg
Com um nível de confiança de 75%.
- Exercício 5
Qual é o nível de confiança se Z α / 2 = 2,4?
Solução
P (Z ≤ Z α / 2) = 1 - α / 2
P (Z ≤ 2,4) = 1 - α / 2 = 0,9918 → α / 2 = 1 - 0,9918 = 0,0082 → α = 0,0164
O nível de significância é:
α = 0,0164 = 1,64%
E, finalmente, o nível de confiança permanece:
1- α = 1 - 0,0164 = 100% - 1,64% = 98,36%
Referências
- Canavos, G. 1988. Probabilidade e Estatística: Aplicações e métodos. McGraw Hill.
- Devore, J. 2012. Probability and Statistics for Engineering and Science. 8º. Edição. Cengage.
- Levin, R. 1988. Statistics for Administrators. 2ª Edição. Prentice Hall.
- Sudman, S. 1982. Fazendo perguntas: um guia prático para o desenho de questionários. São Francisco. Jossey Bass.
- Walpole, R. 2007. Probabilidade e Estatística para Engenharia e Ciências. Pearson.
- Wonnacott, TH e RJ Wonnacott. 1990. Estatísticas introdutórias. 5ª Ed. Wiley
- Wikipedia. Erro de amostragem. Recuperado de: en.wikipedia.com
- Wikipedia. Margem de erro. Recuperado de: en.wikipedia.com