- O tamanho da amostra
- Caso 1: o tamanho da população é desconhecido
- Níveis de confiança e seus valores Z correspondentes
- Caso 2: o tamanho da população é conhecido
- Exemplos
- Pesquisas e questionários
- Controle de qualidade
- Vantagem
- Desvantagens
- Exercício resolvido
- Solução
- Referências
A amostragem aleatória é como selecionar uma amostra estatisticamente representativa de uma determinada população. Parte do princípio de que todos os elementos da amostra devem ter a mesma probabilidade de serem selecionados.
Um sorteio é um exemplo de amostragem aleatória, em que cada membro da população participante recebe um número. Para escolher os números correspondentes aos prêmios do sorteio (a amostra) é utilizada alguma técnica aleatória, por exemplo, extrair de uma caixa de correio os números que foram registrados em cartões idênticos.
Figura 1. Na amostragem aleatória, a amostra é retirada da população de forma aleatória usando alguma técnica que garante que todos os elementos tenham a mesma probabilidade de serem escolhidos. Fonte: netquest.com.
Na amostragem aleatória, é fundamental escolher o tamanho da amostra de forma adequada, pois uma amostra não representativa da população pode levar a conclusões errôneas, devido às flutuações estatísticas.
O tamanho da amostra
Existem fórmulas para determinar o tamanho adequado de uma amostra. O fator mais importante a considerar é se o tamanho da população é conhecido ou não. Vejamos as fórmulas para determinar o tamanho da amostra:
Caso 1: o tamanho da população é desconhecido
Quando o tamanho da população N é desconhecido, é possível selecionar uma amostra de tamanho n adequado para determinar se uma determinada hipótese é verdadeira ou falsa.
Para isso, a seguinte fórmula é usada:
Onde:
-p é a probabilidade de que a hipótese seja verdadeira.
-q é a probabilidade de que não seja, portanto q = 1 - p.
-E é a margem de erro relativa, por exemplo, um erro de 5% tem uma margem de E = 0,05.
-Z tem a ver com o nível de confiança exigido pelo estudo.
Em uma distribuição normal padronizada (ou normalizada), um nível de confiança de 90% tem Z = 1,645, porque a probabilidade de que o resultado esteja entre -1,645σ e + 1,645σ é 90%, onde σ é o desvio padrão.
Níveis de confiança e seus valores Z correspondentes
1.- nível de confiança de 50% corresponde a Z = 0,675.
2.- Nível de confiança de 68,3% corresponde a Z = 1.
3.- O nível de confiança de 90% é equivalente a Z = 1.645.
4.- nível de confiança de 95% corresponde a Z = 1,96
5.- nível de confiança de 95,5% corresponde a Z = 2.
6.- O nível de confiança de 99,7% é equivalente a Z = 3.
Um exemplo onde esta fórmula pode ser aplicada seria em um estudo para determinar o peso médio de seixos em uma praia.
Obviamente, não é possível estudar e pesar todos os seixos da praia, por isso é aconselhável extrair uma amostra o mais aleatória possível e com o número adequado de elementos.
Figura 2. Para estudar as características dos seixos de uma praia, é necessário escolher uma amostra aleatória com um número representativo deles. (Fonte: pixabay)
Caso 2: o tamanho da população é conhecido
Quando o número N de elementos que compõem uma determinada população (ou universo) é conhecido, se quisermos selecionar uma amostra estatisticamente significativa de tamanho n por amostragem aleatória simples, esta é a fórmula:
Onde:
-Z é o coeficiente associado ao nível de confiança.
-p é a probabilidade de sucesso da hipótese.
-q é a probabilidade de falha na hipótese, p + q = 1.
-N é o tamanho da população total.
-E é o erro relativo do resultado do estudo.
Exemplos
A metodologia de extração das amostras depende muito do tipo de estudo que precisa ser feito. Portanto, a amostragem aleatória tem um número infinito de aplicações:
Pesquisas e questionários
Por exemplo, nas pesquisas por telefone, as pessoas a serem consultadas são escolhidas por meio de um gerador de números aleatórios, aplicável à região em estudo.
Se quiser aplicar um questionário aos colaboradores de uma grande empresa, pode recorrer à seleção dos respondentes através do seu número de funcionário ou do número do bilhete de identidade.
O referido número também deve ser escolhido aleatoriamente, usando, por exemplo, um gerador de números aleatórios.
Figura 3. Um questionário pode ser aplicado selecionando os participantes aleatoriamente. Fonte: Pixabay.
Controle de qualidade
Caso o estudo seja sobre peças fabricadas por máquina, as peças devem ser escolhidas aleatoriamente, mas a partir de lotes fabricados em horários diferentes do dia, ou em dias ou semanas diferentes.
Vantagem
Amostragem aleatória simples:
- Permite reduzir os custos de um estudo estatístico, pois não é necessário estudar a população total para obter resultados estatisticamente fiáveis, com os níveis de confiança pretendidos e o nível de erro requerido no estudo.
- Evitar vieses: como a escolha dos elementos a serem estudados é totalmente aleatória, o estudo reflete fielmente as características da população, embora apenas parte dela tenha sido estudada.
Desvantagens
- O método não é adequado nos casos em que se deseja conhecer as preferências em diferentes grupos ou estratos populacionais.
Neste caso, é preferível determinar previamente os grupos ou segmentos nos quais o estudo deve ser realizado. Definidos os estratos ou grupos, então se é conveniente para cada um deles aplicar a amostragem aleatória.
- É muito improvável que se obtenha informação sobre setores minoritários, dos quais às vezes é necessário conhecer suas características.
Por exemplo, se se trata de fazer campanha sobre um produto caro, é necessário conhecer as preferências dos setores minoritários mais ricos.
Exercício resolvido
Queremos estudar a preferência da população por determinada bebida de cola, mas não há nenhum estudo anterior nessa população, cujo tamanho é desconhecido.
Por outro lado, a amostra deve ser representativa com nível de confiança mínimo de 90% e as conclusões devem ter erro percentual de 2%.
-Como determinar o tamanho n da amostra?
-Qual seria o tamanho da amostra se a margem de erro fosse flexibilizada para 5%?
Solução
Como o tamanho da população é desconhecido, a fórmula fornecida acima é usada para determinar o tamanho da amostra:
n = (Z 2 p q) / (E 2)
Assumimos que existe uma probabilidade igual de preferência (p) para nossa marca de refrigerante como de não preferência (q), então p = q = 0,5.
Por outro lado, como o resultado do estudo deve ter um erro percentual menor que 2%, o erro relativo E será de 0,02.
Finalmente, um valor Z = 1.645 produz um nível de confiança de 90%.
Resumindo, temos os seguintes valores:
Z = 1.645
p = 0,5
q = 0,5
E = 0,02
Com esses dados, o tamanho mínimo da amostra é calculado:
n = (1,645 2 0,5 0,5) / (0,02 2) = 1691,3
Isso significa que o estudo com a margem de erro exigida e com o nível de confiança escolhido, deve ter uma amostra de respondentes de pelo menos 1.692 indivíduos, escolhidos por amostragem aleatória simples.
Se você passar de uma margem de erro de 2% para 5%, o novo tamanho da amostra é:
n = (1,645 2 0,5 0,5) / (0,05 2) = 271
O que é um número significativamente menor de indivíduos. Em conclusão, o tamanho da amostra é muito sensível à margem de erro desejada no estudo.
Referências
- Berenson, M. 1985. Statistics for Management and Economics, Concepts and Applications. Editorial Interamericana.
- Estatisticas. Amostragem aleatória. Retirado de: encyclopediaeconomica.com.
- Estatisticas. Amostragem. Recuperado de: Estadistica.mat.uson.mx.
- Explorável. Amostragem aleatória. Recuperado de: explorable.com.
- Moore, D. 2005. Estatísticas Básicas Aplicadas. 2ª Edição.
- Netquest. Amostragem aleatória. Recuperado de: netquest.com.
- Wikipedia. Amostragem estatística. Recuperado de: en.wikipedia.org