AMOSTRAGEM ALEATÓRIA: METODOLOGIA, VANTAGENS, DESVANTAGENS, EXEMPLOS - MATEMÁTICAS

A amostragem aleatória é como selecionar uma amostra estatisticamente representativa de uma determinada população. Parte do princípio de que todos os elementos da amostra devem ter a mesma probabilidade de serem selecionados.

Um sorteio é um exemplo de amostragem aleatória, em que cada membro da população participante recebe um número. Para escolher os números correspondentes aos prêmios do sorteio (a amostra) é utilizada alguma técnica aleatória, por exemplo, extrair de uma caixa de correio os números que foram registrados em cartões idênticos.

Figura 1. Na amostragem aleatória, a amostra é retirada da população de forma aleatória usando alguma técnica que garante que todos os elementos tenham a mesma probabilidade de serem escolhidos. Fonte: netquest.com.

Na amostragem aleatória, é fundamental escolher o tamanho da amostra de forma adequada, pois uma amostra não representativa da população pode levar a conclusões errôneas, devido às flutuações estatísticas.

O tamanho da amostra

Existem fórmulas para determinar o tamanho adequado de uma amostra. O fator mais importante a considerar é se o tamanho da população é conhecido ou não. Vejamos as fórmulas para determinar o tamanho da amostra:

Caso 1: o tamanho da população é desconhecido

Quando o tamanho da população N é desconhecido, é possível selecionar uma amostra de tamanho n adequado para determinar se uma determinada hipótese é verdadeira ou falsa.

Para isso, a seguinte fórmula é usada:

Onde:

-p é a probabilidade de que a hipótese seja verdadeira.

-q é a probabilidade de que não seja, portanto q = 1 - p.

-E é a margem de erro relativa, por exemplo, um erro de 5% tem uma margem de E = 0,05.

-Z tem a ver com o nível de confiança exigido pelo estudo.

Em uma distribuição normal padronizada (ou normalizada), um nível de confiança de 90% tem Z = 1,645, porque a probabilidade de que o resultado esteja entre -1,645σ e + 1,645σ é 90%, onde σ é o desvio padrão.

Níveis de confiança e seus valores Z correspondentes

1.- nível de confiança de 50% corresponde a Z = 0,675.

2.- Nível de confiança de 68,3% corresponde a Z = 1.

3.- O nível de confiança de 90% é equivalente a Z = 1.645.

4.- nível de confiança de 95% corresponde a Z = 1,96

5.- nível de confiança de 95,5% corresponde a Z = 2.

6.- O nível de confiança de 99,7% é equivalente a Z = 3.

Um exemplo onde esta fórmula pode ser aplicada seria em um estudo para determinar o peso médio de seixos em uma praia.

Obviamente, não é possível estudar e pesar todos os seixos da praia, por isso é aconselhável extrair uma amostra o mais aleatória possível e com o número adequado de elementos.

Figura 2. Para estudar as características dos seixos de uma praia, é necessário escolher uma amostra aleatória com um número representativo deles. (Fonte: pixabay)

Caso 2: o tamanho da população é conhecido

Quando o número N de elementos que compõem uma determinada população (ou universo) é conhecido, se quisermos selecionar uma amostra estatisticamente significativa de tamanho n por amostragem aleatória simples, esta é a fórmula:

Onde:

-Z é o coeficiente associado ao nível de confiança.

-p é a probabilidade de sucesso da hipótese.

-q é a probabilidade de falha na hipótese, p + q = 1.

-N é o tamanho da população total.

-E é o erro relativo do resultado do estudo.

Exemplos

A metodologia de extração das amostras depende muito do tipo de estudo que precisa ser feito. Portanto, a amostragem aleatória tem um número infinito de aplicações:

Pesquisas e questionários

Por exemplo, nas pesquisas por telefone, as pessoas a serem consultadas são escolhidas por meio de um gerador de números aleatórios, aplicável à região em estudo.

Se quiser aplicar um questionário aos colaboradores de uma grande empresa, pode recorrer à seleção dos respondentes através do seu número de funcionário ou do número do bilhete de identidade.

O referido número também deve ser escolhido aleatoriamente, usando, por exemplo, um gerador de números aleatórios.

Figura 3. Um questionário pode ser aplicado selecionando os participantes aleatoriamente. Fonte: Pixabay.

Controle de qualidade

Caso o estudo seja sobre peças fabricadas por máquina, as peças devem ser escolhidas aleatoriamente, mas a partir de lotes fabricados em horários diferentes do dia, ou em dias ou semanas diferentes.

Vantagem

Amostragem aleatória simples:

- Permite reduzir os custos de um estudo estatístico, pois não é necessário estudar a população total para obter resultados estatisticamente fiáveis, com os níveis de confiança pretendidos e o nível de erro requerido no estudo.

- Evitar vieses: como a escolha dos elementos a serem estudados é totalmente aleatória, o estudo reflete fielmente as características da população, embora apenas parte dela tenha sido estudada.

Desvantagens

- O método não é adequado nos casos em que se deseja conhecer as preferências em diferentes grupos ou estratos populacionais.

Neste caso, é preferível determinar previamente os grupos ou segmentos nos quais o estudo deve ser realizado. Definidos os estratos ou grupos, então se é conveniente para cada um deles aplicar a amostragem aleatória.

- É muito improvável que se obtenha informação sobre setores minoritários, dos quais às vezes é necessário conhecer suas características.

Por exemplo, se se trata de fazer campanha sobre um produto caro, é necessário conhecer as preferências dos setores minoritários mais ricos.

Exercício resolvido

Queremos estudar a preferência da população por determinada bebida de cola, mas não há nenhum estudo anterior nessa população, cujo tamanho é desconhecido.

Por outro lado, a amostra deve ser representativa com nível de confiança mínimo de 90% e as conclusões devem ter erro percentual de 2%.

-Como determinar o tamanho n da amostra?

-Qual seria o tamanho da amostra se a margem de erro fosse flexibilizada para 5%?

Solução

Como o tamanho da população é desconhecido, a fórmula fornecida acima é usada para determinar o tamanho da amostra:

n = (Z ² p q) / (E ²)

Assumimos que existe uma probabilidade igual de preferência (p) para nossa marca de refrigerante como de não preferência (q), então p = q = 0,5.

Por outro lado, como o resultado do estudo deve ter um erro percentual menor que 2%, o erro relativo E será de 0,02.

Finalmente, um valor Z = 1.645 produz um nível de confiança de 90%.

Resumindo, temos os seguintes valores:

Z = 1.645

p = 0,5

q = 0,5

E = 0,02

Com esses dados, o tamanho mínimo da amostra é calculado:

n = (1,645 ² 0,5 0,5) / (0,02 ²) = 1691,3

Isso significa que o estudo com a margem de erro exigida e com o nível de confiança escolhido, deve ter uma amostra de respondentes de pelo menos 1.692 indivíduos, escolhidos por amostragem aleatória simples.

Se você passar de uma margem de erro de 2% para 5%, o novo tamanho da amostra é:

n = (1,645 ² 0,5 0,5) / (0,05 ²) = 271

O que é um número significativamente menor de indivíduos. Em conclusão, o tamanho da amostra é muito sensível à margem de erro desejada no estudo.

Referências

Berenson, M. 1985. Statistics for Management and Economics, Concepts and Applications. Editorial Interamericana.
Estatisticas. Amostragem aleatória. Retirado de: encyclopediaeconomica.com.
Estatisticas. Amostragem. Recuperado de: Estadistica.mat.uson.mx.
Explorável. Amostragem aleatória. Recuperado de: explorable.com.
Moore, D. 2005. Estatísticas Básicas Aplicadas. 2ª Edição.
Netquest. Amostragem aleatória. Recuperado de: netquest.com.
Wikipedia. Amostragem estatística. Recuperado de: en.wikipedia.org

AMOSTRAGEM ALEATÓRIA: METODOLOGIA, VANTAGENS, DESVANTAGENS, EXEMPLOS - MATEMÁTICAS - 2026