- Fórmula e equações
- Diferenças com a distribuição binomial
- Exemplos
- Aplicações práticas
- Aproximando a distribuição binomial com a distribuição de Poisson
- Exercícios resolvidos
- Exercício 1
- Solução c)
- Exercício 2
- Solução para)
- Referências
A distribuição de Poisson é uma distribuição de probabilidade discreta, por meio da qual é possível saber a probabilidade de que, dentro de um grande tamanho de amostra e durante um determinado intervalo, um evento de pequena probabilidade ocorra.
Freqüentemente, a distribuição de Poisson pode ser usada no lugar da distribuição binomial, desde que as seguintes condições sejam atendidas: amostra grande e probabilidade pequena.
Figura 1. Gráfico da distribuição de Poisson para diferentes parâmetros. Fonte: Wikimedia Commons.
Siméon-Denis Poisson (1781-1840) criou esta distribuição que leva o seu nome, muito útil quando se trata de eventos imprevisíveis. Poisson publicou seus resultados em 1837, um trabalho de investigação sobre a probabilidade de ocorrência de sentenças criminais errôneas.
Posteriormente, outros pesquisadores adaptaram a distribuição em outras áreas, por exemplo, o número de estrelas que poderiam ser encontradas em um determinado volume do espaço, ou a probabilidade de um soldado morrer com o coice de um cavalo.
Fórmula e equações
A forma matemática da distribuição de Poisson é a seguinte:
- μ (também às vezes denotado como λ) é a média ou parâmetro da distribuição
- Número de Euler: e = 2,71828
- A probabilidade de obter y = k é P
- k é o número de sucessos 0, 1,2,3…
- n é o número de testes ou eventos (o tamanho da amostra)
Variáveis aleatórias discretas, como seu nome indica, dependem do acaso e só assumem valores discretos: 0, 1, 2, 3, 4…, k.
A média da distribuição é dada por:
A variância σ, que mede a dispersão dos dados, é outro parâmetro importante. Para a distribuição de Poisson é:
σ = μ
Poisson determinou que quando n → ∞, ep → 0, a média μ - também chamada de valor esperado - tende a uma constante:
-Os eventos ou eventos considerados são independentes uns dos outros e ocorrem de forma aleatória.
-A probabilidade P de um determinado evento ocorrer durante um período específico de tempo é muito pequena: P → 0.
-A probabilidade de mais de um evento ocorrer no intervalo de tempo é 0.
-O valor médio se aproxima de uma constante dada por: μ = np (n é o tamanho da amostra)
- Como a dispersão σ é igual a μ, ao adotar valores maiores, a variabilidade também se torna maior.
-Os eventos devem ser distribuídos uniformemente no intervalo de tempo usado.
-O conjunto de valores possíveis do evento y é: 0,1,2,3,4….
-A soma de i variáveis que seguem uma distribuição de Poisson também é outra variável de Poisson. Seu valor médio é a soma dos valores médios dessas variáveis.
Diferenças com a distribuição binomial
A distribuição de Poisson difere da distribuição binomial das seguintes maneiras importantes:
-A distribuição binomial é afetada tanto pelo tamanho da amostra n quanto pela probabilidade P, mas a distribuição de Poisson é afetada apenas pela média μ.
-Em uma distribuição binomial, os valores possíveis da variável aleatória y são 0,1,2,…, N, enquanto na distribuição de Poisson não há limite superior para esses valores.
Exemplos
Poisson inicialmente aplicou sua famosa distribuição a casos legais, mas em um nível industrial, um de seus primeiros usos foi na fabricação de cerveja. Neste processo, as culturas de fermento são utilizadas para a fermentação.
A levedura consiste em células vivas, cuja população é variável ao longo do tempo. Na fabricação de cerveja é necessário adicionar a quantidade necessária, pois é necessário saber a quantidade de células que existem por unidade de volume.
Durante a Segunda Guerra Mundial, a distribuição de Poisson foi usada para descobrir se os alemães estavam realmente mirando em Londres de Calais, ou apenas atirando ao acaso. Isso foi importante para os Aliados determinarem o quão boa era a tecnologia disponível para os nazistas.
Aplicações práticas
As aplicações da distribuição de Poisson sempre se referem a contagens no tempo ou contagens no espaço. E como a probabilidade de ocorrência é pequena, também é conhecida como a "lei dos eventos raros".
Aqui está uma lista de eventos que se enquadram em uma dessas categorias:
-Registro das partículas em um decaimento radioativo, que, como o crescimento de células de levedura, é uma função exponencial.
- Número de visitas a um determinado site.
-Chegada de pessoas a uma fila para pagar ou serem atendidas (teoria da fila).
- Número de carros que passam por determinado ponto de uma estrada, durante um determinado intervalo de tempo.
Figura 2. O número de carros passando por um ponto segue aproximadamente uma distribuição de Poisson. Fonte: Pixabay.
-Mutações sofridas em uma determinada cadeia de DNA após receber exposição à radiação.
- Número de meteoritos com diâmetro superior a 1 m caídos em um ano.
-Defeitos por metro quadrado de tecido.
-Quantidade de células sanguíneas em 1 centímetro cúbico.
-Chamadas por minuto para uma central telefônica.
-Raspas de chocolate presentes em 1 kg de massa de bolo.
-Número de árvores infectadas por determinado parasita em 1 hectare de floresta.
Observe que essas variáveis aleatórias representam o número de vezes que um evento ocorre durante um período fixo de tempo (chamadas por minuto para a central telefônica) ou uma determinada região do espaço (defeitos de tecido por metro quadrado).
Esses eventos, como já foi estabelecido, são independentes do tempo decorrido desde a última ocorrência.
Aproximando a distribuição binomial com a distribuição de Poisson
A distribuição de Poisson é uma boa aproximação da distribuição binomial, desde que:
- O tamanho da amostra é grande: n ≥ 100
-A probabilidade p é pequena: p ≤ 0,1
- μ está na ordem de: np ≤ 10
Nesses casos, a distribuição de Poisson é uma excelente ferramenta, uma vez que a distribuição binomial pode ser difícil de aplicar nesses casos.
Exercícios resolvidos
Exercício 1
Um estudo sismológico determinou que durante os últimos 100 anos, ocorreram 93 grandes terremotos ao redor do mundo, com pelo menos 6,0 na escala Richter -logarítmica-. Suponha que a distribuição de Poisson seja um modelo adequado neste caso. Encontrar:
a) A ocorrência média de grandes terremotos por ano.
b) Se P (y) é a probabilidade de terremotos ocorrerem durante um ano selecionado aleatoriamente, encontre as seguintes probabilidades:
É bem menor que P (2).
Os resultados estão listados abaixo:
P (0) = 0,395, P (1) = 0,367, P (2) = 0,171, P (3) = 0,0529, P (4) = 0,0123, P (5) = 0,00229, P (6) = 0,000355, P (7) = 0,0000471.
Por exemplo, podemos dizer que há uma probabilidade de 39,5% de que nenhum grande terremoto ocorrerá em um determinado ano. Ou que há 5,29% de 3 grandes terremotos ocorrendo naquele ano.
Solução c)
c) As frequências são analisadas, multiplicando por n = 100 anos:
39,5; 36,7; 17,1; 5,29; 1,23; 0,229; 0,0355 e 0,00471.
Por exemplo:
- Uma frequência de 39,5 indica que 0 grandes terremotos ocorrem em 39,5 de 100 anos, podemos dizer que é bem próximo do resultado real de 47 anos sem nenhum grande terremoto.
Vamos comparar outro resultado de Poisson com os resultados reais:
- O valor obtido de 36,7 significa que em um período de 37 anos ocorre 1 grande terremoto. O resultado real é que em 31 anos ocorreu um grande terremoto, uma boa combinação com o modelo.
- São esperados 17,1 anos com 2 grandes terremotos e sabe-se que em 13 anos, que é um valor próximo, ocorreram de fato 2 grandes terremotos.
Portanto, o modelo de Poisson é aceitável para este caso.
Exercício 2
Uma empresa estima que o número de componentes que falham antes de chegar a 100 horas de operação segue uma distribuição de Poisson. Se o número médio de falhas for 8 nesse tempo, encontre as seguintes probabilidades:
a) Que um componente falha em 25 horas.
b) Falha de menos de dois componentes, em 50 horas.
c) Pelo menos três componentes falham em 125 horas.
Solução para)
a) Sabe-se que a média de falhas em 100 horas é de 8, portanto em 25 horas espera-se um quarto de falhas, ou seja, 2 falhas. Este será o parâmetro μ.
A probabilidade de que 1 componente falhe é solicitada, a variável aleatória é "componentes que falham antes de 25 horas" e seu valor é y = 1. Ao substituir na função de probabilidade:
No entanto, a questão é a probabilidade de que menos de dois componentes falhem em 50 horas, não que exatamente 2 componentes falhem em 50 horas, portanto, devemos adicionar as probabilidades de que:
-Nenhum falha
- Falha apenas 1
O parâmetro μ da distribuição neste caso é:
μ = 8 + 2 = 10 falhas em 125 horas.
P (falha em 3 ou mais componentes) = 1- P (0) - P (1) - P (2) =
Referências
- MathWorks. Distribuição de veneno. Recuperado de: es.mathworks.com
- Mendenhall, W. 1981. Statistics for Management and Economics. 3º edição. Grupo Editorial Iberoamérica.
- Stat Trek. Aprenda a Estatística. Distribuição de veneno. Recuperado de: stattrek.com,
- Triola, M. 2012. Elementary Statistics. 11º. Ed. Pearson Education.
- Wikipedia. Distribuição de veneno. Recuperado de: en.wikipedia.org