Distribuição de Probabilidades Discreta
(Aula Cinco)



Luiz A. Bertolo

Introdução:

Na aula número dois, dissemos que uma Variável Aleatória é uma quantidade resultante de um experimento aleatório que, ao acaso, pode assumir valores diferentes. Tal como, número de lâmpadas com defeito produzidas durante uma semana. Também, dizemos que uma Variável Aleatória Discreta é uma variável que pode assumir somente valores inteiros, tais como, 7, 9, e assim por diante. Em outras palavras, a variável aleatória discreta não pode tomar frações como valor. Coisas tais como pessoas, carros, ou defeitos são coisas que podemos contar e são itens discretos.
Nesta nota de aula, gostaríamos de discutir três tipos de Distribuição de Probabilidades Discreta: Distribuição Binomial, Distribuição de Poisson, e Distribuição Hipergeométrica.


Distribuição de Probabilidades:

Uma distribuição de probabilidades é similar à uma distribuição de frequências de de uma população quantitativa porque ambas fornecem uma frequência de longo prazo para os resultados. Em outras palavras, a distribuição de probabilidade é a listagem de todos os valores possíveis que uma variável aleatória pode tomar juntamente com suas probabilidades. Por exemplo, suponhamos que queiramos encontrar a distribuição de probabilidade para o número de coroas em três lançamento de uma moeda:

Primeiro lançamento.........T T T T H H H H
Segundo lançamento.........T T H H T T H H
Terceiro lançamento.........T H T H T H T H
Lançamento de moedas

a distribuição de probabilidade do experimento acima é como segue (colunas 1, e 2 na tabela seguinte).

(Coluna 1)......................(Coluna 2)..............(Coluna 3)
Número de coroas...............Probabilidade...............(1)(2)

X.....................................P(X).............................(X)P(X)
0......................................1/8................................0,0
1......................................3/8................................0,375
2......................................3/8................................0,75
3......................................1/8................................0,375
Total.....................................................................1,5 = E(X)

Média, e Variância de Variáveis Aleatórias Discretas:

A equação para se calcular a média, ou valor esperado de variáveis aleatórias discretas é como segue:

Média = E(X) = Somatório[X.P(X)]
onde: E(X) = valor esperado, X = um evento, e P(X) = probabilidade do evento

Note que na equação acima, a probabilidade de cada evento é usada como o peso. Por exemplo, voltando ao problema de arremesso de uma moeda três vezes, o valor esperado é: E(X) = [0(1/8)+1(3/8)+2(3/8)+3(1/8) = 1,5 (coluna 3 na tabela acima). Então, na média, o número de coroas mostrando a face para cima num grande número de lançamento de uma moeda é 1,5. O valor esperado tem muitos usos nos jogos de azar, por exemplo, ele nos diz qual será a nossa perda média por jogada.

As equações para se calcular o valor esperado, variância, e desvio padrão de variáveis aleatórias discretas são como segue:


Exemplo:

Suponha que uma organização de caridade esteja enviando envelopes em mala direta para mais de um milhão de residências nos U.S. Em cada envelope é pedida a doação de $1, ou $2, ou $5, ou $10, ou $15, ou $20. Baseado na experiência passada, a quantia que uma pessoa doará, acredita-se que siga a seguinte distribuição de probabilidade:

X:....... $1......$2........$5........$10..........$15......$20
P(X)....0,1.....0,2.......0,3.......0,2..........0,15.....0,05

A questão é, qual é a esperança de uma doação média para o contribuinte, e qual é o desvio padrão. A solução é como segue.

(1)......(2).......(3)................(4)....................(5)..........................................(6)
X......P(X)....X.P(X).......X - média......[(X - média)]ao quadrado....................(5)x(2)
1.......0,1......0,1...............-6,25..................39,06........................................3,906
2.......0,2......0,4...............-5,25..................27,56........................................5,512
5.......0,3......1,5...............-2,25....................5,06........................................1,518
10......0,2......2,0...............2,75....................7,56.........................................1,512
15......0,15.....2,25.............7,75..................60,06.........................................9,009
20.....0,05......1,0..............12,75...............162,56.........................................8,125
Total...........7,25 = E(X)............................................................................29,585

Assim, o valor esperado é $7,25, e o desvio padrão é a raiz quadrada de $29,585, que é igual a $5,55. Em outras palavras, em média é esperado que um doador doe $7,25 com um desvio padrão de $5,55.

Distribuição Binomial:

Uma das mais largamente conhecidas de todas as distribuições de probabilidades discretas é a distribuição binomial. Várias características dão suporte ao uso da distribuição binomial.

Características da Distribuição Binomial:

1. O experimento consiste de n tentativas idênticas.
2. Cada tentativa tem somente um dos dois resultados possíveis e mutuamente excludentes, sucesso ou um fracasso.
3. A probabilidade de cada resultado não muda de tentativa para tentativa, e
4. As tentativas são independentes, então devemos tirar amostras com reposição.

Note que se o tamanho da amostra, n, for menor que 5% da população, a hipótese da independência não é de grande preocupação. Portanto o tamanho aceitável de amostra para usar a distribuição binomial com amostras tomadas sem reposição é [n<5% n] onde n é igual ao tamanho da amostra, e N significa o tamanho da população. O nascimento de uma criança (homem ou mulher), verdadeiro-falso ou testes de múltiplas escolhas (respostas corretas ou incorretas) são alguns exemplos da distribuição binomial.


Equação Binomial:

Quando se usa a fórmula binomial para resolver problemas, tudo que é necessário é que sejamos capazes de identificar três coisas: o número de tentativas (n), a probabilidade de um sucesso em qualquer tentativa (p), e o número de sucessos desejado (X). As fórmulas usadas para se calcular a probabilidade, a média, e o desvio padrão de uma distribuição binomial são como segue.

onde: n = o tamanho da amostra ou o número de tentativas, X = o número de sucessos desejados, p = probabilidade de se obter um sucesso numa tentativa, e q = (1 - p) = a probabilidade de se obter um fracasso numa tentativa.

Para o cálculo das combinações, você pode usar uma página em Javascript desenvolvida para este e outros cálculos.

Exemplo:

Voltemos à aula número quatro e vamos resolver o problema de probabilidade de TVs defeituosas aplicando a equação binomial novamente. Dissemos lá, suponha que 4% de todas as TVs feitas por X&Y Company em 1995 são defeituosas. Se oito destas TVs são selecionadas aleatoriamente pelo país e testadas, qual é a probabilidade que exatamente três delas sejam defeituosas? Assuma que cada TV seja feita independentemente das outras.

Neste problema, n=8, X=3, p=0,04, e q=(1-p)=0,96. Enfiando estes números na fórmula binomial (ver a equação acima) obtemos: P(X) = P(3) = 0,0003 ou 0,03% que é a mesma resposta que a da aula número quatro. A média é igual a (n) x (p) = (8)(0,04)=0,32, a variância é igual a np (1 - p) = (0,32)(0,96) = 0,31, e o desvio padrão é a raiz quadrada de 0,31, que é igual a 0,6.

A Tabela Binomial:

Matemáticos construiram um conjunto de tabelas binomiais contendo as probabilidades pré-resolvidas. As distribuições binomiais são uma família de distribuições. Em outras palavras, cada diferente valor de n e/ou cada diferente valor de p dá uma distribuição binomial diferente. As tabelas estão disponíveis para diferentes combinações de valores de n e p. Para as tabelas, procure-as no texto. Cada tabela é encabeçada por um valor de n, e valores de p estão apresentados na linha de topo de cada tabela de tamanho n. Na coluna abaixo cada valor de p é a distribuição binomial para aquele valor de n e p. As tabelas binomiais são fáceis de se usar. Simplesmente procure n e p, depois então encontre X (localizado na primeira coluna de cada tabela), e leia a correspondente probabilidade. A tabela seguinte é a probabilidade binomial para n = 6. Note que as probabilidades em cada coluna da tabela binomial deve somar 1,0.

Tabela de Distribuição de Probabilidade Binomial
(n = 6)
----------------------------------------------------------------------------------------
Probabilidade
X.....0,1........0,2.....0,3.....0,4.....0,5.....0,6.....0,7.....0,8.....0,9
--------------------------------------------------------------------------------------
0.....0,531............0,118....................................................0,000
1.....0,354............0,303....................................................0,000
2.....0,098............0,324....................................................0,001
3.....0,015............0,185....................................................0,015
4.....0,001............0,060....................................................0,098
5.....0,000............0,010....................................................0,354
6.....0,000............0,001....................................................0,531
--------------------------------------------------------------------------------------


Exemplo:

Suponha que um exame consiste de seis questões verdadeiro e falso, e assuma que um estudante não tenha conhecimento do assunto. A probabilidade que o estudante obterá uma resposta correta para a primeira questão é 30%. Por outro lado, a probabilidade de obter cada uma das questões remanescentes corretamente é também 30%. Qual é a probabilidade de se obter mais do que três respostas corretas?
Para o problema acima, n = 6, p = 0,30, e X >3. Na tabela acima, procure por 0,30 ao longo da linha dos valores de p. O problema é localizar o P(X > 3). Então, a resposta envolve somar as probabilidades para X = 4, 5, e 6. Estes valores aparecem na coluna X na intersecção de cada valor X e p = 0,30, como segue:
P (X > 3) = Somatório de {P (X=4) + P(X=5) +P(X=6)} = (0,060)+(0,010)+(0,001) = 0,071 ou 7,1%
Então, podemos concluir que se 30% das questões do exame são respondidas por advinhação, a probabilidade é 0,071 (ou 7,1%) que é mais do que quatro das questões são respondidas corretamente pelo estudante.


Graficando a Distribuição Binomial:

O gráfico de uma distribuição binomial pode ser construido usando todos os valores possíveis X de uma distribuição e suas probabilidades associadas. Os valores X são graficados ao longo do eixo X, e as probabilidades são graficadas ao longo do eixo Y. Note que o gráfico da distribuição binomial tem três formas: Se p<0,5, o gráfico é assimétrico positivamente, se p>0,5, o gráfico é assimétrico negativamente, e se p=0,5, o gráfico é simétrico. A distorção é eliminada quando n se torna grande. Em outras palavras, se n permanecer constante mas p tornar-se maior e maior até 0,50, a forma da distribuição de probabilidades binomial torna-se mais simétrica. Se p permanecer o mesmo mas n tornar-se maior e maior, a forma da distribuição de probabilidade binomial torna-se mais simétrica.

A Distribuição de Poisson:

A distribuição de Poisson é outra distribuição de probabilidade discreta. Seu nome se deve a Simeon-Denis Poisson (1781-1840), um matemático Francês. A distribuição de Poisson depende somente do número médio de ocorrência por unidade do espaço tempo. Não há n, e nem p. A distribuição de probabilidade de Poisson fornece uma estreita aproximação à distribuição de probabilidade binomial quando n for grande e p for bem pequeno ou bem grande. Em outras palavras, se n>20 e np<=5 [ou n(1-p)<="5]", então podemos usar a distribuição de Poisson como uma aproximação à distribuição binomial. Para uma discussão detalhada da distribuição de probabilidade de Poisson, refira-se às apostilas.


A Distribuição Hipergeométrica:

Outra distribuição de probabilidade discreta é a distribuição hipergeométrica. A distribuição de probabilidade binomial assume que a população da qual a amostra é selecionada seja muito grande. Por esta razão, a probabilidade de sucesso não varia em cada tentativa. A distribuição hipergeométrica é usada para se determinar a probabilidade de um número específico de sucessos e/ou fracassos quando (1) uma amostra é selecionada de uma população finita sem reposição e/ou (2) quando o tamanho da amostra, n, é maior que ou igual a 5% do tamanho da poopulação, N, i.e., [ n>=5% N].
Note que por população finita quer dizer uma população que consiste de um número fixo de indivíduos conhecidos, objetos ou medidas. Por exemplo, existiam 489 aplicações na escola de enfermagem da Fundação Padre Albino em 2008. Para uma discussão detalhada da distribuição de probabilidade hipergeométrica, refira-se à apostila.



  Links
relacionados a esta aula


All contents copyright (c) 2012.
All rights reserved.
Esta página foi alterada pela última vez em 11/07/12