Conteúdo principal
Estatística Avançada
Curso: Estatística Avançada > Unidade 8
Lição 4: Combinação de variáveis aleatórias- Média da soma e diferença de variáveis aleatórias
- Variância da soma e diferença de variáveis aleatórias
- Raciocínio sobre por que a independência é importante para a variância da soma
- Derivação da variância da diferença de variáveis aleatórias
- Combinação de variáveis aleatórias
- Combinação de variáveis aleatórias
- Exemplo: análise da distribuição da soma de duas variáveis aleatórias normalmente distribuídas
- Exemplo: análise da diferença em distribuições
- Combinação de variáveis aleatórias normais
- Combinação de variáveis aleatórias normais
© 2023 Khan AcademyTermos de usoPolítica de privacidadeAviso de cookies
Exemplo: análise da diferença em distribuições
Como encontrar a probabilidade de uma mulher escolhida ao acaso ser mais alta que um homem escolhido ao acaso, entendendo a distribuição da diferença de variáveis normalmente distribuídas.
Quer participar da conversa?
- Eu não entendi a razão da P(M>H) = P(D<0). Acho que não ficou claro como isso é definido. Alguém teria uma dica a respeito?(1 voto)
- Como queremos descobrir a probabilidade das mulheres serem mais altas que os homens o valor de M será maior que o valor de H. Ao colocar isso na fórmula da diferença ( D = H - M ) veremos que se o M for maior que o H o valor de D será menor que 0.(1 voto)
Transcrição de vídeo
RKA10MP – Suponha que homens
têm uma média de altura de 178 cm com um desvio padrão de 8 cm. Mulheres têm uma média de altura
de 170 cm com desvio padrão de 6 cm. As alturas dos homens e das mulheres
apresentam distribuição normal. De forma independente, selecionamos
aleatoriamente um homem e uma mulher. Qual a probabilidade de que a mulher
seja mais alta que o homem? Agora vou encorajá-lo a pausar o vídeo
e tentar responder isso por conta própria. Mas antes vou deixar uma dica para você. E se definíssemos
que a variável aleatória “H” é igual à altura do homem
aleatoriamente selecionado? E também que a variável aleatória “M” é igual à altura da mulher aleatoriamente
selecionada? E se ainda definíssemos uma terceira
variável em termo dessas duas primeiras? Então vamos chamar essa terceira
variável de “D”, de diferença, que é igual à diferença de altura
entre o homem selecionado aleatoriamente e a mulher selecionada aleatoriamente. Sabemos que essas variáveis têm distribuição
normal porque nos informaram bem aqui. E também sabemos,
ou você está prestes a conhecer, que a diferença de variáveis aleatórias
normalmente distribuídas também vão apresentar
uma distribuição normal. Então, dado isso, você sabe
responder à pergunta: Qual a probabilidade de a mulher
ser mais alta do que o homem? E para ajudar a gente a visualizar, vou colocar umas
curvas de distribuição aqui para estas três variáveis. Esta primeira curva vai ser
para a nossa variável “H”. Sabemos que a média é de 178, e aqui temos também
um desvio padrão de 8 cm, então teria um desvio de 8 para cá e um desvio de 8 para cá,
o que nos daria... o que nos daria, então,
186 aqui e 170 aqui. Agora vamos pensar sobre
a variável aleatória “M”. Sabemos que a média é de 170 cm. Temos um desvio padrão de 6,
então seria 6 cm para cá, 176 e -6, 164 aqui. Agora vamos pensar na diferença entre
os dois, então, variável “D”. A média vai ser igual à diferença entre
as médias das outras variáveis, por isso vai ser igual à média
de “H” menos a média de “M”. Sabemos que isso aqui é 178
e isso aqui é 170. Então 178 menos 170 dá 8 cm. Sabemos que a média aqui é 8. E agora o que acontece
com o desvio padrão? Assumindo que essas duas variáveis
aleatórias são independentes, a altura do homem não deve afetar
a altura da mulher e vice-versa. E assumindo que são
variáveis independentes, se você tomar a soma ou a diferença delas,
então a dispersão vai aumentar. Mas não vamos apenas adicionar o desvio
padrão, vamos fazer isso pela variância. A variância da diferença vai ser a soma
desses dois desvios, então vamos escrever aqui. A variância, que posso escrever como
desvio padrão ao quadrado, então vai ser o desvio padrão de D²
é igual ao desvio padrão de H² mais o desvio padrão de M². Pode parecer um pouco estranho porque
estou somando em vez de subtrair, mas não importa se estamos adicionando
ou subtraindo, porque são variáveis independentes. Então vamos resolver isso aqui,
o desvio padrão de “H” é 8, e 8² é 64. E o desvio padrão de “M” é 6,
e 6² é 36. Isso nos dá, então, 64 mais 36 é 100. O desvio padrão de “D” vai ser √100. O desvio padrão de “D” é igual a 10. Então agora sabemos que o desvio padrão
acima da média vai ser 8 mais 10, que é 18,
e o desvio padrão abaixo da média vai ser 8 menos 10,
que é -2. E usando essa distribuição,
agora podemos responder à pergunta: Qual a probabilidade de a mulher ser mais alta
do que o homem? Pause o vídeo e pense nisso. Qual é a situação em que a mulher
é mais alta do que o homem? Se a mulher for mais alta do que o homem,
então “D” deve ser um valor negativo. Estamos querendo achar a probabilidade
de “D” ser menor do que zero. O que queremos realmente descobrir é
a probabilidade de “D” ser menor do que zero. O que vamos fazer é deixar o zero aqui,
ele estará mais ou menos aqui. E o que queremos descobrir
é a área, toda essa área antes do zero.
Toda esta área. E há uma série de maneiras
de se fazer isso. Você pode descobrir a pontuação “Z” para “D”
igualando a zero e isso é bem simples. Você poderia simplesmente dizer
que este “Z” é igual a zero menos a nossa média, que é 8
e dividido pelo desvio padrão, que é 10. Isso daria zero menos 8
dividido por 10, “Z” daria -0,8. Então você poderia olhar
para uma tabela “Z” e dizer qual é a área total sob a curva
abaixo de “Z” é igual a 0,8 negativo. Outra maneira que você poderia fazer
isso é usando uma calculadora gráfica. Tenho uma bem aqui, em que temos
uma função de distribuição cumulativa normal. Vou apertar este botão,
que me levará à distribuição. Então tenho essas várias funções, e quero a função de distribuição
cumulativa normal, que é a escolha 2. Em seguida, o limite inferior…
Bem, quero ir para um infinito negativo, mas as calculadoras não têm
um botão de infinito negativo. Mas você poderia colocar em um número
muito, muito, muito, muito negativo que, para os nossos propósitos,
é equivalente ao infinito negativo. Então poderíamos dizer -1 vezes 10⁹⁹. E a forma como fazemos isso é usar
estes “E”, que significam 10⁹⁹. Portanto, este é um número muito,
muito, muito negativo, e o limite superior aqui...
Vamos apagar esse. O limite superior vai ser zero.
Estamos descobrindo a área do infinito negativo até zero.
A média aqui a gente já sabe, é 8. E o desvio padrão aqui a gente
também já sabe, é igual a 10. E assim, como escolhemos isso,
vamos voltar para a tela principal. Isso aqui significa que estamos olhando
para uma distribuição normal e queremos encontrar a área acumulada entre os dois limites, nesse caso,
é de infinito negativo a zero, do infinito negativo ao zero, e que a média é 8
e o desvio padrão é de 10. Vamos pressionar ‘Enter’
e vai ser aproximadamente 0,212. Então é de aproximadamente 0,212. Qual é a probabilidade da mulher
ser mais alta do que o homem? Aproximadamente 0,212 ou aproximadamente 21,2%.