If you're seeing this message, it means we're having trouble loading external resources on our website.

Se você está atrás de um filtro da Web, certifique-se que os domínios *.kastatic.org e *.kasandbox.org estão desbloqueados.

Conteúdo principal

Exemplo: análise da diferença em distribuições

Como encontrar a probabilidade de uma mulher escolhida ao acaso ser mais alta que um homem escolhido ao acaso, entendendo a distribuição da diferença de variáveis normalmente distribuídas.

Quer participar da conversa?

Você entende inglês? Clique aqui para ver mais debates na versão em inglês do site da Khan Academy.

Transcrição de vídeo

RKA10MP – Suponha que homens têm uma média de altura de 178 cm com um desvio padrão de 8 cm. Mulheres têm uma média de altura de 170 cm com desvio padrão de 6 cm. As alturas dos homens e das mulheres apresentam distribuição normal. De forma independente, selecionamos aleatoriamente um homem e uma mulher. Qual a probabilidade de que a mulher seja mais alta que o homem? Agora vou encorajá-lo a pausar o vídeo e tentar responder isso por conta própria. Mas antes vou deixar uma dica para você. E se definíssemos que a variável aleatória “H” é igual à altura do homem aleatoriamente selecionado? E também que a variável aleatória “M” é igual à altura da mulher aleatoriamente selecionada? E se ainda definíssemos uma terceira variável em termo dessas duas primeiras? Então vamos chamar essa terceira variável de “D”, de diferença, que é igual à diferença de altura entre o homem selecionado aleatoriamente e a mulher selecionada aleatoriamente. Sabemos que essas variáveis têm distribuição normal porque nos informaram bem aqui. E também sabemos, ou você está prestes a conhecer, que a diferença de variáveis aleatórias normalmente distribuídas também vão apresentar uma distribuição normal. Então, dado isso, você sabe responder à pergunta: Qual a probabilidade de a mulher ser mais alta do que o homem? E para ajudar a gente a visualizar, vou colocar umas curvas de distribuição aqui para estas três variáveis. Esta primeira curva vai ser para a nossa variável “H”. Sabemos que a média é de 178, e aqui temos também um desvio padrão de 8 cm, então teria um desvio de 8 para cá e um desvio de 8 para cá, o que nos daria... o que nos daria, então, 186 aqui e 170 aqui. Agora vamos pensar sobre a variável aleatória “M”. Sabemos que a média é de 170 cm. Temos um desvio padrão de 6, então seria 6 cm para cá, 176 e -6, 164 aqui. Agora vamos pensar na diferença entre os dois, então, variável “D”. A média vai ser igual à diferença entre as médias das outras variáveis, por isso vai ser igual à média de “H” menos a média de “M”. Sabemos que isso aqui é 178 e isso aqui é 170. Então 178 menos 170 dá 8 cm. Sabemos que a média aqui é 8. E agora o que acontece com o desvio padrão? Assumindo que essas duas variáveis aleatórias são independentes, a altura do homem não deve afetar a altura da mulher e vice-versa. E assumindo que são variáveis independentes, se você tomar a soma ou a diferença delas, então a dispersão vai aumentar. Mas não vamos apenas adicionar o desvio padrão, vamos fazer isso pela variância. A variância da diferença vai ser a soma desses dois desvios, então vamos escrever aqui. A variância, que posso escrever como desvio padrão ao quadrado, então vai ser o desvio padrão de D² é igual ao desvio padrão de H² mais o desvio padrão de M². Pode parecer um pouco estranho porque estou somando em vez de subtrair, mas não importa se estamos adicionando ou subtraindo, porque são variáveis independentes. Então vamos resolver isso aqui, o desvio padrão de “H” é 8, e 8² é 64. E o desvio padrão de “M” é 6, e 6² é 36. Isso nos dá, então, 64 mais 36 é 100. O desvio padrão de “D” vai ser √100. O desvio padrão de “D” é igual a 10. Então agora sabemos que o desvio padrão acima da média vai ser 8 mais 10, que é 18, e o desvio padrão abaixo da média vai ser 8 menos 10, que é -2. E usando essa distribuição, agora podemos responder à pergunta: Qual a probabilidade de a mulher ser mais alta do que o homem? Pause o vídeo e pense nisso. Qual é a situação em que a mulher é mais alta do que o homem? Se a mulher for mais alta do que o homem, então “D” deve ser um valor negativo. Estamos querendo achar a probabilidade de “D” ser menor do que zero. O que queremos realmente descobrir é a probabilidade de “D” ser menor do que zero. O que vamos fazer é deixar o zero aqui, ele estará mais ou menos aqui. E o que queremos descobrir é a área, toda essa área antes do zero. Toda esta área. E há uma série de maneiras de se fazer isso. Você pode descobrir a pontuação “Z” para “D” igualando a zero e isso é bem simples. Você poderia simplesmente dizer que este “Z” é igual a zero menos a nossa média, que é 8 e dividido pelo desvio padrão, que é 10. Isso daria zero menos 8 dividido por 10, “Z” daria -0,8. Então você poderia olhar para uma tabela “Z” e dizer qual é a área total sob a curva abaixo de “Z” é igual a 0,8 negativo. Outra maneira que você poderia fazer isso é usando uma calculadora gráfica. Tenho uma bem aqui, em que temos uma função de distribuição cumulativa normal. Vou apertar este botão, que me levará à distribuição. Então tenho essas várias funções, e quero a função de distribuição cumulativa normal, que é a escolha 2. Em seguida, o limite inferior… Bem, quero ir para um infinito negativo, mas as calculadoras não têm um botão de infinito negativo. Mas você poderia colocar em um número muito, muito, muito, muito negativo que, para os nossos propósitos, é equivalente ao infinito negativo. Então poderíamos dizer -1 vezes 10⁹⁹. E a forma como fazemos isso é usar estes “E”, que significam 10⁹⁹. Portanto, este é um número muito, muito, muito negativo, e o limite superior aqui... Vamos apagar esse. O limite superior vai ser zero. Estamos descobrindo a área do infinito negativo até zero. A média aqui a gente já sabe, é 8. E o desvio padrão aqui a gente também já sabe, é igual a 10. E assim, como escolhemos isso, vamos voltar para a tela principal. Isso aqui significa que estamos olhando para uma distribuição normal e queremos encontrar a área acumulada entre os dois limites, nesse caso, é de infinito negativo a zero, do infinito negativo ao zero, e que a média é 8 e o desvio padrão é de 10. Vamos pressionar ‘Enter’ e vai ser aproximadamente 0,212. Então é de aproximadamente 0,212. Qual é a probabilidade da mulher ser mais alta do que o homem? Aproximadamente 0,212 ou aproximadamente 21,2%.