If you're seeing this message, it means we're having trouble loading external resources on our website.

Se você está atrás de um filtro da Web, certifique-se que os domínios *.kastatic.org e *.kasandbox.org estão desbloqueados.

Conteúdo principal

Comparação de proporções populacionais 1

Neste vídeo, usamos um exemplo das eleições para comparar proporções populacionais. Versão original criada por Sal Khan.

Quer participar da conversa?

Nenhuma postagem por enquanto.
Você entende inglês? Clique aqui para ver mais debates na versão em inglês do site da Khan Academy.

Transcrição de vídeo

RKA9C Vamos dizer que há uma eleição se aproximando, e eu quero saber se tem alguma diferença significativa entre a proporção de homens e mulheres que vão votar para um dos candidatos. Então, nós temos aqui a distribuição da população, vamos dizer que aqui tem os homens, e os homens vão ter a seguinte distribuição, olha só. Ora, uma proporção aqui dos homens vai votar em um dos candidatos, digamos que essa proporção aqui vai ser a proporção "P₁", e uma outra proporção vai votar no outro candidato, digamos a proporção "1 menos P₁". Aqui, eu vou atribuir o valor 1 e aqui o valor zero. E, para as mulheres, vai acontecer a mesma coisa, olha só. Digamos que aqui nós temos a distribuição das mulheres. Então, eu vou ter que uma proporção das mulheres vai votar no candidato, digamos a proporção "P₂", aqui vai ser o valor 1, e a outra proporção não vai votar no candidato, então, digamos, "1 menos P₂", aqui vai ser zero. E ambas essas distribuições aqui são distribuições de Bernoulli. E, como nós já sabemos que é algo bem útil, a média dessa distribuição é o mesmo valor da proporção que vai votar no candidato, ou seja, "P₁" aqui para os homens e "P₂" para as mulheres. Então, eu vou dizer aqui, nos homens, que a média, vou chamar de média 1, é igual a "P₁". E a variância? Neste caso, como nós já vimos... Deixa eu só escrever mais aqui para o lado. A média 1 dos homens é igual a "P₁", e a variância dessa distribuição 1, estou chamando de variância 1, vai ser igual à multiplicação desses dois valores aqui, é ou não é? Já vimos isso em vídeos anteriores. Ou seja, isso vai ser "P₁" multiplicado por "1 menos P₁", certo? E nós vamos fazer agora a mesma coisa com as mulheres, olha só: a média, vou chamar de média 2, que é a média das mulheres, vai ser igual ao valor "P₂", e a variância desta distribuição, que eu estou chamado de variância 2, é igual à multiplicação destes valores. Então, vai ser "P₂" que multiplica "1 menos P₂". Agora, o que eu quero fazer... Eu acho que eu já até falei no início do vídeo, eu quero descobrir se tem uma diferença significativa entre as maneiras como os homens vão votar e como as mulheres vão votar. O que eu quero saber aqui é o seguinte: será que isto aqui é significativo? A diferença entre estas médias, é isso que eu quero saber. E o que eu vou fazer, então, aqui neste vídeo, para determinar isso, é construir um intervalo de confiança de 95% para este parâmetro aqui, ou seja, esta diferença entre parâmetros continua sendo um parâmetro, certo? Nós não sabemos o valor dessa diferença aqui, então, o que eu quero fazer neste vídeo, como eu acabei de dizer, é construir o intervalo de confiança de 95% para aquela diferença ali, "P₁" menos "P₂". Então, digamos que nós vamos à rua e nós entrevistamos mil homens e mil mulheres para pegar a opinião deles. E, então, quando nós entrevistamos esses mil homens, ao entrevistá-los, eu descobri que 642 vão votar no candidato, ou seja, a opção 1, e o resto, eu vou dizer aqui o resto dos homens, não vai votar no candidato, então, vai ser zero. E entre as mulheres? Ora, ao entrevistarmos essas mil mulheres, o que aconteceu foi o seguinte: essas mulheres foram escolhidas de forma randômica, claro, então, 591 mulheres disseram que iam votar no candidato, a opção 1, e o resto não vai votar no candidato, então, vai ser zero. Só de observar isto aqui, no caso dessas médias populacionais, nós percebemos que há, sim, uma diferença, mas, mesmo assim, eu vou construir esse intervalo de 95% de confiança para essa diferença entre "P₁" e "P₂". Então, vamos entender o que eu acabei de fazer aqui: eu descobri agora, através destes resultados aqui, a proporção amostral. Então, vamos dizer "P barra" aqui, para os homens. E, neste caso, a proporção amostral e também a média amostral aqui, vai ser 642 dividido por mil, já que são 642 vezes o 1, e o resto é zero. Então, 642 no numerador dividido por mil vai dar 0,642, é ou não é? E a mesma coisa vai se aplicar também às mulheres. A proporção amostral aqui vai ser igual a 591 dividido por mil, é 0,591. E você pode ver isto aqui também, tanto para homem quanto para mulher, como a média amostral destas duas distribuições. E, apenas para a gente visualizar isto aqui um pouco melhor, eu vou construir aqui a nossa distribuição amostral dessas proporções amostrais ali. Como o nosso tamanho amostral "n" é bem grande, mil homens e mil mulheres, esta distribuição aqui, aproximadamente, vai ser uma distribuição normal, né? Então, isso que eu acabei de desenhar é a distribuição amostral da proporção amostral, daquele "P barra" ali. Essa distribuição, claro, vai ter aqui uma média. E nós sabemos que a média dessa distribuição das proporções amostrais, portanto, vai ser igual a "P₁". Olha aí! Então, "P₁". Deixa eu colocar o 1 aqui neste "P barra" e um 2 ali naquele "P" das mulheres só para poder diferenciar. Então, ali tem o 1 também. Beleza. E a variância desta distribuição vai ser igual, no caso desta distribuição de "P₁ barra"... Lá pelo teorema do limite central, eu sei que essa variança vai ser esta variança aqui, que é "P₁" vezes "1 menos P₁" dividido pelo tamanho amostral, que é mil. Agora, eu vou fazer exatamente a mesma coisa aqui para as mulheres. Olha só, então: vamos desenhar aqui a distribuição. Nós sabemos que é, aproximadamente, uma distribuição normal. Essa distribuição, ela tem aqui uma média. Esta é a média desta distribuição aqui, das proporções amostrais, e isto vai ser igual ao "P₂", beleza? O que é isto aqui, então, que eu desenhei? Ora, isso é a distribuição amostral para aquele "P₂" ali, "P₂ barra". Para isto aqui, é ou não é? Aí, a variância desta distribuição aqui vai ser igual, no caso, o "P₂ barra", vai ser igual a quanto? Vai ser a mesma coisa que dos homens. Então, vai ser "P₂" vezes "1 menos P₂", que é a variância dessa distribuição populacional, "P₂" vezes "1 menos P₂", dividido pelo tamanho amostral, que também é mil, então, dividido por mil. Agora, a gente não pode esquecer o nosso objetivo aqui, que é construir um intervalo de confiança de 95% para esta diferença aqui, certo? Então, nós não podemos pegar a distribuição amostral para isto aqui, nem a distribuição amostral para isto aqui. O que eu quero fazer é uma distribuição amostral para a diferença destes valores aqui, ou seja, a diferença disto aqui, do "P₁", e isto aqui. Nós já falamos sobre proporções amostrais, mas é exatamente a mesma ideia de quando trabalhamos com médias amostrais. Então, vamos fazer esta distribuição. Mas antes, lembre-se: este valor aqui, da proporção amostral, é como se fosse uma mostra desta distribuição aqui, a mesma coisa para este valor. Então, nós pegamos aqui mil amostras dessa distribuição de Bernoulli, calculamos a média, e essa média é como se fosse uma amostra desta distribuição amostral aqui, para este "P₂", certo? Agora, essa distribuição que nós vamos fazer, deixa eu desenhá-la aqui, ela vai ser a distribuição das diferenças daquelas distribuições amostrais ali, certo? Ela vai se parecer, então, com isto aqui, vai ter uma média também. Na verdade, eu vou fazer isto aqui com uma outra cor. Já que eu usei o amarelo ali, deixa eu fazer de verde. Então, essa distribuição vai se parecer com isto aqui, vai ter uma média. E eu vou chamar essa distribuição de distribuição amostral daquela estatística lá de cima, que eu fiz, que é o "P₁" menos o "P₂". Essas proporções amostrais "P₁" menos "P₂". Então, esta média aqui, que vai ser a média de "P₁ barra" menos "P₂ barra" é igual a quanto? Ora, nós já vimos, em vários outros vídeos, que isto aqui vai ser igual a esta média aqui menos esta média aqui, que vai ser exatamente "P₁" menos "P₂". Então, aqui eu posso escrever que essa média é igual a "P₁" menos "P₂". Deixa eu só fazer ali na cor apropriada para o "P₂". Então, "P₁" menos "P₂", beleza. Agora, a variância dessa distribuição, a variância da distribuição de "P₁ barra" menos "P₂ barra", é igual à soma destas duas variâncias, desta variância aqui mais esta variância aqui. Então, deixa eu fazer um "ctrl+c e ctrl+v" só para a gente poupar tempo na solução. Vamos arrastar para cá, e vou copiar este aqui também, porque agora eu vou ter que somar. Então, está aí! Basta eu somar estes dois valores aqui. E se eu quiser agora o desvio padrão? Ora, para o desvio padrão, basta eu me livrar deste quadrado aqui, ou seja, extrair a raiz quadrada em ambos os lados. Então, a raiz quadrada da variância vai dar o desvio padrão, por isso que eu me livrei destes dois aqui, e, deste outro lado, eu vou ter a raiz quadrada disso tudo, beleza? Então, tudo que eu fiz até agora foi apenas colocar conceitos dentro do nosso cérebro. Agora, nós já podemos atacar este problema e construir aquele intervalo de 95% para a diferença entre "P₁" e "P₂". Ou seja, isso é a mesma coisa que fazer um intervalo de confiança de 95% para esta média, o intervalo aqui. E, como agora eu não quero fazer vídeos muito longos, então, vou fazer um "parte 2", onde eu vou resolver este problema. Até o próximo vídeo!