If you're seeing this message, it means we're having trouble loading external resources on our website.

Se você está atrás de um filtro da Web, certifique-se que os domínios *.kastatic.org e *.kasandbox.org estão desbloqueados.

Conteúdo principal
Tempo atual:0:00Duração total:6:44

Transcrição de vídeo

o Olá meu amigo minha amiga tudo bem com você seja muito bem-vindo ou bem-vindo a mais um vídeo daquele Academy Brasil e nesse vídeo vamos conversar sobre intervalos de confiança em outros vídeos nós calculamos e até interpretamos os intervalos de confiança mas aqui vamos ter certeza de que estamos fazendo as proposições corretas para que a gente possa ter confiança em nossos intervalos de confiança ou que estamos até calculando eles de forma certa ou no contexto certo então apenas como uma pequena revisão muito do que fazemos em intervalos de confiança é tentar estimar algum parâmetro de população vamos dizer que a gente tem uma proporção Talvez seja a proporção que vai votar em um candidato não podemos pesquisar todo mundo Então pegamos uma amostra e dessa mostra Talvez calculemos uma proporção da mostra usando essa proporção de amostra nós calculamos um o vale de confiança em ambos os lados dessa proporção da mostra e o que sabemos é que se a gente fizer isso muitas muitas muitas vezes cada vez que fizermos isso temos a propensão de ter uma proporção de amostra é diferente então essa seria a proporção da mostra um e essa seria a proporção da mostra dois e cada vez que a gente fizer isso podemos obter talvez essa seja a proporção da mostra dois não só teremos um valor diferente que você pode dizer que é o centro do nosso intervalo mas a margem de erro pode mudar porque estamos usando a proporção da amostra para calcular agora para assumir que isso seja uma verdade ou seja para que a gente tem aqui um intervalo de confiança com confiança primeiro Isso precisa ser uma amostra aleatória então isso precisa ser uma amostra aleatória se você está tentando estimar a proporção de pessoas que vão votar em um certo candidato Mas você está a pena as pessoas em uma comunidade de idosos isso não vai ser uma amostra verdadeiramente aleatória se a gente apenas pesquisar pessoas em um campus universitário também não teremos uma mostra verdadeiramente aleatória assim como acontece com todas as coisas em estatística você realmente quer ter certeza que você está lidando com uma amostra aleatória Então tome muito cuidado para fazer isso a segunda coisa que devemos assumir é algo que às vezes é conhecido como condição normal lembre-se toda a base atrás dos intervalos de confiança é que Assumimos que a distribuição das proporções da mostra a distribuição de amostragem das proporções da mostra tem aproximadamente uma forma normal como essa mais para fazer essa suposição O que é quase normal nós temos essa condição normal e a regra aqui é que você esperaria por amostra os 10 sucessos e 10 para cá SUS em cada uma delas por exemplo se o seu tamanho de amostra foi de aproximadamente 10 vamos dizer que a proporção verdadeira foi de cinquenta por cento ou 0,5 então você não consideraria essa condição normal porque você esperaria cinco sucessos e cinco falhas para cada amostra agora geralmente quando estamos fazendo intervalos de confiança nós nem sabemos o parâmetro da população verdadeira sendo assim o que faríamos realmente a olhar para nossa amostra e apenas contar quantos sucessos e quantas falhas nós temos E se a gente tiver menos que 10 em qualquer uma dessas teremos um problema Ou seja você tem que ter pelo menos 10 ou mais sucessos e 10 ou mais falhas em cada amostra Sendo assim você sempre precisa pegar uma amostra e contar quantos sucessos e quantas Paris você tem se essa condição não for bom então a condição normal não é atendida e as declarações que você faz sobre o seu intervalo de confiança não serão necessariamente tão válidas a última coisa que precisamos ter certeza é conhecida como condição de independência e essa é a regra dos 10 por cento se demos uma amostra sem reposição e às vezes é difícil fazer uma substituição por exemplo se você estiver pesquisando pessoas que estão saindo de uma loja você não pode pedir para elas voltarem para a loja já que vai ser muito estranho você fazer isso sendo assim a condição de independência é o tamanho da sua mostra Então deixa eu dizer que n tem que ser inferior a 10 por cento do tamanho da população vamos dizer aqui que a população seja de 100 mil pessoas se você pesquisar mil pessoas isso será um por cento da população Então você se sentiria muito bem com isso porque a condição de independência Oi tá sendo atendida Mais uma vez você é muito valioso quando você está pegando amostra e sem reposição agora para observar como os nossos intervalos de confiança vão se comportar Quando essas coisas são quebradas eu vou me concentrar nesses dois últimos aqui a condição de amostra aleatória francamente é super importante em todas as estatísticas Então vamos primeiro olhar para essa situação onde a condição de independência quebrada você pode ver aqui que estamos usando nossa pequena simulação de chicletes e nessa simulação de chiclete temos uma verdadeira proporção da população mais alguém fazendo isso com as amostras pode não saber disso estamos tentando construir um intervalo de confiança com o nível de confiança de noventa e cinco porcento e o que configuramos aqui é que não estamos repondo ou seja não tem reposição então não estamos olhando para cada membro de nossa amostra e colocando ele de volta vamos apenas pegar uma amostra de e eu configurei a população para que seja muito maior do que 10 por cento da população sendo assim quando eu desenhei um monte de amostras como esse caso aqui eu fiz quase 1.500 amostras com o tamanho de 200 o que você pode ver aqui são as situações onde o nosso verdadeiro parâmetro de população estava contido no intervalo de confiança que calculamos para essa mostra você pode ver em vermelho os que não estão nesse intervalo a sobreposição entre o intervalo de confiança que estamos calculando com o verdadeiro parâmetro de população está acontecendo em cerca de noventa e três por cento das vezes e isso é um lindo grande o número de amostras se estiver realmente Em um nível de confiança de noventa e cinco porcento eu sou deve estar acontecendo noventa e cinco porcento das vezes da mesma forma podemos olhar para uma situação onde nossa condição normal se desfaz podemos ver aqui que nosso tamanho da amostra 15 olhando mais Eu acho você pode ver o que nessa simulação me preocupa a menos de 10 sucessos esperados e você pode observar que quando eu faço mais uma vez várias amostras eu fiz mais de duas mil amostras mesmo assim eu tenho um aumento nesses intervalos de confiança já que toda vez que o composto isso eu tenho uma espécie de dispersão mesmo eu tenho uma taxa de acerto em noventa e cinco porcento das vezes na verdade é que é uma taxa de acerto de 94% e eu fiz muitas amostras aqui então assim a grande lição que aprendemos é que se as amostras não forem aleatórias as informações serão distorcidas Além disso se você não se sente bem sobre qual normal é a sua distribuição de amostragem da proporção da amostra ou se o tamanho da sua mostra por um valor muito grande em relação à sua população onde você não está realizando reposições nós estaremos violando esses princípios E aí o seu nível de confiança que você está calculando através dos intervalos de confiança pode não ser válido Então é isso aí meu amigo minha amiga eu espero que você tenha compreendido tudo direitinho o que conversamos até aqui e mais uma vez eu quero deixar para você um grande abraço e até a próxima
AP® é uma marca comercial registrada da College Board, que não revisou este recurso.