If you're seeing this message, it means we're having trouble loading external resources on our website.

Se você está atrás de um filtro da Web, certifique-se que os domínios *.kastatic.org e *.kasandbox.org estão desbloqueados.

Conteúdo principal

Intervalos de confiança e margem de erro

Intervalos de confiança e margem de erro.

Transcrição de vídeo

e é tempo de eleição e existe uma disputa entre o candidato a e o candidato b e nós estamos bastante interessados em ver qual é a probabilidade de o candidato a vencer a eleição para obter o resultado ideal deveria perguntar para toda a população em quem cada um iria voltar Digamos que a população que vota seja de 100 mil pessoas e eu perguntaria para cada um deles em quem você vai votar E então eu iria conhecer um parâmetro populacional e esse parâmetro indicaria a fração da população que apoia o candidato a esse valor seria naturalmente bastante realista uma vez que ele foi obtido a partir de toda a população entretanto O que é mais comum e mais razoável fazer é tomar uma amostra a partir dessa população para estudar lá peça amostra nosso calculamos o parâmetro estatístico que queremos estudar com o objetivo de estimar o parâmetro populacional e vamos então tomar aqui uma amostra Digamos que te tamanho sem a letra N indica quantos elementos têm nessa amostra e nós vamos calcular o mesmo parâmetro para essa mostra que seria neste nosso exemplo a fração da população que apoia o candidato a digamos neste exemplo que na amostra eu obtive a informação do que esse parâmetro seria 0,54 seja 54 por cento da amostra declararam votar no candidato a é razoável pensar que se tomássemos outra mostra outras 100 pessoas e fizéssemos a mesma pesquisa com elas nós obtivéssemos outro resultado para este mesmo parâmetro Digamos que nesta outra amostra e outras 100 pessoas encontremos 0,58 da população que declara votar no candidato a nós temos ferramentas estatísticas para analisar a distribuição desses parâmetros amostrais em vídeos anteriores Já estudamos as distribuições amostrais de parâmetros da e como por exemplo a parcela da população que vota em um candidato esse exemplo para n que é o tamanho da amostra de cem elementos já que o tamanho da amostra é bem menor que o tamanho da população menor que 10 por cento do tamanho da população podemos assumir que as amostras são independentes e assumindo que o parâmetro populacional não seja muito próximo de zero nem de um temos uma curva normal para representar a distribuição dos parâmetros amostrais esta curva no formato de um sino aqui temos a informação e eu sugiro que você é procure isso em vídeos aqui daquela Academy de que a média da distribuição amostral do parâmetro que estamos estudando indica o parâmetro o populacional neste caso o parâmetro em questão é a parcela ou a fração da população que vota no candidato a eu vou marcar aqui um desvio padrão 2 existe padrões três desvios padrões Acima da média e aqui também 12 e desvios-padrões abaixo da média e esta distância de um desvio padrão para a distribuição amostral do parâmetro em questão é obtida pela raiz quadrada de b vezes lembre-se de que p é o parâmetro populacional P vezes 1 - p sobre m tem que ele é o tamanho da mostra que neste caso seria sem Vamos focar neste primeiro cenário aqui nela nós temos o parâmetro amostral 0,54 54 por cento da amostra indicando que apoia o candidato a eu não sei exatamente onde estaria o 0,54 ele poderia estar aqui ou poderia estar ali e a razão que eu não saber onde 0,54 se encontra é porque eu não sei qual é o valor real do parâmetro populacional vou agora fazer uma pergunta relativamente simples que é o que vai nos nortear qual é a probabilidade de que o parâmetro amostral indicado aqui por P chapéu que é 0,54 esteja a uma distância da Média os dois desvios-padrões sugiro que você pause o vídeo e pense um pouco sobre isso muito bem dizer que eu estou querendo analisar dois desvios-padrões acima ou abaixo da Média desta distribuição significa olhar para esta área Esta área indica a probabilidade de que o parâmetro em questão esteja dois desvios-padrão para cima ou para baixo da média nós já sabemos ao estudar a distribuição normal que aproximadamente noventa e cinco porcento da área sob a curva abrange esta região e dois desvios-padrões para cima ou para baixo da média Ou seja a probabilidade perguntado é de aproximadamente noventa e cinco porcento ou seja noventa e cinco porcento das vezes que eu tomar uma amostra de tamanho sem e calcular esse parâmetro P chapéu o resultado obtido vai estar nessa faixa de dois desvios-padrão para menos ou para mais da Média a partir desta afirmação Podemos construir uma outra afirmação é mais Digamos inferencial que nos permitam fazer inferência e essa afirmação é a seguinte a noventa e cinco porcento de probabilidade de que o parâmetro populacional P esteja a uma distância menor que 2 desvios-padrão do parâmetro de chapéu e neste caso seria 0,54 vamos ver vídeo e análise estas duas afirmações veja como elas são equivalentes ou seja se a noventa e cinco porcento de chance de que o parâmetro amostral esteja a uma distância menor que 2 desvios-padrão da Média que representa o parâmetro populacional real permite dizer que a noventa e cinco porcento de chance e que o parâmetro populacional real esteja a dois desvios-padrão no máximo de distância do parâmetro amostral e isso é muito muito interessante porque Se nós formos capazes de descobrir que valor é este nós seremos capazes de construir o chamamos de intervalo de confiança mas nós temos um pequeno problema aqui porque para calcular o desvio padrão da distribuição amostral desse parâmetro nós precisaríamos do parâmetro populacional e nós não temos então pause o vídeo e verifique se já que não temos o valor DP porque ele é um parâmetro populacional que estimador nós poderíamos ter para esse parâmetro populacional bem veja que nos calculamos o pé chapéu que é o parâmetro amostral e isso nos dá uma nova ferramenta na estatística chamada de erro padrão dos parâmetros amostrais e esse erro padrão é definido pela raiz quadrada E agora Como nós não temos a informação sobre o parâmetro populacional nós vamos usar o parâmetro a mostrar o que nós já conhecemos ficamos então com P chapéu vezes um menos peixapéu sobre n que nesse caso seria sem não Vamos demonstrar Neste vídeo mas este é um estima a viciado para este valor aqui colocando os valores de 0,54 no chapéu vamos ficar com 0,54 x 1 - 0,54 0,46 tudo isso sobre sem e depois temos de fazer a raiz quadrada desse resultado vou usar a calculadora digitando aqui a raiz quadrada de 0,54 x 0,46 sobre sem o resultado que temos aqui aproximando para os centésimos e 0,05 e o que isso nos dá é uma boa estimativa para o desvio-padrão do parâmetro a mostrar o que nós estamos estudando podemos dizer então que com noventa e cinco porcento de confiança entre 0,44 de onde vem esse 0,44 é o nosso parâmetro amostral que 0,54 menos dois desvios-padrões cada diz que o padrão e 0,05 então 0,54 menos a 0,05 da 0,44 e 0,64 que é o 0,54 do nosso parâmetro amostral mais duas vezes o 0,05 do desvio padrão desse parâmetro então retomando com noventa e cinco porcento de confiança entre 0,44 e 0,64 dos eleitores dão apoio ao candidato a este então é o nosso intervalo de confiança e esse intervalo de confiança pode mudar não só nos extremos mas também no tamanho dele a partir do tamanho da amostra que nós coletamos para obter o parâmetro amostral e a ideia de intervalo de confiança nos permite chegar ao conceito de margem de erro neste caso como construímos o intervalo de confiança baseado em dois desvios-padrão a nossa margem de erro é de 0,1 ponto que é duas vezes o e do desvio-padrão calculado Ou seja no intervalo de confiança a partir do valor do parâmetro a mostrar o quê 0,54 Nós temos uma margem de erro para cima que é 0,64 e uma margem de erro para baixo que é 0,44 e reforçando esta margem de erro não vai ser sempre a mesma toda vez que eu tomar uma amostra dependendo do parâmetro calculado para a amostra nós vamos ter uma margem de erro diferente porque ela mar gente vai calculado essencialmente a partir do erro padrão que é calculado a partir do valor encontrado para o parâmetro amostral outra Interpretação para isso é que o método que nós usamos para obter este intervalo de confiança é que construindo várias e várias vezes cada vez com uma mostra diferente portanto com parâmetro a mostrar o diferente serão obtidos intervalos que incluem o parâmetro populacional real que lembre-se nós não conhecemos há 35 por cento das vezes que nós construímos os intervalos de confiança em vídeos futuros nós vamos abordar mais essa questão do intervalo de confiança e das alterações que podemos ter nele mas quando você faz essas contas várias várias várias vezes e noventa e cinco porcento das vezes o parâmetro populacional real vai estar contido nos intervalos obtidos uma outra questão interessante é esse eu quiser diminuir esse intervalo de confiança Como eu posso fazer isso veja que neste cálculo do erro padrão que nós aumentarmos o denominador o erro Vai ser menor e este denominador é justamente o tamanho da amostra ou seja aumentando o tamanho da amostra eu consigo mais precisão O que significa diminuir o intervalo de confiança e com isso nós encerramos até o próximo vídeo