If you're seeing this message, it means we're having trouble loading external resources on our website.

Se você está atrás de um filtro da Web, certifique-se que os domínios *.kastatic.org e *.kasandbox.org estão desbloqueados.

Conteúdo principal

Como determinar o tamanho amostral baseado em confiança e margem de erro

Como determinar o tamanho amostral baseado em nível de confiança e margem de erro.

Quer participar da conversa?

Nenhuma postagem por enquanto.
Você entende inglês? Clique aqui para ver mais debates na versão em inglês do site da Khan Academy.

Transcrição de vídeo

RKA2G - Della deseja fazer o intervalo Z de uma amostra para estimar a proporção de membros de sua comunidade que desejam aumento de imposto para mais fundações de escolas locais. Ela quer que sua margem de erro não seja maior do que mais ou menos 2% no nível de confiança de 95%. Qual é o menor tamanho da amostra necessária para obter a margem de erro desejada? Primeiro vamos recordar como é a aparência deste intervalo de confiança. Ela quer estimar a proporção real na população que representa as pessoas favoráveis ao aumento de imposto. Para isso, ela vai tomar uma amostra de tamanho "n". A nossa questão é justamente essa: qual é o tamanho da amostra, qual é o "n" para que atendamos às condições de margem de erro no nível de confiança desejado? Para qualquer amostra que ela tomar, ela vai calcular a proporção, o valor do parâmetro amostral, que é p^. E o intervalo de confiança que vai ser construído será o p^ mais ou menos o valor crítico, o z*. E esse valor, z*, depende do nível de confiança, que neste caso é de 95%. E esse valor crítico é multiplicado pelo erro-padrão da amostra para o parâmetro estudado. E ele é obtido pela raiz quadrada de p^ vezes (1 - p^), dividido por "n". Mas ela quer que a sua margem de erro não seja maior do que 2%. E a margem de erro é esta parte destacada em verde. É esta parte que nós queremos que seja menor que ou igual a 2%. E como é que nós vamos calcular esse valor? Primeiro vamos olhar para o nível de confiança de 95% e, com o auxílio da tabela Z, vamos obter o valor de z*, o valor crítico. Vamos lembrar que, se ele tiver uma distribuição normal, representada aqui por esta curva com aparência de sino, e 95% no nível de confiança, quer dizer o número de desvios-padrão acima e abaixo da média que permita obter uma área sob o gráfico que abrange 95% desta região. Desta forma, sobram 2,5% na cauda à direita e também na cauda à esquerda. Tendo essa ideia em mãos, vamos até a tabela Z e lá nós não vamos procurar o 95%. Nós vamos procurar o valor que deixa 2,5% ao final na cauda à direita. Porque lembre-se de que, na maioria das tabelas Z, você encontra o valor referente à área de toda a curva à esquerda do valor lá encontrado. Ou seja, na tabela Z, nós vamos procurar o valor crítico referente a 97,5%. E com isso, nós vamos saber o limite superior a partir da média, Ou seja, quantos desvios-padrão acima da média nós precisamos para chegar até esse valor, que deixa 2,5% na cauda à direita. É importante lembrar então que, olhando na tabela Z, o nível de confiança de 95% nos dá o valor crítico de 1,96. E este é exatamente o valor de z*: 1,96. A questão agora é saber qual é o valor do p^. Lembrando que estamos procurando, na verdade, o valor de "n", que é o tamanho da amostra. Mas lembre-se de que toda esta parte destacada em verde tem que ser menor que ou igual a 2%. Vamos olhar, então, para "a pior situação possível". Isso acontece quando o numerador é o maior possível, porque, quando ele for o maior possível, nós vamos ter a maior margem de erro possível. E, se nós garantimos que o resultado desta conta fique até 2%, nós responderemos à pergunta do problema. E a expressão p^ vezes (1 - p^) tem o seu valor máximo quando p^ vale 0,5. Você pode chegar a essa conclusão por meio da tentativa e erro, ou algebricamente, por meio da análise de uma função quadrática bem simples. Veja que ela não tinha o valor do p^. Normalmente esse um valor que nós obtemos na amostra, e não tínhamos esse valor. Mas, maximizando a expressão que define a margem de erro, nós podemos deduzir o valor do p^. Com essas informações em mãos, vamos calcular o valor de "n". Temos, então: 1,96, que é o valor do z*, vezes a raiz quadrada de p^ (que é 0,5) vezes (1 - p^): 1 - 0,5, que também é 0,5; sobre "n". Queremos que o resultado desta expressão seja menor que ou igual a 0,02, que é 2%. Para obter valor de "n", vamos usar um pouquinho de álgebra. Primeiro, vamos dividir os dois lados da desigualdade por 1,96. Assim, cancelamos o 1,96 do lado esquerdo. Na raiz quadrada, temos 0,5 vezes 0,5, que é 0,5². Então, ele pode cancelar a raiz quadrada do numerador. Vamos ficar, então, com 0,5 sobre a raiz quadrada de "n" menor ou igual a 0,02, que é 2/100. E o 100 multiplicado pelo 1,96 do denominador é 196. Invertendo os dois lados da desigualdade, ficamos com raiz quadrada de "n" sobre 0,5. Invertemos o sentido da desigualdade e ficamos com 196/2, que é a mesma coisa que 98. Agora multiplicamos os dois lados da desigualdade por 0,5 e vamos ficar com raiz quadrada de "n" maior que ou igual a 98 vezes 0,5, que é 49. Como queremos calcular o valor de "n", vamos elevar os dois lados ao quadrado. Ficamos com "n" maior que ou igual a 49². Resolvendo este cálculo, chegamos ao valor de "n". E 49 vezes 49 resulta em 2.401. Então, 2.401 é o menor tamanho da amostra que Della deve tomar para garantir 95% de nível de confiança e margem de erro de no máximo 2%. Observe que se, em uma amostra qualquer, ela calcular o valor de p^ e der mais do que 0,5 ou menos que 0,5, a margem de erro, que é o resultado da conta desta parte verde, vai mudar, mas ela vai ficar menor do que 2%, que era justamente o que ela desejava. Outro ponto importante é observar que chegamos a um valor inteiro, que é o 2401. E o tamanho da amostra é sempre um número inteiro. Então se os nossos cálculos nos tivessem dado um valor que não é inteiro para o tamanho da amostra, nós precisaríamos arredondar esse valor para o inteiro mais próximo. Até o próximo vídeo!