Conteúdo principal
Curso: Estatística Avançada > Unidade 10
Lição 1: Introdução a intervalos de confiançaSimulação de intervalo de confiança
Simulação de intervalo de confiança.
Quer participar da conversa?
- tem essa aula em portugues??(1 voto)
Transcrição de vídeo
RKA2G - O objetivo deste vídeo é usar este simulador, que foi escrito
pela usuária Charlotte Allin, aqui na Khan Academy, para ter uma noção mais intuitiva
dos intervalos de confiança. Aqui nós estamos lidando com
uma máquina de gomas de mascar. E uma certa parte desses chicletes
são verdes. Vamos ajustar aqui para que 60%
dos chicletes sejam verdes. Agora, digamos que venha uma outra pessoa, que não sabe que a porcentagem
de chicletes verdes era de 60%. Mas essa pessoa pode tomar amostras. Digamos que ela toma amostras
de tamanho 50, cada vez. Clicando neste botão, ele vai desenhar
para nós a amostra colhida e, acima, nós veremos que fração
da amostra é composta por chicletes verdes. Nesta primeira nós tínhamos 0,6,
ou seja, 60%. Note que isto é um parâmetro amostral (p^). Quando eu tomo outra mostra,
clicando aqui, eu vejo que agora é 0,52 o valor do p^, ou seja, 52% dos chicletes que
eu coletei são verdes. E você pode dizer:
ok, são estimativas diferentes. Mas, para estimativas diferentes, quanto de confiança em torno
do parâmetro amostral encontrado nós podemos ter para encontrar
o valor do parâmetro populacional, em um certo intervalo? Vou usar o recurso desta aba aqui e ela vai nos mostrar os intervalos
de confiança criados a partir de cada amostra. No vídeo anterior, nós falamos sobre
como calcular o intervalo de confiança . O que queremos fazer agora é dizer:
bom, há 95% de chance (e esse 95% é o nível que as pessoas
normalmente gostam de usar), então, há 95% de chance de que, qualquer que seja o valor
do parâmetro amostral, ele esteja a uma distância máxima
de dois desvios-padrão do parâmetro populacional,
do valor real do parâmetro. Ou seja, 95% de chance de que
o valor real do parâmetro populacional esteja contido no intervalo de confiança
de dois desvios-padrão para cima ou para baixo do valor encontrado para o parâmetro amostral. Se nós não conhecemos o valor
do parâmetro populacional, uma maneira de estimar o desvio-padrão é com o erro-padrão, que nós vimos
em vídeos anteriores. Então, aqui temos dois erros-padrão
para a direita e dois erros-padrão para a esquerda
do parâmetro. E o intervalo de confiança é
este intervalo todo aqui. Podemos ficar clicando aqui
e fazer mais amostras. Nós podemos verificar que o intervalo se modifica
de acordo com o parâmetro amostral encontrado. Porque esse parâmetro amostral é
usado para calcular o intervalo de confiança. Então, em cada amostra, vamos encontrar
um intervalo de confiança diferente. Estamos aqui assumindo que a pessoa
que está obtendo essas amostras não conhece o valor do parâmetro
populacional real. E o que é interessante agora,
nesta simulação de várias amostras, é que podemos verificar em
que porcentagem das vezes os intervalos de confiança obtidos contém o valor real do parâmetro,
que é 0,6. Vou clicar aqui para fazer 25 amostras. Veja que aqui temos indicado que
93% dos intervalos que temos aqui contêm o parâmetro real da população Nós podemos continuar fazendo
amostras aqui e observar que muito perto de 95%
dos intervalos obtidos contém o parâmetro populacional real. Então, o que nós já fizemos matematicamente se demonstra aqui, fazendo várias
amostras e verificando que os intervalos de confiança
fazem um bom papel de conter, em 95% das vezes, o valor do parâmetro real da população. Eu posso aqui ficar gerando várias
e várias amostras, e vou verificar que isso vai
acontecendo sempre. Entretanto, veja: agora nós
tivemos uma amostra cujo intervalo de confiança não contém o valor real
do parâmetro populacional. Isto é uma exceção,
perto de tudo o que vimos aqui. Veja que em 95% das vezes os intervalos
de confiança contêm o parâmetro real. Outra coisa interessante para analisar é que,
se nós aumentarmos o tamanho da amostra, vamos encontrar intervalos de confiança
mais estreitos. Mas ainda assim, por causado nível de confiança de 95%, que foi usado para calcular
os intervalos de confiança aqui, quando nós vamos fazendo
várias amostras novamente, nós continuamos tendo, 95% das vezes, os intervalos de confiança contendo
o valor real do parâmetro. E evidentemente, em torno
de 5% das vezes, o parâmetro real não está
no intervalo de confiança. Até o próximo vídeo!