If you're seeing this message, it means we're having trouble loading external resources on our website.

Se você está atrás de um filtro da Web, certifique-se que os domínios *.kastatic.org e *.kasandbox.org estão desbloqueados.

Conteúdo principal

Intervalo de confiança para uma média com dados emparelhados

Intervalo de confiança para uma diferença de médias com dados emparelhados.

Quer participar da conversa?

Nenhuma postagem por enquanto.
Você entende inglês? Clique aqui para ver mais debates na versão em inglês do site da Khan Academy.

Transcrição de vídeo

RKA3JV - Um grupo de amigos quis saber o quão rápido eles poderiam estalar os dedos com uma mão em comparação com a outra mão. Cada pessoa estalou seus dedos com a mão dominante por 10 segundos e depois com a mão não dominante por 10 segundos também. Cada participante decidiu no cara ou coroa com uma moeda, qual mão usaria primeiro. Foram tabelados os dados para quantos estalos cada um deu com cada uma das mãos, a diferença entre essas quantidades e dados estatísticos. Crie e interprete um intervalo de confiança de 95% para a diferença entre as médias no número de estalos para estes participantes. Os dados aqui disponíveis, são dados reais de 5 pessoas integrantes da Khan Academy. Por isso, estes nomes em inglês. Observe que o cara ou coroa, para decidir qual mão o participante usaria primeiro, indica que há aleatoriedade na obtenção da amostra. Olhando para a tabela, então, vejamos aqui que o Jeff teve 44 estalos de dedos com a mão dominante. Então, se ele é destro, estamos falando da mão direita. E ele conseguiu nos 10 segundos, 35 estalos com a mão não dominante. E a diferença entre a quantidade de estalos com a mão dominante e não dominante é de 9, 44 - 35. Assim, esta tabela foi composta para os 5 membros. Foram calculados também alguns dados estatísticos para esta situação. E o dado mais interessante é este último aqui, a diferença entre os estalos com a mão dominante e com a mão não dominante. Nós pegamos aqui esta última linha da primeira tabela, calculamos a média e anotamos aqui, 6,8 estalos. Também foi calculado o desvio padrão destes dados. O resultado foi 1,64. E que nós queremos agora é criar e interpretar um intervalo de confiança de 95% para essa diferença nos números de estalos entre a mão dominante e a mão não dominante. Agora, é hora de pausar o vídeo e ver o que você consegue fazer para chegar à resposta do que está sendo perguntado aqui. Vamos lá! É importante observar que nós não estamos querendo criar um intervalo de confiança para a média do número de estalos da mão dominante ou para a mão não dominante. Nós estamos construindo um intervalo de confiança para a média das diferenças entre os estalos da mão dominante e da mão não dominante. E você pode dizer: espere um pouco, nós temos duas amostras diferentes aqui e esta terceira amostra é construída a partir das outras duas de alguma forma. Mas o que você precisa ter claro aqui é que nós estamos em uma situação envolvendo dados emparelhados. E neste estudo de dados emparelhados, para cada membro da sua amostra você fará o controle e o tratamento. Por exemplo, você poderia fazer o controle em quantos estalos a pessoa faz com a mão dominante em 10 segundos, e o tratamento em quantos estalos ela faz com a mão não dominante. No estudo de dados emparelhados você se preocupa com a diferença. E nós temos uma amostra de tamanho 5, com a média das diferenças de 6,8 e o desvio padrão 1,64. Isso envolve todos os dados. Agora, antes de calcular o intervalo de confiança, vamos nos lembrar de algumas condições sobre as quais precisamos pensar antes de considerar construir intervalos de confiança. Primeira condição, aleatoriedade. Será que a nossa amostra foi constituída de maneira aleatória? Neste caso, se estivermos querendo fazer algum julgamento sobre todos os seres humanos e sua habilidade em estalar os dedos, nós não estamos com uma amostra aleatória. Todos estes 5 elementos trabalham na Khan Academy. Não foram escolhidos aleatoriamente, a partir de toda a população humana. Mas, considerando este grupo de amigos, então, nós temos uma amostra que foi tomada aleatoriamente, considerando as quantidades de estalos que eles conseguiram dar. Agora, temos que pensar sobre a condição de normalidade. A nossa distribuição amostral é normal? Pode ser considerada aproximadamente normal? Temos algumas maneiras de verificar isso, uma delas é verificar se o tamanho da amostra é 30 ou maior. O teorema do limite central diria: ok, essa distribuição amostral é normal ou aproximadamente normal. Mas como o tamanho da nossa mostra aqui é menor, temos apenas 5 elementos, nós podemos analisar graficamente os dados e verificar se existe simetria em relação à média. Eu vou fazer isso por um diagrama de pontos aqui. 0, 1, 2, 3 até 9. Eu vou colocar aqui um ponto para 9, outro ponto para a diferença 5, um ponto para a diferença 8, outro ponto para a diferença 6 e mais um ponto aqui para a diferença 6. Sabemos que a nossa média das diferenças é 6,8 para a amostra. Ela está aqui e os pontos estão razoavelmente simétricos em relação a ela. Podemos considerar que a nossa distribuição amostral está próxima de ser normal, sim. Muito bem, a terceira condição que precisamos estudar é a condição de independência. Isso se traduz no fato, por exemplo, de que a diferença do Jeff não deve interferir na diferença da Kim e de nenhum outro integrante da amostra. Vamos admitir que as observações foram feitas em cômodos separados, um não estava vendo o outro e não havia nenhum tipo de interferência. Vamos então considerar a condição de independência atendida também. Vamos agora então escrever o nosso intervalo de confiança, que será, assim como estudamos em outros vídeos, a média amostral mais ou menos o valor crítico t*, vezes o desvio padrão da diferença que é o nosso dado amostral, sobre a raiz quadrada do número de elementos da amostra. Portanto, √5. Já sabemos que a média da diferença é 6,8 mais ou menos. Agora, precisamos saber qual é o nosso valor crítico para t*. Queremos 95% de nível de confiança. E o número de graus de liberdade é 5 - 1 = 4. Com essas informações, estamos prontos para usar a tabela "t". Aqui você tem um pedaço, um trecho da tabela "t". Podemos localizar aqui o nível de confiança 95%, e vamos lembrar que ele corresponde a deixar 5% para as caudas, porque de 95% até 100% são 5%. E 2,5% para cada cauda, à esquerda e à direita da curva normal. Enfim, nós estamos olhando para esta coluna aqui e só falta então usar a informação dos graus de liberdade para achar o valor crítico de "t" corretamente. Lembre-se de que a nossa amostra era de tamanho 5. Então, temos 5 - 1 = 4 graus de liberdade. Vamos aqui na linha do 4 graus de liberdade e achamos o valor crítico para t* de 2,776. Voltando, então temos aqui 2,776 como nosso valor crítico, vezes o desvio padrão amostral que nós temos aqui que vale 1,64, sobre √5. Agora, vamos usar uma calculadora para chegar à resposta final. Começando pela margem de erro 2,776 vezes 1,64/√5. O resultado é 2,036, é a nossa margem de erro. Seja o nosso intervalo de confiança de 6,8, mais ou menos 2,036. Vamos escrever os limites do intervalo de confiança. Portanto, 6,8 menos a margem de erro, que é 2,036 resulta em 4,764 e vai até 6,8 mais 2,036. É o limite superior do nosso intervalo de confiança, que é 8,836, este é o nosso intervalo de confiança. Falta agora interpretar este intervalo de confiança. E o que nós podemos dizer a respeito é que nós temos 95% de certeza que este intervalo de confiança contém a média real das diferenças para estes amigos. Agora, observe também que o número zero não está neste intervalo, ele vai de 4 e pouco até 8 e pouco. E isso significa que para este grupo de amigos é possível afirmar que eles estalam os dedos mais rapidamente com a mão dominante. Até o próximo vídeo!