If you're seeing this message, it means we're having trouble loading external resources on our website.

Se você está atrás de um filtro da Web, certifique-se que os domínios *.kastatic.org e *.kasandbox.org estão desbloqueados.

Conteúdo principal

Teste de hipótese para a diferença de médias

Teste de hipótese para a diferença de médias. Versão original criada por Sal Khan.

Quer participar da conversa?

Nenhuma postagem por enquanto.
Você entende inglês? Clique aqui para ver mais debates na versão em inglês do site da Khan Academy.

Transcrição de vídeo

[LEGENDA AUTOMÁTICA] no último vídeo construir o intervalo de confiança de 95 por cento para perda de peso entre as pessoas do grupo 1 e do grupo 2 nesse vídeo aqui eu quero fazer um teste de hipóteses para saber exatamente se todos os estados nos fazem acreditar que a dieta de baixa gordura de fato faz alguma coisa se faz alguma diferença e pra isso eu vou escrever aqui a minha hipótese nula ea nossa hipótese nula aqui nesse caso é dizer que essa dieta que do grupo 1 não faz diferença alguma escrevendo matematicamente isso quer dizer que a média - a média dois é igual a zero tá certo então a perda e nem ganho de peso algum serviço entre o grupo faz a dieta o grupo que não faça dieta isso aqui é totalmente equivalente a dizer que a média da distribuição amostral do grupo 1 - a média a distribuição postal do grupo 2 que o grupo de controle é igual a zero também eu posso dizer isso aqui porque como a gente já vem vários outros vídeos a média de distribuição amostral é igual à média da população certo então posso dizer que isso aqui é igual a isso e isso aqui é igual a isso ou também não posso dizer que isso aqui é equivalente à média da distribuição das diferenças das nossas metas amostrais x 1 - 1 x 2 barra igual a zero nós vimos no último vídeo que está aqui equivalente a isso é ou não é essa coisa aqui ó é exatamente igual a isso aqui e essa é nossa hipótese nula então ea nossa hipótese alternativa que vou escrever bem aqui ó ela vai me afirmar o que vai fazer diferença assim está no grupo 1 ou no grupo 2 então é dizendo que faz algum efeito de fato posso dizer então que a média da população do grupo 1 - a média da população do grupo 2 tem que ser maior que zero certo que é esse pessoal do grupo 1 estaria perdendo peso e eu posso escrever isso aqui também de uma outra forma pode dizer que a média da distribuição amostral da população - a população dois né só aqui exatamente isso é maior que zero e claramente da cama distribuição une caudal e essas duas afirmações aqui são completamente equivalente pelo que escrevi aqui embaixo já expliquei certo para eu fazer um teste de hipótese primeiro tem que estabelecer aqui um nível de significância eu vou querer provar que a nossa hipótese nula é a verdadeira vamos ver se ele acontece de fato bem assumindo que essa hipótese não é verdadeira vamos calcular qual é a probabilidade desse valor aqui ser obtido e se essa probabilidade for menor que o limite que nós estabelecemos como um nível de significância daí nós vamos rejeitar a hipótese lula em favor da hipótese alternativa a hipótese alternativa será a verdadeira e esse nível de significância que muitas vezes chamada de alfa nós vamos estabelecer aqui nesse vídeo que o nosso alfa vai ser igual a 5% esse vai ser o nosso nível de significância beleza uma outra maneira de pensar sobre isso aqui é o seguinte eu não quero que tenha menos de 5% de chance de obter esse valor aqui você tivesse menos de 5% que é o meu limite que eu impus então eu vou rejeitar a hipótese nula então resumindo aqui falando novamente acabei de dizer se eu tiver menos de cinco por cento de probabilidade de obter esse valor aqui dado que a minha hipótese nula é verdadeira então aí sim vou rejeitar a hipótese nula e vou assumir a hipótese alternativa é a correta então vou fazer aqui um gráfico da distribuição dessa hipótese nula então eu tenho um gráfico certo o que ela diz é o seguinte que a média a diferença dessas metas aqui tem que ser igual a zero então isso aqui é igual a zero é uma distribuição normalizada daqui já que a média tem que ser igual a zero então eu quero saber aqui um valor de crítico para essa região aqui ó aqui eu vou ter um valor crítico mais difícil aqui na estatística é você falar as coisas corretamente né então quero um valor crítico aqui para o z naquela minha tabela z tal que a probabilidade de obter um valor aqui ó nessa região acima dessa região aqui no caso não seja de 5 por cento então aqui ó tem que ser 5% então preciso estabelecer qual é esse valor crítico e se esse valor crítica que foi maior do que eu quero ou seja tem uma probabilidade menor 5% acontecer só depois dessa região aqui então vou rejeitar essa hipótese nula e bem eu posso assumir essa distribuição é uma distribuição normal pois o nosso tamanho mostraram também mostrou bem grande diz mais de 30 pessoas são 100 aqui né então eu considero essa distribuição como sendo normal então se eu olhar aquela distribuição ali com uma distribuição normal normalizada deixou de fazer aqui de novo seu olhar com uma distribuição normalizada assim né eu quero saber o valor crítico aqui ó valor crítico para que essa região aqui tem apenas 5% de chance de acontecer um valor nessa região e como tudo isso aqui é acumulativo essa região toda aqui está em preto né é 95% então preciso olhar aqui na minha tabela z por 95% já que há uma distribuição única caudal né eu vou lá apenas para esses valores aqui a esquerda então 95% digamos esse valor a que chega mais perto certo aqui ó então esse valor crítico aqui determinando igual quanto a 1,65 olha aí então o nosso ver aqui é igual a 1,65 ou uma outra maneira de ver isso é que essa distância que o da média até esse valor até esse valor crítico é de 1,65 desvios padrões certo eu sei que eu escrevi isso aqui bem pequenininho mas é o desvio padrão dessa distribuição aqui tranquilo então qual é o desvio padrão dessa distribuição então o desvio padrão que nós vamos calcular agora neste exato momento ele vai ser igual o ataque ó desvio padrão dessa nossa diferença das médias amostrais daquela distribuição das diferenças - amostrais é igual a raiz quadrada da variância da nossa primeira população ali né como nós não sabemos se esses valores para colocar aqui na raiz quadrada nós vamos estimar então nós vamos estimar de acordo com ele disse o padrão aqui foi nos dado ó desvio padrão mostrar ao então a nossa melhor estimativa que no caso mas sei o que vai ser a variância mostrou que vai ser 4,67 ao quadrado esse valor aqui né o que é o desvio padrão a mostrar o primeiro grupo tudo isso dividido por 100 que é o nosso tamanho amostral mas a nossa melhor estimativa para a população 2 que vai ser o desvio padrão ao quadrado aqui no grupo 2 estão 4,04 elevada ao quadrado e eu vou dividir esta que também por cento a nossa mãe amostral agora para calcular isso daqui eu vou usar a calculadora e talvez até esteja lá já esse resultado pois eu usei isso no último vídeo né então vamos ver na calculadora ataque o resultado a 4,67 quadrado / 100 mas 4,04 quadrado / sem exatamente que nós queremos aqui e isso é igual a 0,6 17 aproximadamente ao escrever que o 0,6 17 e portanto essa distância aqui o da média até esse valor crítico vai ser um bingo 65 vezes 0,617 quanto vai ser isso então olha só a gente calcula usando a calculadora então vou querer saber quanto é esse valor aqui né 1,651 1,65 vezes 0,61 sete vezes a resposta anterior ali né isso é igual então a 1,02 aproximadamente então essa distância aqui né tá em laranja é 1,02 bem o que isso nos diz isso nos diz que apenas uma probabilidade de 5% que a nossa diferença das médias a mostrar que nós calculamos aqui que deu 1,91 há uma diferença há uma probabilidade de menos de 5% que essa diferença de maior que 1,02 olha aí e esse valor aqui de 1,91 e itapura que assim é maior que 10 2 então a probabilidade ainda menor que 5% ou seja a probabilidade de obter esse valor aqui assumindo considerando a hipótese não há como sendo verdadeira é menor do que cinco o cento tá claro pois ficou nessa região aqui ó beleza e como você percebe ao nosso nível de significância ele foi de 5% e esse valor aqui ó vai dar menos de 5% portanto como esse valor aqui vai ser menor que 5% menor que o nosso nível de significância certo e isso vai nos fazer rejeitar essa hipótese nua não vamos considerar como verdadeira pois deu errado aqui não não deu nesse intervalo de significância nesse nível de significância e aí eu vou favorecer a minha hipótese alternativa que sim entrar no grupo de dieta número 1 faz alguma diferença beleza até o próximo vídeo