If you're seeing this message, it means we're having trouble loading external resources on our website.

Se você está atrás de um filtro da Web, certifique-se que os domínios *.kastatic.org e *.kasandbox.org estão desbloqueados.

Conteúdo principal

Teste de hipóteses e valores P

Por meio de um exemplo de um neurologista que testa o efeito de uma droga, discutimos o teste de hipóteses e os valores-p. Versão original criada por Sal Khan.

Quer participar da conversa?

Você entende inglês? Clique aqui para ver mais debates na versão em inglês do site da Khan Academy.

Transcrição de vídeo

[LEGENDA AUTOMÁTICA] o neurologista está testando o efeito de uma nova droga no tempo de resposta injetando em 100 ratos uma dose da droga sujeitando cada um a estímulos neurológicos e anotando o tempo de resposta o neurologista sabe que a média do tempo de resposta para os ratos não injetados com a droga é de 1,2 segundos a média do tempo de resposta dos 100 ratos injetados é de 1,05 segundos um desvio-padrão amostral de 0,5 segundos ontem que temos aqui dois informações você acha que a droga tenha efeito no tempo de resposta fora pra fazer isso eu vou analisar que duas hipóteses a primeira delas eu vou chamar de hipótese nula e será a seguinte hipótese que o que a droga não terá efeito algum sobre o tempo de resposta e essa hipótese nula sempre pode ser vista como um status quo você assume que quer que sua pesquisa não tenha efeito então vou escrever aqui ok droga não tem efeito droga não tem efeito beleza ou uma outra maneira de pensar sobre isso é que a média de ratos que tomar a droga deve ser a média será de quanto então a média aqui no caso vai continuar sendo de 1,2 segundos já que não têm efeito a droga então a média 1,2 segundos mesmo com a droga mesmo com a droga e assim estou dizendo que a droga não tem efeito algum porque eu sei que se eu não der a droga então há um tempo de resposta em média é de 1,2 segundos agora eu preciso de uma hipótese alternativa que a hipótese vai me dizer sim a droga faz algum efeito daí que a minha hipótese alternativa aqui chamado de h1n1 vou dizer que a droga faz efeito e uma outra maneira de dizer isso é que a nossa média ela não vai ser igual mas diferente de 1,2 segundos quando a droga quando a droga é nada certo então como nós pensamos sobre isso como nós sabemos nós devemos aceitar a hipótese alternativa ou a hipótese nula uma vez de aceitar a hipótese não estou dizendo que os dados aqui não são convincentes e o que eu vou fazer aqui nesse vídeo na verdade é o que é feito normalmente em toda a ciência você diz o seguinte ok vamos assumir que essa hipótese no lac é verdadeira e se essa hipótese no lac é verdadeira qual é a probabilidade de nós obteremos esses resultados aí com a amostra e aí bem se essa probabilidade for muito muito muito muito pequena então essa hipótese no lac provavelmente não será verdadeira e aí nós provavelmente vamos rejeitar a hipótese nula e vamos então meio que acreditar na hipótese alternativa então vamos considerar daqui a considere a hipótese alternativa como verdadeira e considerando a hipótese de uma verdadeira vamos calcular a probabilidade desses resultados aqui serem obtidos ou seja obter mos uma média mostrao de 1,05 segundos com um desvio padrão amostral de 0,5 segundos na verdade eu não quero nem saber se esses resultados aqui são verdadeiras quero saber se eu consigo até algo mais extremo que isso então vou calcular a distribuição da hipótese nula então a distribuição amostral aqui no caso da hipótese nula ser assim né será uma distribuição normal nós temos um bom número de amostras número de amostras aqui é de 100 e essa distribuição normal aqui ela tem uma média disse nós estamos assumindo que a hipótese não é verdadeira a média aqui ó a média será igual à média da população 1,2 e é claro esse 1,2 segundo a cni é igual à média daquela população original lá de ratos é ou não é e agora qual vai ser o desvio padrão na nossa distribuição mostrar ao ora o desvio padrão do nosso dança distribuição mostrar vai ser igual desvio padrão da distribuição original dividido pela raiz quadrada do nosso tamanho amostral o nosso tamanho mostrou ali o nosso n ele é igual a quantas em né só que nós não sabemos que é o desvio padrão daquela população inteira de ratos portanto nós temos que fazer o que é uma estimativa utilizando o nosso desvio-padrão amostral isso é uma coisa boa de se fazer porque nós temos até um número considerável de amostras aqui o número de amostras é igual a 100 e logo por esse número já moisés e grande isso daqui vai ser uma excelente aproximação por desvio padrão então nós vamos dizer aqui o seguinte isso daqui será aproximadamente igual ao nosso desvio-padrão mostrou dividido pela raiz quadrada de 100 então substituir esses valores aqui né nós sabemos que o desvio padrão mostrou é de 0,5 segundos eu vou dividir isso daqui pela raiz quadrada de 100 que é igual a 10 enquanto é 0,5 / 10 hora o valor dessa conta que vai me dar então o valor do desvio padrão da nossa distribuição mostrou tão desvio padrão de distribuição a mostrar vou colocar aqui um chapéu em cima dele né pois é o valor estimado é uma aproximação isso será igual a 0,05 0,5 / 10 agora vamos pensar no seguinte qual é a probabilidade de obter 1,05 segundos ou uma outra maneira de pensar isso daí é quanto os desvios padrões a nossa média está de 1,05 segundos e então calcular qual é a probabilidade de eu conseguir alguma coisa pelo menos com essa quantidade de desvios padrões da média então vamos calcular quanto os desvios padrões isso daqui a estada média basicamente é o que é o índice z é um é então vou fazer aqui uma cor laranja a nossa estatística zena o índice z e para calcular essa estatística fazer aquilo tem que fazer eu tenho que fazer o valor da média ontem a média 1,2 né - esse valor r 1,051 certo quer calcular quantos de jesus padrões isso daqui estada média então vou ter que dividir tudo aqui pelo desvio padrão a mostrar o que nós calculamos aqui ó um é então pude ver de tudo por 0,05 então de vídeo aqui por 0,05 nós vamos obter o valor do índice z portanto esse índice zew aqui ó e será igual a 1,2 - 1,05 vai me dar um exército de rua 15 né então 0,15 / 0,05 ora 0,15 / 0,05 é igual a 3 nosso índice zew então é igual a 3 agora então vamos desenhar esses três desvios padrões à direita e à esquerda da média formula ora aqui eu tenho um desvio-padrão à direita da média dois desvios padrões à direita da média três desvios padrões de vida da média à esquerda a mesma coisa que há um desvio padrão esquerda da média 2 e 3 beleza e portanto esse resultado aqui ó de 1,05 segundos ele vai dar o que a três desvios padrões abaixo da média já que 1,05 o número é menor que o 1,2 já está por aqui é assim né agora qual é a probabilidade de obter esse valor aqui nesse extremo dadas essas condições quando eu falo em extremos poderia ser um resultado inclusive menor que esse resultado de 1,05 no sentido negativo aqui ou até um resultado maior que três desvios padrões acima da média essa área toda aqui e portanto para calcular a probabilidade eu tenho que pensar nessa área aqui ó no sentido negativo da nossa curva normal e também essa área no sentido positivo beleza nos extremos aqui e agora qual é a probabilidade disso agora mas sabemos da regra empírica que três desvios padrões nos dão uma probabilidade de 99,7 por cento é ou não é o que isso significa hora vou colocar aqui de laranja ok essa área que três desvios padrões à esquerda e à direita da média toda essa área equivale a 99,7 por cento de probabilidade hora e se essa área laranja que central equivale a 99,7 por cento isso quer dizer que essa área rosa aqui e essa outra área rosa que combinadas quanto a 0,3 o centro sim ou não e se eu quiser escrever esse número aqui como um desse mal isso seria 0,003 ou seja seria 0,003 da área total sob essa curva aqui portanto respondendo à nossa pergunta aqui se eu assumir que essa droga que não tem efeito algum a probabilidade de obter esses extremos aqui na verdade até vou além desses extremos né é de 0,3 por cento e isso é menos de 1 300 olha aí portanto se essa hipótese nula que fosse verdadeira nós teríamos apenas uma em 300 chances de obter esse resultado resultado nesse caso aqui ó esse extremo de 1,05 segundos é um é então pelo menos para o meu ponto de vista esse resultado aqui de apenas 0,3 por cento parece favorecer mais a hipótese alternativa tranquilo então o que eu vou fazer aqui eu vou rejeitar essa hipótese no la ou rejeitá la pois eu tenho apenas uma chance em 300 de obter esse resultado aqui ó caso essa hipótese nula fosse verdadeira então uma chance ínfima muito pequena por isso estou rejeitando a hipótese nula beleza e apenas para te dar aqui uma idéia da nomenclatura das coisas as terminologias e estatística esse valor aqui ó que me dá um resultado é menor ou maior que esses extremos sim ou não daqui a hipótese nula é verdadeira um nome disso aí é valor p ao inscrever-se daqui então né o nome disso é o valor p que vem aí de probabilidade valor p e o valor p nesse nosso exemplo aqui é quanto 0,3 por cento que é a mesma coisa que 0,003 então existe uma muito muito muito muito pequena a probabilidade de obter mas esses resultados do enunciado dadá que a hipótese nula fosse verdadeira portanto eu vou ter que rejeitar essa hipótese no lac e em geral as pessoas define um limite para esse valor p o que isso quer dizer se nós tivermos um valor pequeno menor que 5% quer dizer uma chance em 20 a r sim e rejeita aquela hipótese nula então menos de 5% o limite e neste caso aqui nós tivemos um número muito inferior a 5% é 0,05 e portanto isso aqui é um grande indicador indicador muito forte pra gente que a hipótese nula não é verdadeira então vou rejeitar lá e aí então eu vou ficar com a hipótese alternativa que diz que a droga faz sim algum efeito até o próximo vídeo