Conteúdo principal
Curso: Estatística e probabilidade > Unidade 12
Lição 5: Mais vídeos sobre testes de significânciaTeste de hipóteses e valores P
Por meio de um exemplo de um neurologista que testa o efeito de uma droga, discutimos o teste de hipóteses e os valores-p. Versão original criada por Sal Khan.
Quer participar da conversa?
- 8:23- porque 3 desvios padrões tem probabilidade de 99,7%? eu entendi que é por regra empírica, mas como posso achar isso de uma outra forma? obrigada! adorei o video!(2 votos)
- O numero para se encontrar o Z não (média populacional menos a média amostral), ao contrário do que está no vídeo (6:20)?(1 voto)
- Porque o H0 é o da droga não ter efeito? Porque não ao contrário?(0 votos)
- Em geral o H0 e sempre uma não igualdade, e a alternativa uma igualdade(0 votos)
Transcrição de vídeo
[LEGENDA AUTOMÁTICA] o neurologista está testando o efeito de
uma nova droga no tempo de resposta injetando em 100 ratos uma dose da droga
sujeitando cada um a estímulos neurológicos e anotando o
tempo de resposta o neurologista sabe que a média do tempo
de resposta para os ratos não injetados com a droga é de 1,2 segundos
a média do tempo de resposta dos 100 ratos injetados é de 1,05 segundos um
desvio-padrão amostral de 0,5 segundos ontem que temos aqui dois informações
você acha que a droga tenha efeito no tempo de resposta fora pra fazer isso eu
vou analisar que duas hipóteses a primeira delas eu vou chamar de hipótese
nula e será a seguinte hipótese que o que a droga não terá efeito algum sobre
o tempo de resposta e essa hipótese nula sempre pode ser vista como um status quo
você assume que quer que sua pesquisa não tenha efeito então vou escrever aqui
ok droga não tem efeito droga não tem efeito beleza ou uma outra
maneira de pensar sobre isso é que a média de ratos que tomar a droga deve
ser a média será de quanto então a média aqui no caso vai continuar sendo de 1,2
segundos já que não têm efeito a droga então a média 1,2 segundos mesmo com a
droga mesmo com a droga e assim estou dizendo
que a droga não tem efeito algum porque eu sei que se eu não der a droga então
há um tempo de resposta em média é de 1,2 segundos
agora eu preciso de uma hipótese alternativa que a hipótese vai me dizer
sim a droga faz algum efeito daí que a minha hipótese alternativa
aqui chamado de h1n1 vou dizer que a droga faz efeito e uma
outra maneira de dizer isso é que a nossa média ela não vai ser igual mas
diferente de 1,2 segundos quando a droga quando a droga é nada certo então como nós pensamos
sobre isso como nós sabemos nós devemos aceitar a hipótese alternativa ou a
hipótese nula uma vez de aceitar a hipótese não estou dizendo que os dados
aqui não são convincentes e o que eu vou fazer aqui nesse vídeo na verdade é o
que é feito normalmente em toda a ciência
você diz o seguinte ok vamos assumir que essa hipótese no lac é verdadeira e se
essa hipótese no lac é verdadeira qual é a probabilidade de nós obteremos
esses resultados aí com a amostra e aí bem
se essa probabilidade for muito muito muito muito pequena então essa hipótese
no lac provavelmente não será verdadeira e aí nós provavelmente vamos rejeitar a
hipótese nula e vamos então meio que acreditar na hipótese alternativa então
vamos considerar daqui a considere a hipótese alternativa como verdadeira e
considerando a hipótese de uma verdadeira vamos calcular a
probabilidade desses resultados aqui serem obtidos
ou seja obter mos uma média mostrao de 1,05 segundos com um desvio padrão
amostral de 0,5 segundos na verdade eu não quero nem saber se
esses resultados aqui são verdadeiras quero saber se eu consigo até algo mais
extremo que isso então vou calcular a distribuição da hipótese nula então a
distribuição amostral aqui no caso da hipótese nula ser assim né será uma
distribuição normal nós temos um bom número de amostras
número de amostras aqui é de 100 e essa distribuição normal aqui ela tem
uma média disse nós estamos assumindo que a hipótese não é verdadeira a média
aqui ó a média será igual à média da população
1,2 e é claro esse 1,2 segundo a cni é igual à média daquela população original
lá de ratos é ou não é e agora qual vai ser o desvio padrão na
nossa distribuição mostrar ao ora o desvio padrão do nosso dança
distribuição mostrar vai ser igual desvio padrão da distribuição original
dividido pela raiz quadrada do nosso tamanho amostral
o nosso tamanho mostrou ali o nosso n ele é igual a quantas em né
só que nós não sabemos que é o desvio padrão daquela população inteira de
ratos portanto nós temos que fazer o que é uma
estimativa utilizando o nosso desvio-padrão
amostral isso é uma coisa boa de se fazer porque
nós temos até um número considerável de amostras aqui
o número de amostras é igual a 100 e logo por esse número já moisés e grande
isso daqui vai ser uma excelente aproximação por desvio padrão
então nós vamos dizer aqui o seguinte isso daqui será aproximadamente igual ao
nosso desvio-padrão mostrou dividido pela raiz quadrada de 100 então
substituir esses valores aqui né nós sabemos que o desvio padrão mostrou
é de 0,5 segundos eu vou dividir isso daqui pela raiz
quadrada de 100 que é igual a 10 enquanto é 0,5 / 10 hora o valor dessa
conta que vai me dar então o valor do desvio padrão da nossa distribuição
mostrou tão desvio padrão de distribuição a mostrar vou colocar aqui
um chapéu em cima dele né pois é o valor estimado é uma
aproximação isso será igual a 0,05 0,5 / 10
agora vamos pensar no seguinte qual é a probabilidade de obter 1,05 segundos ou
uma outra maneira de pensar isso daí é quanto os desvios padrões
a nossa média está de 1,05 segundos e então calcular qual é a probabilidade de
eu conseguir alguma coisa pelo menos com essa quantidade de desvios padrões da
média então vamos calcular quanto os desvios padrões isso daqui
a estada média basicamente é o que é o índice z é um é então vou fazer aqui uma
cor laranja a nossa estatística zena o índice z e para calcular essa
estatística fazer aquilo tem que fazer eu tenho que fazer o valor da média
ontem a média 1,2 né - esse valor r 1,051 certo quer calcular
quantos de jesus padrões isso daqui estada média então vou ter que dividir
tudo aqui pelo desvio padrão a mostrar o que nós calculamos aqui ó um é então
pude ver de tudo por 0,05 então de vídeo aqui por 0,05 nós vamos obter o
valor do índice z portanto esse índice zew aqui ó e será
igual a 1,2 - 1,05 vai me dar um exército de rua 15 né então 0,15 / 0,05
ora 0,15 / 0,05 é igual a 3 nosso índice zew então é igual a 3 agora
então vamos desenhar esses três desvios padrões à direita e à
esquerda da média formula ora aqui eu tenho um desvio-padrão à
direita da média dois desvios padrões à direita da média três desvios padrões de
vida da média à esquerda a mesma coisa que há um
desvio padrão esquerda da média 2 e 3 beleza e portanto esse resultado aqui ó
de 1,05 segundos ele vai dar o que a três desvios padrões
abaixo da média já que 1,05 o número é menor que o 1,2 já está por aqui é assim
né agora qual é a probabilidade de obter
esse valor aqui nesse extremo dadas essas condições quando eu falo em
extremos poderia ser um resultado inclusive menor que esse resultado de
1,05 no sentido negativo aqui ou até um resultado maior que três desvios padrões
acima da média essa área toda aqui e portanto para
calcular a probabilidade eu tenho que pensar nessa área aqui ó no sentido
negativo da nossa curva normal e também essa área no sentido positivo beleza nos
extremos aqui e agora qual é a probabilidade disso agora mas sabemos da
regra empírica que três desvios padrões nos dão uma probabilidade de 99,7 por
cento é ou não é o que isso significa hora vou colocar aqui de laranja ok essa
área que três desvios padrões à esquerda e à direita da média toda essa área
equivale a 99,7 por cento de probabilidade hora e se essa área
laranja que central equivale a 99,7 por cento isso quer dizer que essa área rosa
aqui e essa outra área rosa que combinadas quanto a 0,3
o centro sim ou não e se eu quiser escrever esse número aqui como um desse
mal isso seria 0,003 ou seja seria 0,003 da área total sob essa curva aqui
portanto respondendo à nossa pergunta aqui se eu assumir que essa droga que
não tem efeito algum a probabilidade de obter esses extremos
aqui na verdade até vou além desses extremos né é de 0,3 por cento e isso é
menos de 1 300 olha aí portanto se essa hipótese nula que fosse verdadeira
nós teríamos apenas uma em 300 chances de obter esse resultado resultado nesse
caso aqui ó esse extremo de 1,05 segundos é um é então pelo menos para o
meu ponto de vista esse resultado aqui de apenas 0,3 por cento parece favorecer
mais a hipótese alternativa tranquilo então o que eu vou fazer aqui eu vou
rejeitar essa hipótese no la ou rejeitá la pois eu tenho apenas uma chance em
300 de obter esse resultado aqui ó caso essa hipótese nula fosse verdadeira
então uma chance ínfima muito pequena por isso estou rejeitando a hipótese
nula beleza e apenas para te dar aqui uma idéia da nomenclatura das coisas as
terminologias e estatística esse valor aqui ó que me dá um resultado é menor ou
maior que esses extremos sim ou não daqui a hipótese nula é verdadeira um
nome disso aí é valor p ao inscrever-se daqui então né o nome
disso é o valor p que vem aí de probabilidade valor p e o valor p
nesse nosso exemplo aqui é quanto 0,3 por cento que é a mesma coisa que 0,003
então existe uma muito muito muito muito pequena a probabilidade de obter mas
esses resultados do enunciado dadá que a hipótese nula fosse verdadeira
portanto eu vou ter que rejeitar essa hipótese no lac e em geral as pessoas
define um limite para esse valor p o que isso quer dizer se nós tivermos um
valor pequeno menor que 5% quer dizer uma chance em 20 a r sim
e rejeita aquela hipótese nula então menos de 5% o limite e neste caso aqui
nós tivemos um número muito inferior a 5% é 0,05 e portanto isso aqui é um
grande indicador indicador muito forte pra gente que a hipótese nula não é
verdadeira então vou rejeitar lá e aí então eu vou ficar com a hipótese
alternativa que diz que a droga faz sim algum efeito até o próximo vídeo