If you're seeing this message, it means we're having trouble loading external resources on our website.

Se você está atrás de um filtro da Web, certifique-se que os domínios *.kastatic.org e *.kasandbox.org estão desbloqueados.

Conteúdo principal

Como usar um valor-p para tirar conclusões em um teste sobre inclinação

Tire conclusões em um teste de hipóteses sobre a inclinação de uma reta de regressão de mínimos quadrados.

Quer participar da conversa?

Nenhuma postagem por enquanto.
Você entende inglês? Clique aqui para ver mais debates na versão em inglês do site da Khan Academy.

Transcrição de vídeo

RKA3JV - Olá, meu amigo ou minha amiga! Tudo bem com você? Seja muito bem-vindo ou bem-vinda a mais um vídeo da Khan Academy Brasil. Nesta aula, vamos resolver um problema sobre como usar o valor "p" para determinar conclusões em um teste sobre inclinação da linha de regressão. E este exercício diz o seguinte: Ana pegou uma amostra aleatória de telefones celulares e encontrou uma relação linear positiva entre as velocidades do processador e os seus preços. Aqui está a saída do computador de análise de regressão de mínimos quadrados de sua amostra. Então, só para deixar claro o que está acontecendo, ela pegou uma amostra de telefones. A questão não está dizendo exatamente quantos, mas ela pegou os vários telefones. E aí, ela encontrou uma relação linear entre a velocidade do processador e o preço do telefone. Então, este é o preço e esta é a velocidade do processador. Aí ela traçou aqui sua amostra. Para cada telefone, nós teríamos um ponto de dado. E, então, você vê isto aqui. Ela colocou todos estes pontos de dados em seu computador e foi capaz de fazer uma linha de regressão como esta aqui para amostra dela. Para essa linha de regressão da amostra, podemos descrevê-la da seguinte forma, y^ = a + b vezes x. Para amostra, "a" será 127,092. Então, é isto aqui. Já a inclinação da linha de regressão vai ser o coeficiente de velocidade. Outra maneira de pensar sobre isso é que essa variável "x" é a velocidade, então, o coeficiente é a inclinação. Mas temos que nos lembrar que essas são estimativas de talvez alguma verdade, verdadeira, no universo. Se ela pudesse experimentar todos os telefones do mercado, ela então obteria os verdadeiros parâmetros populacionais. Só que isto é uma amostra, é apenas uma estimativa. E só porque ela vê essa relação linear positiva em sua amostra, não significa necessariamente que o isto é o caso para toda a população. Então, ela precisa provar que de fato existe uma relação linear positiva. E é por isso que ela está fazendo um teste de hipóteses. Em um teste de hipóteses, você assume que não há um relacionamento entre a velocidade do processador e o preço. Beta (ß), bem aqui, é o verdadeiro parâmetro de população para regressão na população. Então, se esta é a população bem aqui, e se de alguma forma onde o preço está aqui no eixo vertical e a velocidade do processador está aqui no eixo horizontal. E, se você pudesse olhar em toda a população, bem, eu não sei quantos telefones existem, mas pode ser bilhões de telefones. E aí, a gente colocaria tudo isso aqui. Depois, a gente pode fazer uma linha de regressão. Então, em nossa hipótese nula, teremos que a inclinação da linha de regressão será zero. Portanto, a linha de regressão pode se parecer com algo assim, onde a equação da linha de regressão para a população é esta aqui y^ = α + β vezes x. Em nossa hipótese nula, β é igual a zero. E a hipótese alternativa que é suspeita dela é onde temos a verdadeira inclinação da linha de regressão, sendo realmente maior que zero. Continuando aqui, suponha que todas as condições para as inferências foram atendidas. Em um nível de significância α = 0,01, há evidências suficientes para concluir uma relação linear positiva entre estas variáveis para todos os telefones celulares? Por quê? Então, pause este vídeo e veja se você consegue responder isto. Bem, para fazer esta tarefa de hipótese temos que pensar o seguinte: assumindo a hipótese nula como verdadeira, ou seja, supondo que a inclinação real da linha de regressão populacional é igual a zero, qual é a probabilidade de obtermos este resultado bem aqui? O que podemos fazer é usar estas informações e nossa estimativa da distribuição de amostra da inclinação da linha de regressão da amostra para chegar a uma estatística "P". E para esta outra situação, onde a nossa hipótese alternativa diz que a nossa verdadeira inclinação da linha de regressão populacional é maior do que zero, o nosso valor "p" pode ser visto como uma probabilidade de encontrar uma estatística "t" maior ou igual a isso. Portanto, obter uma estatística "t" maior ou igual a 2,999. Agora, você pode estar tentando dizer: ei, olha, existe esta coluna que nos dá um valor "p", talvez já tenha sido descoberto que esta probabilidade é 0,004. Bem, temos que tomar muito cuidado aqui, porque o que está sendo dado aqui é um valor "p" bilateral. Ou seja, se você pensar em uma distribuição "t" para certos graus de liberdade, poderíamos fazer a seguinte pergunta: qual é a probabilidade de obter um resultado onde o valor absoluto é 2,999 ou maior? Bem, se "t" é igual a zero bem aqui no meio, e isso é 2,999, nós vamos nos preocupar com essa região. Nos preocupamos aqui com esta cauda direita. E este valor "p" que está aqui não está apenas nos dando a cauda direita, mas também está dizendo: bem, que tal conseguir algo menor ou igual a -2,999? Então, isto aqui está nos dando estas duas áreas. Sendo assim, se você quer o valor "p" para este cenário, nós apenas olhamos para isso. E como você pode ver, porque essa distribuição é simétrica, a distribuição "t" vai ser simétrica. E aí, você pega a metade disso. Então, isso vai ser igual a 0,002. E aí, o que você faria em qualquer teste de significância é comparar seu valor "p" ao nível de significância. Olhando aqui para este 0,002 e comparando com este 0,01, qual destes é a maior? Bem, inicialmente, os seus olhos podem dizer: opa, o 2 é maior do que 1. Mas isto é 2 milésimos e isto aqui é 1 centésimo. Aqui nós temos 10 milésimos. Portanto, nesta situação, nosso valor "p" é menor que o nosso nível de significância. E aí, podemos dizer o seguinte: a probabilidade de obter um resultado neste extremo ou mais extremo é tão baixa se assumirmos a nossa hipótese nula, que nessa situação nós iremos rejeitá-la. Vamos decidir rejeitar a nossa hipótese nula e isso sugeriria a alternativa. Sendo assim, existe evidências suficientes para concluir uma relação linear positiva entre estas variáveis para todos os telefones celulares? Sim. Por quê? Porque o valor "p" é menor do que o nosso nível de significância. E aí, rejeitamos a nossa hipótese nula. O que sugere a nossa hipótese alternativa. Enfim, meu amigo ou minha amiga, eu espero que você tenha compreendido tudo direitinho o que conversamos até aqui. E, mais uma vez, eu quero deixar para você um grande abraço e até a próxima!