If you're seeing this message, it means we're having trouble loading external resources on our website.

Se você está atrás de um filtro da Web, certifique-se que os domínios *.kastatic.org e *.kasandbox.org estão desbloqueados.

Conteúdo principal

Condições para inferência em inclinação

Introdução às condições para se fazer um intervalo de confiança ou fazer um teste de uma inclinação com a regressão dos mínimos quadrados.

Quer participar da conversa?

Nenhuma postagem por enquanto.
Você entende inglês? Clique aqui para ver mais debates na versão em inglês do site da Khan Academy.

Transcrição de vídeo

RKA7MP - Olá, meu amigo ou minha amiga! Tudo bem com você? Seja muito bem-vindo ou bem-vinda a mais um vídeo da Khan Academy Brasil! Neste vídeo, vamos conversar sobre como podemos usar uma regressão linear, em particular, a inclinação de uma regressão linear com base em dados de uma amostra para fazer inferências sobre a inclinação da verdadeira linha de regressão da população. Neste vídeo, o que vamos pensar é sobre quais são as condições para inferência quando estamos lidando com linhas de regressão. De certa forma, isso vai ser parecido com as condições para inferência de que conversamos quando a gente estava fazendo o teste de hipótese em intervalos de confiança para médias e proporções. Mas, também, teremos algumas novas condições. Vamos começar a observar cada uma dessas condições aqui agora. A primeira é meio óbvia porque precisamos ter algo que seja quase linear. Então, temos que ter algo que seja linear porque estamos pensando em uma regressão linear. Essa condição diz para a gente que existe uma relação real na população entre as variáveis "x" e "y". Agora, em muitos casos, você pode apenas ter que assumir que essa condição vai ser atendida. Na verdade, em muitos momentos, você vai assumir que todas as condições serão atendidas, até porque, em muitas avaliações, só está sendo exigido que você saiba sobre essas condições. Mas isso é algo que podemos ver depois. Continuando aqui. Um detalhe sobre a relação linear é que se, de fato, não tiver uma relação linear, algumas das suas referências podem acabar não dando conta de todos os dados. Vamos para a próxima agora, que é algo que já vimos antes, é a condição de independência. Existem algumas formas diferentes de pensar sobre isso. Mas, de uma forma geral, podemos dizer que qualquer observação individual é independente uma da outra. Então, nesse caso, ou você está diante de uma amostra com reposição ou podemos usar a regra de 10%, aquela que fizemos quando pensamos sobre a condição de independência para proporções e médias, onde precisamos nos sentir confiantes de que o tamanho da amostra não é maior do que 10% do tamanho da população. Agora, a próxima é a condição normal de que também já falamos quando fizemos inferências para proporções e para médias, embora signifique algo um pouco mais sofisticado quando estamos lidando com uma regressão. Em diversos momentos, a gente também vai assumir que a condição normal foi atendida. Para compreender isso, vamos desenhar uma linha de regressão, mas vamos fazer isso com um pouco de perspectiva. Eu vou adicionar uma terceira dimensão. Digamos que este seja o eixo "x" e digamos que este seja o eixo "y". A verdadeira linha de regressão da população se parece com isto. A condição normal nos diz que para qualquer dado "x" na verdadeira população, você espera que a distribuição de "y" seja normal. Vamos tentar desenhar uma distribuição normal para os "y" de cada "x" dado. Isto aqui é uma distribuição normal. E aí, vamos dizer que, para esse "x" bem aqui, a gente também espera uma distribuição normal, mais ou menos assim. Então, se temos "x", a distribuição de "y" deve ser normal. Mais uma vez, muitas vezes você só vai assumir que isso é verdade, porque, pelo menos em uma aula introdutória de estatística, isso pode ser um pouco difícil de descobrir por conta própria. Agora, a próxima condição está relacionada a isso, a essa ideia de variância igual. Vamos escrever aqui, variância igual. E isso é apenas dizer que cada uma dessas distribuições normais deve ter a mesma variação para um determinado "x". Aí, você pode dizer que isso tem uma variância igual. Ou você pode até pensar sobre isso como sendo um desvio padrão igual. Por exemplo, se para um dado "x", digamos que para este "x", de repente, você tenha uma variância muito menor, mais ou menos assim. Você não atenderia suas condições para inferência. Por último, mas não menos importante, isso é algo que já vimos muitas vezes, é a condição aleatória. E isso diz que os dados vêm de uma amostra aleatória bem projetada ou algum tipo de experimento aleatório. E essa condição a gente tem visto em diversos momentos para inferir em tudo o que vimos até agora. Então, isso é mais tranquilo de compreender. Mais uma vez, é importante dizer que tudo isso aparece em diversas avaliações. Na maioria dos casos, as questões vão dizer que é para você assumir que as condições para inferência foram atendidas ou, ainda, perguntar a você quais são as condições de inferência. Mas essas questões não vão pedir que você faça uma demonstração dessas condições. Como, por exemplo, a condição normal ou a condição de variância igual. Afinal, isso pode ser um pouco demais para uma aula introdutória de estatística. Enfim, meu amigo ou minha amiga, espero que você tenha compreendido tudo direitinho o que conversamos até aqui. Mais uma vez, quero deixar para você um grande abraço e até a próxima!