If you're seeing this message, it means we're having trouble loading external resources on our website.

Se você está atrás de um filtro da Web, certifique-se que os domínios *.kastatic.org e *.kasandbox.org estão desbloqueados.

Conteúdo principal
Tempo atual:0:00Duração total:7:12

Introdução à inferência sobre inclinação em regressão linear

Transcrição de vídeo

o Olá meu amigo minha amiga tudo bem com você seja muito bem-vindo ou bem-vinda a mais um vídeo daquela Academy Brasil e nesse vídeo vamos conversar sobre linhas de regressão mas não vai ser a primeira vez que estamos conversando sobre isso sendo assim se a ideia de uma regressão é estranha para você eu aconselho que voce assistir alguns vídeos introdutórios sobre isso afinal é que nesse vídeo Vamos pensar sobre como podemos fazer inferências de uma linha de regressão Além disso se a ideia de inferência estatística nova para você e esse a ideia de teste de hipótese também é mais uma vez assista esses vídeos também agora para começar vamos dizer que suspeitamos que existe uma associação positiva entre o tamanho do sapato e altura sendo assim o que podemos fazer aqui é colocar um eixo de coordenadas e aqui no eixo horizontal no eixo X colocar o tamanho dos Sapatos colocamos os eu também vou colocar aqui um dois três quatro cinco seis sete oito nove dez onze doze e pode continuar subindo a partir daí um detalhe eu não vou definir unidade de medida agora não principalmente porque esse exemplo é para você ter uma ideia sobre linhas de regressão mas esses números podem representar o número dos Sapatos ou tamanho em centímetros Ok bem isso não importa muito agora agora aqui no eixo vertical no eixo Y podemos colocar a altura então isso aqui é a altura agora eu vou colocar valores aqui também que podemos estar medindo em centímetros em metros ou até mesmo em decímetros isso também não importa muito aqui agora nós temos aqui um dois três quatro cinco seis sete acho que tá bom até aqui aí Digamos que você pega uma amostra aleatória de 20 pessoas da população é bem vídeos futuros vamos falar sobre as condições necessárias para fazer inferências apropriadas Então vamos representar aqui essas 20 pessoas através de 20 pontos de dados podemos ter aqui uma criança pequena e aqui um adulto crescido com pés maiores e que é mais alto aí vamos colocar o restante três quatro cinco seis sete oito nove dez 11 12 13 14 15 16 17 18 19 e 20 e pronto temos esses 20 pontos de dados o que provavelmente você vai fazer agora é inserir esses dados em um computador você pode fazer isso manualmente mas agora temos computador para fazer isso por nós e o computador pode tentar realizar um ajuste através de uma linha de regressão existem muitas técnicas para fazer isso mas uma técnica tive Quer tentar Minimizar de uma forma geral A distância é quadrada Entre esses pontos e açaí Oi e essa linha de regressão terá uma equação como qualquer linha teria e tendemos a mostrar isso colocando aqui Y chapéu esse chapéu nos diz que essa é uma linha de regressão é igual a interceptação em y e representamos com a letra A mas a inclinação vezes a nossa variável x a não posso deixar de falar que se você pegar outra mostra você pode obter resultados diferentes aqui é por isso que nós vamos chamar isso aqui dy-1 para nossa primeira amostra A1 B1 e aqui vamos colocar um também e se a gente pegasse agora outra amostra de 20 pessoas bem vamos fazer isso aqui agora Talvez você tenha um aqui dois aqui três quatro cinco seis sete oito nove dez 11 12 13 14 15 16 17 18 19 20 e aí a gente pode tentar encaixar uma linha e essa linha vai ser mais ou menos assim pode ter uma interceptação com o y é um pouco diferente uma inclinação ligeiramente diferente também podemos representar aqui também através de uma equação então a gente coloca aqui Y2 ou Y chapéu dois na verdade isso é igual a A2 + B2 XX e assim cada vez que você pega uma mostra é provável que você obtenha resultados diferentes para esses valores que são essencialmente estatísticos lembre-se as estatísticas são coisas que nós podemos obter de amostras estamos tentando estimar verdadeiros parâmetros populacionais bem então quais serão os verdadeiros parâmetros populacionais que estamos tentando estimar imagina o mundo bem aqui e que você é capaz de descobrir a verdadeira relação linear ou talvez haja algum relacionamento linear verdadeiro entre altura e o tamanho do sapato você poderia conseguir se Teoricamente você a cada ser humano no planeta e Dependendo do que você definir como uma população podem ser testadas todas as pessoas vivas ou todas as pessoas que viveram isso não é prático mas vamos apenas dizer que você é realmente poderia fazer isso você teria bilhões de pontos de dados aqui para a verdadeira população assim se você encaixar ser uma linha de regressão é que preciso dados a gente poderia ver isso como a verdadeira linha de regressão da população então isso seria Y chapéu que é igual a para deixar claro que aqui a interceptação y e a inclinação dos verdadeiros parâmetros populacionais em vez de utilizar o a Vamos colocar o alfa e ao invés de utilizar o bebê Vamos colocar o Beta e eu sou vezes x mas é muito difícil chegar Exatamente é o que o alfa e o Beto ação e é por isso que nós chamamos eles com as e com um mês com base em uma amostra agora o que é com isso em mente é que podemos começar a fazer inferências baseadas em nossa mostra então sabemos que por exemplo é improvável que bebê do e seja exatamente Beta mas como confiante os podemos ser de que haja pelo menos uma relação linear positiva ou uma relação linear diferente de zero ou pelo menos podemos criar um intervalo de confiança em torno dessa estatística para ter um bom senso de qual é o verdadeiro parâmetro também a Resposta simples sim a forma que você pode fazer uma inferência por exemplo para a inclinação da sua linha de regressão para verdadeira população é através de uma mostra eu tenho essa inclinação bem aqui para essa mostra Então vou chamar isso aqui db2 e eu poderia criar um intervalo de confiança em torno disso e então esse intervalo de confiança vai ser baseado em alguns valores críticos de idealmente O desvio padrão da distribuição de amostragem sua estatística de amostra nesse caso a nação da linha de regressão da mostra mas como não sabemos exatamente o que é isso não podemos descobrir como precisão desvio padrão sendo assim como fazemos isso a partir de uma amostra vamos estimar o que a conhecido como o erro-padrão da estatística e vamos nos aprofundar um pouco mais nesse assunto em vídeos futuros e já que estamos estimando aqui vamos usar um valor até crítico aqui que Já estudamos antes e aí Com base no seu nível de confiança que você deseja ter Digamos que a noventa e cinco porcento com base nos graus de liberdade que vai sair de muitos pontos de dados que temos aí nós poderemos descobrir isso e de nossa amostra podemos descobrir isso e podemos descobrir isso aí Teremos como construir um intervalo de confiança também veremos que você poderia fazer o teste de hipótese aqui você poderia dizer Ei vamos definir uma hipótese nula uma hipótese zero e a hipótese nula Vai dizer que não existe uma de sinear aqui entre essas duas coisas ou que a inclinação da linha de regressão da verdadeira a população é igual a zero aí também a gente vai ter a hipótese alternativa Ou seja que é verdade que a relação entre as duas grandezas é maior que zero que há uma relação linear positiva O que é apenas diferente de zero aí o que você poderia fazer é assumindo isso você poderia ver qual é a probabilidade de obter uma estatística com pelo menos esse extremo ou mais extremo se você estiver abaixo de algum limite você pode rejeitar a hipótese nula E aí sugerir a alternativa então isso isso são coisas que fizemos Antes quando a gente tava criando o intervalo de confiança em torno de uma estatística ou fazendo testes de hipótese supondo que um parâmetro era verdadeiro A única diferença aqui é que esse parâmetro que estamos tentando estimar vai ser uns parâmetros para uma teórica linha de regressão populacional e vamos fazer isso usando estatística de amostra para uma a direção de amostra eu quero você tenha compreendido tudo direitinho que a gente conversou aqui e mais uma vez eu quero deixar para você um grande abraço e até a próxima
AP® é uma marca comercial registrada da College Board, que não revisou este recurso.