If you're seeing this message, it means we're having trouble loading external resources on our website.

Se você está atrás de um filtro da Web, certifique-se que os domínios *.kastatic.org e *.kasandbox.org estão desbloqueados.

Conteúdo principal
Tempo atual:0:00Duração total:12:22

Transcrição de vídeo

o que vamos fazer neste vídeo é calcular manualmente o coeficiente de correlação para pilotar dados bem variados quando eu digo dados bem variados é um jeito chique de dizer que um valor x tem um correspondente y em um determinado ponto mas antes de calcular o coeficiente de correlação vamos entender alguns dados estatísticos que eles deram para nós nós estamos assumindo que essas são amostras de uma população em que um valor x corresponde ao valor y então nós temos a média de x nós temos o desvio padrão de x o cálculo da média consiste em somar os valores de x e dividir pelo número de amostras então um mais dois mais dois mais 3 / 4 então esse valor é igual a 8 / 4 que é igual a 2 o desvio padrão de xis como nós vimos anteriormente pode ser calculado da seguinte maneira vai ser igual a escuadra da de cada valor de x - a média é elevada ao quadrado então isso vai ser 1 - 2 elevada ao quadrado mas 2 - 2 elevada ao quadrado mas 2 - 2 elevada ao quadrado mais 3 - 2 elevada ao quadrado tudo isso sobre o número de amostras menos um que é igual a 3 então podemos simplificar facilmente essa expressão isso daqui é zero isso aqui é zero e isto é um isto é um então vai ser a raiz quadrada de 2 sobre três que é igual a zero ponto 86 aproximadamente é claro a média de y é a mesma coisa que fizemos com a média de x então vai ser um mais dois mais três mais 6 / 4 então vai ser 12 / 4 que vai ser igual a 3 eo desvio padrão de y você vai calcular da mesma maneira que nós calculamos o desvio padrão de x e vai ser aproximadamente 2.160 compreendido tudo isso vamos agora pensar como que o coeficiente de correlação é calculado então nós temos aqui a fórmula que representa o coeficiente com relação à primeira vista ela pode ser um pouco intimidador até que você percebe algumas coisas percebemos que tudo isso corresponde ao que nós chamamos de escores e para x para esse xis específico tudo isso representa os cortes e de y esse y específico então nós temos que dizer é igual ao valor de x - a média sobre o desvio padrão de x então esse é o scorsese para esse dado x e estes 14 para o y correspondente então como exige o padrão desse ponto x para média no mundo real você não terá apenas quatro pares de amostras com isso será muito difícil fazer esse cálculo a mão mas geralmente utilizamos ferramentas de software de computador para fazer isso mas é muito válido fazer isso manualmente para entender de forma intuitiva o que está acontecendo aqui nesse caso particular r vai ser igual a 1 sobre o número de pares - 1 o que vai ser um sobre três vezes isso vai ser o somatório dos produtos dos escores z então usei escolhe para 1 vai ser 1 - 2 que é a média de x dividido pelo desvio padrão de x que é 0.8 16 vezes 1 e agora vamos fazer o scorsese de y 1 - a média que a 3 sobre o desvio padrão de y que é 2.160 nós vamos continuar fazendo isso então o próximo vai ser 2 - 2 sobre 8.16 e é daqui que esse dois vem e eu estou subtraindo ele pela média e dividindo pelo desvio padrão vezes 2 e agora nós estamos olhando para esse 2 - 3 sobre 2.160 mas 2 - 2 sobre 8.16 vezes 3 - 3 sobre 2.160 mais o último parque a 3 - 2 sobre 8.16 vezes 6 -3 sobre 2.116 antes de pegar a calculadora vamos ver o que dá para simplificar 2 - 2 é igual a zero a zero sobre oito pontos 1 600 vezes esse valor 02 - 20 a 0 3 -3 0 a 0 então podemos simplificar esses os valores um menos dois é igual a menos um em 1 - 3 é igual a menos dois então r vai ser um sobre três vezes - com menos é mais então vai ser 2 sobre 0.8 16 vezes 2.160 mas três - dois é igual a 1 e 6 -3 é igual a 3 então isso vai ser igual a 3 sobre 0.8 16 vezes 2.160 tudo isso tem o mesmo denominador então nós podemos simplesmente somar os números a dores então 2 sobre essa coisa mais três sobre essa coisa vai ser 5 dessa coisa então vai ser 5 sobre 0.8 16 vezes 2160 então agora podemos utilizar a calculadora para saber o resultado disso então vai ser um sobre três vezes 5 sobre 0.8 16 vezes 2.160 então eu vou fechar esse parênteses e vamos ver quanto vai dar 10.945 o que é aproximadamente 0.9 46 então r é aproximadamente 0.9 46 o coeficiente de correlação é a medida de quanto uma linha pode descrever a relação entre valores x e valorize y&r sempre será maior ou igual a menos 11 ou menor ou igual a 1 se é igual a um significa que a linha descreve completamente a relação entre os valores x e y e que essa linha é crescente se o r é que vale completamente a menos 1 significa que a linha descreve completamente os dados x e y e nós vamos ter uma linha decrescente sierra é igual a zero significa que a linha não descreve em nada a relação entre os valores x e y em nossa situação aqui o valor já é próximo de 1 o que significa que a nossa linha está bem próxima de descrever a relação entre os nossos xvii e os nossos y por exemplo eu vou tentar desenhar uma reta aqui e essa reta tem que passar no ponto que é a média de xis ea média de y o que significa que esse ponto aqui onde y e 3 x 2 não me parece que essa é uma bolinha então deixou desenhar sobre ela e você percebe que essa linha não é perfeita mas ela é bem próxima de cada ponto ela permite que você compreenda o que está acontecendo por trás o meu próximo foco será na compreensão do que está acontecendo aqui bem o que está acontecendo com escores de e como esses cortes vezes nos ajudam a compreender essa propriedade de que quando r está próximo de 1 nós temos uma correlação positiva uma correlação forte positiva e quando ela está próxima de -1 nós temos uma correlação forte negativa bom vamos desenhar o que a média significa que então a média de x é 2 ea média de y e 3 e esta é a linha que é igual a 3 então agora nós podemos desenhar o desvio padrão o desvio padrão de x vai ser zero com 816 isso significa que se eu for 0.8 16 a menos de 2 eu vou encontrar o primeiro ponto de desvio padrão e se eu for mais de 0.8 16 de 2 eu vou encontrar o outro ponto de desvio padrão então nós vamos fazer o mesmo com o desvio padrão de y é 2.160 2.160 é mais ou menos por aqui e - 2.160 em relação à média de y é mais ou menos aqui então vamos desenhar então vamos desenhar outro transcerrado então por exemplo vamos nesse primeiro para o que nós temos que fazer quanto esse ponto desvia da média então isso vai ser negativo vai ser - um sobre 0.8 16 e é por isso que nós calculamos isso e quanto do desvio padrão da média esse ponto estada média de x enquanto esse ponto está desviado da média de y c - 2 sobre 2.160 por isso esse valor observe que ambos são negativos dessa forma ambos contribuíram para um valor positivo que nos auxiliou chegar a um valor próximo de um se ambos score z forem negativos significa que existe uma correlação positiva entre as variáveis significa que eles são abaixo da média mas que esse valor é parecido então vamos para o próximo ponto 2 e 2 o que aconteceu aqui a orientação x é o mesmo valor que a média então isso se tornou zero significa que o ponto está no ponto zero de x em função dos quase 60 todo esse cálculo foi igual a zero e isso fez com que esse ponto ficasse um pouco distante do nosso coeficiente de correlação razão desse ponto está afastado e não ser negativo é porque ele não está contribuindo para soma mas ele está dividindo o nosso maior valor por ser incluso como um par extra se nós tivéssemos um ponto no qual o valor de x inferior à média de x o valor de y fosse superior à média de y se isso fosse um dos pontos porque o score sergipe não seria positivo o squash seria negativo e quando nós colocássemos isso na soma em seria afastar nosso valor r de 1 isso faria com que nós coeficiente r fosse menor algo parecido com isso aconteceria se nós quiséssemos fazer um valor de r ainda menor porque nós temos um escort ser positivo para x em um escort ser negativo para y yo produto de positivo com o negativo seria negativo
AP® é uma marca comercial registrada da College Board, que não revisou este recurso.