Conteúdo principal
Estatística Avançada
Curso: Estatística Avançada > Unidade 5
Lição 1: Como representar a relação entre duas variáveis quantitativas- Construção de um diagrama de dispersão
- Como fazer diagramas de dispersão corretamente
- Exemplo de direção em diagramas de dispersão
- Associações lineares positivas e negativas a partir de diagramas de dispersão
- Descrição de tendências em diagramas de dispersão
- Linearidade, força e direção de uma relação bivariada
- Como descrever diagramas de dispersão (forma, direção, força, outliers)
- Descrição de diagramas de dispersão
- Agrupamentos em diagramas de dispersão
- Outliers em diagramas de dispersão
© 2023 Khan AcademyTermos de usoPolítica de privacidadeAviso de cookies
Linearidade, força e direção de uma relação bivariada
Descreva a linearidade, força e direção de uma relação bivariada.
Quer participar da conversa?
Nenhuma postagem por enquanto.
Transcrição de vídeo
RKA10MP – Neste vídeo,
vamos discutir a relação entre duas variáveis
em seis gráficos distintos. Vamos supor que a variável
do eixo "x" seja a idade e a variável do eixo "y"
seja a frequência de acidentes. Podemos interpretar este gráfico
da seguinte maneira, uma pessoa com 20 anos tem uma
alta probabilidade de ter um acidente, já que o número de acidentes
por centenas de pessoas nesta idade está neste ponto. Já pessoas com 21 anos de idade,
o número de acidentes reduz. Estamos tratando
de dados bivariados. Este é apenas um jeito chique de dizer
que você está plotando a relação entre duas variáveis com o objetivo de ver o padrão no qual
elas estão relacionadas. Então, fica a pergunta: como podemos
plotar uma linha linear ou não linear para representar a relação entre
as variáveis em diferentes eixos? Como posso dizer se esta
é uma relação forte ou fraca? E como vou avaliar se a relação
é positiva ou negativa? Vamos pensar em tudo isso
considerando os outliers. Vou plotar uma reta, e como vocês
podem perceber, existe um padrão. Um padrão quase
aproximado para baixo. Podemos ver que é uma relação linear. Esta reta não passa por cima
de todos os pontos, mas percebemos que os pontos
estão bem próximos à reta. Então, no caso destas duas variáveis
neste gráfico, podemos dizer que o padrão é linear. Além disso, dizemos que é negativo. Isso porque à medida que uma das
variáveis aumenta, a outra diminui. Podemos ainda dizer que esta
é uma relação forte, uma vez que os pontos não se encontram
muito distantes da reta. Mas e este gráfico?
Pause este vídeo e pense a respeito. Consideramos que esta é também uma
relação linear. Só que diferente do primeiro gráfico,
vemos uma relação linear positiva. Isso porque à medida que uma das variáveis
aumenta, a outra também aumenta. Dizemos também que esta
é uma relação fraca. Isso porque podemos perceber
vários pontos distantes da reta. Esses pontos são chamados de outliers.
E este terceiro gráfico? Neste terceiro gráfico, percebemos que
também trata-se de um padrão linear e positivo, à medida que uma das variáveis
aumenta, a outra também aumenta. E dizemos que aqui
há uma relação forte. Isso porque não percebemos
pontos muito distantes da reta. Todos eles estão praticamente alinhados
a esta reta. E este quarto gráfico? Pause o vídeo e pense
a respeito também. Neste quarto gráfico, vemos que a relação também é linear e positiva,
assim como os anteriores. No entanto, vemos uma relação fraca,
porque identificamos outliers. E este quinto gráfico?
O que podemos pensar a respeito dele? A primeira coisa que percebemos
é que se tentarmos traçar uma reta, esta reta não vai ser representativa, uma vez que a maior parte dos pontos
está agrupada nesta região. É uma relação não linear, porém, é muito
forte, pois percebemos aqui um padrão, já que percebemos que os pontos
estão bem aproximados da reta. E este último gráfico,
o que podemos dizer sobre ele? Temos uma relação linear.
Linear negativa. Isso porque à medida que uma das
variáveis aumenta, a outra diminui. No entanto, ela é razoavelmente forte. Isso por causa de dois outliers.
Neste vídeo, fiz retas aproximadas, mas existe uma forma
de calcular matematicamente que permite que esta reta
seja mais precisa. Além disso, eu gostaria de discutir que esta definição de forte e fraca
é subjetiva. É mais fácil a gente definir
se uma relação é forte ou fraca quando comparamos dois
conjuntos de dados distintos. Por exemplo, se comparássemos
o sexto gráfico com o terceiro, perceberíamos que o terceiro possui
uma relação mais forte entre os dados e a reta
do que o gráfico seis. Isso por causa da presença
destes dois outliers. No entanto, se compararmos o sexto
com o quarto, podemos dizer que o sexto
é razoavelmente mais forte. Ou seja, esse conceito de forte ou fraco vai depender de como a descrição
do seu estudo é feita.