Conteúdo principal
Estatística Avançada
Curso: Estatística Avançada > Unidade 5
Lição 1: Como representar a relação entre duas variáveis quantitativas- Construção de um diagrama de dispersão
- Como fazer diagramas de dispersão corretamente
- Exemplo de direção em diagramas de dispersão
- Associações lineares positivas e negativas a partir de diagramas de dispersão
- Descrição de tendências em diagramas de dispersão
- Linearidade, força e direção de uma relação bivariada
- Como descrever diagramas de dispersão (forma, direção, força, outliers)
- Descrição de diagramas de dispersão
- Agrupamentos em diagramas de dispersão
- Outliers em diagramas de dispersão
© 2023 Khan AcademyTermos de usoPolítica de privacidadeAviso de cookies
Agrupamentos em diagramas de dispersão
Saiba o que é um agrupamento em um diagrama de dispersão!
O que são agrupamentos em diagramas de dispersão?
Às vezes, os pontos em um diagrama de dispersão formam grupos distintos. Estes grupos são chamados de agrupamentos.
Considere o diagrama de dispersão acima, que mostra informações nutricionais sobre 16 marcas de salsichas em 1986. (Cada ponto representa uma marca). Os pontos formam dois agrupamentos, um à esquerda e outro à direita.
O agrupamento à esquerda é o de marcas que tendem a ter start color #1fab54, start text, b, a, i, x, a, s, space, q, u, a, n, t, i, d, a, d, e, s, space, d, e, space, c, a, l, o, r, i, a, s, space, e, space, d, e, space, s, o, with, \', on top, d, i, o, end text, end color #1fab54.
O agrupamento à direita é o de marcas que tendem a ter start color #11accd, start text, g, r, a, n, d, e, s, space, q, u, a, n, t, i, d, a, d, e, s, space, d, e, space, c, a, l, o, r, i, a, s, space, e, space, d, e, space, s, o, with, \', on top, d, i, o, end text, end color #11accd.
Resolução de problemas
Para entendermos melhor o conceito de agrupamentos, vamos tentar resolver alguns problemas.
Problema 1: peixes machos e fêmeas
Os Lamprologus callipterus (um tipo de peixe) machos adultos são muito maiores que seus exemplares homólogos fêmeas. Eles pesam cerca de 13 vezes mais. Outra característica é que, enquanto as fêmeas atingem 6 centímetros de comprimento, os machos atingem 15 centímetros de comprimento.
Problema 2: pontuações no exame SAT
Alguns alunos do Ensino Médio dos EUA. fazem um exame chamado SAT antes de se candidatarem para faculdades. O diagrama de dispersão abaixo mostra a porcentagem de formados prestes a entrar na faculdade de cada estado que fizeram o SAT em 2009, start text, negative, end text, 2010, juntamente com essa pontuação média do estado na seção de matemática.
Há um agrupamento de estados com start color #1fab54, start text, m, e, n, o, r, space, p, a, r, t, i, c, i, p, a, ç, a, with, \~, on top, o, end text, end color #1fab54 e um agrupamento de estados com start color #11accd, start text, m, a, i, o, r, space, p, a, r, t, i, c, i, p, a, ç, a, with, \~, on top, o, end text, end color #11accd.
Por que há agrupamentos nos dados?
Pode ser difícil explicar por que há agrupamentos em um conjunto de dados específico. Esse artigo apresentou três conjuntos de dados, cada um deles com dados do mundo real. Apenas no conjunto de dados dos peixes havia uma nítida explicação por detrás dos agrupamentos.
Se você tem uma teoria que explique os agrupamentos em qualquer um dos outros conjuntos de dados, compartilhe suas ideias nos comentários abaixo.
Quer participar da conversa?
- Eu diria que o agrupamento é a reunião de dados que se comportam de uma mesma forma, ou seja, os dados que apresentam um certo padrão de comportamento tendem a ficar próximos e formar grupos e área em comum.
O exemplo do peixe tonar isso bem simples:
Com apenas os dados da altura e peso dos peixes machos, teríamos um simples gráfico de dispersão, sem a caracterização de um agrupamento.
Mas, quando incluímos no gráfico os dados de altura e peso dos peixes fêmeas, percebemos que as informações sobre os peixes fêmeas e sobre os peixes machos ficam separados entre si.
A explicação para isso é simples.
As alturas e o peso dos peixes machos ficam próximos um dos outros, porque mostra um padrão de comportamento biológico e genético dos machos, ou seja, um peixinho macho recém nascido sabe que sua altura e peso quando ficar adulto tende a ficar próximo da área limitada pela altura e peso dos outros machos. O peso e altura de um peixinho fêmea também ficará aproximo a altura e peso dos outros peixes fêmeas. Tudo por causa do seu sistema biológico.
Olha o exemplo do exame SAT.
Imagina que os estados com menor participação no exame, tem a missão de preparar com mais intensidade os alunos. Logo, cobra-se e incentiva-os a obter resultados cada vez mais satisfatórios.
Sendo assim, o numero de participantes no exame SAT é reduzido, pois o ensino é bem aplicado e difícil e boa parte dos alunos não passa para realizar a avaliação.
Os estados com maior participação, pode não ter uma seleção ou um filtro de aprovação mais rigorosa, ou até eficiente, o que explica a maior participação nos exames.
Essa possível "falha", na 'aprovação' dos alunos, para fazer o exame pode permitir que alunos desmotivados, "não motivados corretamente" e despreparados façam o exame, o que não dá bons resultados.
Sendo assim os dados representados no gráfico, pode mostrar justamente a relação de intensidade de preparo e incentivo dos alunos em relação aos estados.
Ou seja, os estados cujo preparo é aplicado e o incentivo é elevado, embora possuam menor participação, possuem maior desempenho.
Logo, supondo que os estados com participação inferior a 35% tendem a ter um maior desempenho. E outros estados com maior participação, um desempenho bem inferior.
Pode não ser padrão, mas há uma certa tendência.
Seguindo...
Podemos supor que os estados do norte, por terem maior participação, tem menor desempenho. E os dos Sul, por terem menor participação tem maior desempenho.
O agrupamento de dados é a união de dados que possuem certa semelhança entre si, e uma tendência particular. Como se cada dado obedece-se um certo padrão.
Basta identificar a característica principal dos dados e formular um padrão entre eles.
ex: o grupo de peso e altura mais elevados, é de característica dos machos --> Grupo dos peixes machos.
o Grupo dos estados que menos participam, são os que mais cobram dos alunos --> Grupo dos estados com maior desempenho.
Minha opinião. Ficarei feliz se me contestarem, mas triste se me ofenderem. :)(10 votos) - Na questão das pontuações de exames SAT:
um dos estados prepara melhor seus alunos para tal, tanto que aplica provas simuladas regulares, como método de preparação. Desta forma, os alunos com maiores notas sentem-se estimulados a realizar os exames e estudam pontos de deficiência, enquanto os com notas medianas ou inferiores sentem-se desestimulados. Já o outro estado não aplica provas simuladas regulares, logo os alunos não sabem como focar seus estudos e os com notas muito baixas não tem a noção do quão mal podem ir na prova, prestando exame assim mesmo.(1 voto)