Saiba o que é um outlier e como encontrar um!

O que são outliers em diagramas de dispersão?

Geralmente, diagramas de dispersão têm um padrão. Dizemos que um ponto é um outlier quando ele não se encaixa no padrão.
Considere o diagrama de dispersão acima, que mostra os dados de alunos que fizeram um mochilão. (Cada ponto representa um aluno).
Observe como dois dos pontos não se encaixam muito bem no padrão. Estes pontos foram chamados de Júlio e Sheila, que são os nomes dos alunos que eles representam.
Sheila poderia ser considerada uma outlier, porque ela está carregando uma mochila muito mais pesada do que o padrão prevê.
Júlio poderia ser considerado um outlier, porque ele está carregando uma mochila muito mais leve do que o padrão prevê.
Conceito-chave: não há nenhuma regra especial que nos diga se um ponto é, ou não é, um outlier em um diagrama de dispersão. Pode ser útil inventar uma definição precisa de "outlier" quando você estiver realizando estudos mais avançados de estatística, mas ainda não precisamos disso.

Resolução de problemas

Para entendermos completamente por que determinados pontos podem ser considerados outliers, vamos tentar resolver alguns problemas.

Problema 1: compra de computadores

Michele estava pesquisando diferentes computadores para comprar para a faculdade. Ela pesquisou preços e avaliações de qualidade de uma amostra de computadores. Os dados coletados por ela podem ser vistos no diagrama de dispersão à direita, no qual cada ponto representa um computador.

Problema 2: pontuações em exame

Alguns alunos do Ensino Médio dos EUA. fazem um exame chamado SAT antes de se candidatarem para faculdades. O diagrama de dispersão à direita mostra a porcentagem de formados prestes a entrar na faculdade de cada estado que fizeram o SAT em 2009-20102009\,\text{-}\,2010, juntamente com essa pontuação média do estado na seção de matemática.
Os três pontos rotulados poderiam ser considerados outliers.