If you're seeing this message, it means we're having trouble loading external resources on our website.

Se você está atrás de um filtro da Web, certifique-se que os domínios *.kastatic.org e *.kasandbox.org estão desbloqueados.

Conteúdo principal

Exemplo: comparação de distribuições

Compare distribuições usando as características de forma, centro, dispersão e outliers.

Transcrição de vídeo

RKA4JL - E aí, pessoal, tudo bem? Para isso, nós temos dois gráficos que mostram as temperaturas em duas cidades diferentes. ficou 12 dias entre 4 e 7° C, e assim por diante. Aqui nós temos a distribuição para Mineápolis. e também devemos focar na propagação, que é mais conhecida como variabilidade, Então comparar as duas distribuições significa comparar essas duas coisas. O que vamos fazer aqui é tentar comparar essas duas distribuições sem utilizar o valor de uma medida de tendência central, ou seja, sem utilizar o valor da média, da mediana ou coisa do tipo. Basicamente vamos achar uma resposta aproximada, ou seja, não necessariamente precisamos utilizar cálculos como a mediana, quando olhamos para o centro ou o desvio padrão quando olhamos para a variabilidade para fazer essa comparação. Olhando para os dois gráficos qual delas tem um centro superior? está aqui nesse intervalo entre cinco e sete, mais ou menos e na distribuição de Mineápolis você pode ver que o centro está mais ou menos entre -3° C e 0° C, mais ou menos nesse intervalo. E quanto à propagação, à variabilidade? Se você comparar as duas, qual tem o maior alcance, maior propagação? Se olhar para Portland, você pode ver que não tem nada abaixo do 0° C aqui e a temperatura também não passa dos 13° C. Isso significa que você tem um intervalo de 13° C, no máximo. Esse valor pode, por exemplo, ser distribuído todo na primeira coluna, no máximo até 3,9° C, quem sabe um monte de 3° C, ou quem sabe você queira distribuir todos esses dados para a última coluna, pode ser um monte de 3,1°, mas no máximo você tem que ter a diferença de 12° C nesse intervalo. Agora, se olhar para Mineápolis, você pode ver que essa distribuição de dados é mais ampla se você comparar com Portland. Com isso, você pode dizer que Mineápolis tem mais variabilidade, tem uma propagação maior. Temos o seguinte: nos Jogos Oímpicos, muitos eventos têm várias rodadas de competição. Um desses eventos é o nado de costas de 100 metros masculino. O gráfico de pontos superior mostra os tempos em segundos dos oito primeiros colocados na rodada final das Olimpíadas de 2012, O gráfico de pontos inferior mostra os tempos dos mesmos oito nadadores, mas na semifinal, ou seja, aqui está a rodada semifinal. Se você chutar mais ou menos vamos ter um, dois, três, quatro, cinco, seis, sete, oito pontos, então a mediana vai estar mais ou menos aqui, ou seja, entre os inferiores a 4 e os superiores a 4. Parece que é 57,1 segundos mais ou menos. Agora, para rodada semifinal, nós temos um, dois, três, quatro, cinco, seis, sete, oito pontos também o que nos diz, intuitivamente, que a rodada semifinal tem uma tendência central maior, o que vai contra o intuitivo, porque é comum você pensar que os atletas da final foram mais rápidos, mas não é isso que os dados mostram. Então a rodada semifinal tem o maior centro. E claro, eu fiz isso só imaginando mais ou menos a mediana. E quanto à variabilidade, o que podemos dizer? Novamente vamos olhar para o alcance, a propagação, porque as distribuições estão na mesma escala. enquanto a semifinal só tem esse alcance de dados. E, de novo, você fez isso só olhando para o gráfico das distribuições. Por exemplo, você poderia ter dois pontos distantes e ter também vários pontos concentrados em uma distribuição como essa. e em uma distribuição como essa aqui você pode ter uma propagação menor, mas terá um desvio padrão maior. O que eu quero dizer com isso é que pode ter vezes em que você não terá esse tipo de caso no qual você pode responder somente olhando e comparando os gráficos, Eu espero que essa aula tenha lhes ajudado. Até a próxima, pessoal!