Conteúdo principal
Estatística Avançada
Curso: Estatística Avançada > Unidade 4
Lição 4: Distribuições normais e a regra empíricaSentido qualitativo das distribuições normais
Discussão sobre o quão "normal" uma distribuição pode ser. Versão original criada por Sal Khan.
Quer participar da conversa?
- Esta distribuição normal parece se aplicar a muitas coisas na natureza e por sua generalidade mostra um pouco da beleza da matemática. Ouvi dizer que quem a mostrou foi o matemático Gauss: alguém sabe dizer como ele chegou ate ela?(5 votos)
- Em física estatística, acho que só no bacharelado se estuda isso, faz-se uma aproximação da função de probabilidade da distribuição binomial com o número de eventos indo para o infinito (se tornando grande) por meio da expansão de Taylor, que é uma ferramenta de cálculo muito usada em física, e assim se consegue a função da distribuição normal.
Aqui, no Khan, é só o básico. Em cursos superiores como Administração e Economia também não devem tratar disso... da demonstração. Apenas se aprende a usar, bem como a t de Student, que é importante para a área econômica.
Até o fim do ano quero revisar Introdução à Física Estatística, do Sílvio Salinas, que foi onde estudei essa aproximação pela primeira e única vez, por causa da iniciação científica que fiz, mas isso é para físicos... Alguém que faz ou fez graduação em estatística pode responder melhor!(6 votos)
Transcrição de vídeo
[LEGENDA AUTOMÁTICA] praticar a distribuição normal nunca é
demais pois ela tem várias aplicações na estatística e também na sua vida
cotidiana está bastante presente na sua vida eu fiz aqui nesse vídeo foi pegar
esse exemplo aqui que eu tirei do ck 12.1 org beleza que tem lá um livro de
código aberto sobre estatística e aí eu peguei esse problema aqui no
capítulo que trata especificamente da distribuição normal
se você quiser se pode lá para o site deles e pegar esses mesmos problemas
aqui só vai estar em inglês beleza então esse primeiro problema que é o
seguinte qual dos seguintes conjuntos de dados é mais provável de ser normalmente
distribuído para as outras opções explique por que você pensa que elas não
seguem a distribuição normal esse problema aqui não parece muito com
problemas de matemática ele é mais uma coisa tipo que você pensa
sobre isso então vamos ver as opções na letra e
falou o seguinte um palmo né medido da ponta do polegar até a ponta
do quinto dedo estendido de uma amostra aleatória de estudantes do ensino médio
então como fazer aqui você desenhar uma mão então desenhar uma mão aqui vai
ficar mais ou menos assim ó aqui eu tenho dedão eo dedo indicador
o dedo médio o dedo anelar e o dedo mínimo de dinheiro né
aí sabe aonde também estranha mas é o melhor exemplo posso fazer beleza
vamos lá eu acho que ele tá falando aqui sobre distância então ele fala da ponta
do polegar seria aqui né até a ponta do quinto dedo estendido
imagino que seja aqui o conta do dedinho na maneira chique de dizer verdinho
beleza então estão falando dessa distância aqui ó
certa ou seja se eu pegar uma amostra aleatória de estudantes do ensino médio
como isso aqui iria aparecer bom você sabe que essa distância aqui é uma
combinação de vários fatores entre eles fatores genéticos fatores ambientais
podem depender por exemplo de quanto leite você tomou quando era jovem
entre outras coisas né então imagino que essa distância que é uma soma de vários
processos aleatórios então eu diria que sim isso aqui é
normalmente distribuído eu acho que a minha mão ela não mudou
desde o ensino médio mas como eu toco violão então minha mãe um pouco
diferente sei lá da maioria das pessoas que estão
aqui apenas uma questão de achismo né então eu estou apenas dizendo que eu
acho sobre isso daqui é certa daí o seguinte com uma questão de
achismo vou colocar aqui claro o que eu acho sobre essa letra
lá eu acho que a média de uma mão é de mais ou menos será 8 polegadas beleza
daí eu imagino que o tamanho de uma mão seja distribuído dessa forma aqui ó
certo talvez não seja algo bem perfeitinho como a distribuição normal
mas se aproxima porém essa distribuição aqui ela não
pode ser perfeitamente normal concorda comigo ninguém tem uma mão como medida
negativa é um é se a medida for zero digamos aqui ó
isso quer dizer que a pessoa não tem mão sai beleza agora medida negativa ninguém
tem uma mão que mede menos oito polegadas
então vai ser uma distribuição perfeitamente normal e isso serve também
aqui por outro lado olha só ele pode ter uma mão tão gigante que extrapola e sei
lá digamos a estratosfera vai para o espaço sideral né
ninguém pode ter uma mão tão grande desse jeito não tem um limite superior
aqui também imagina você como um gigante que até
consiga tocar o sol karak ea de né então é o seguinte essa distribuição ela
não é perfeitamente normal mas se aproxima razoavelmente uma distribuição
normal não é digamos por exemplo quando eu jogava moeda várias vezes infinitas
vezes eu tenho sim uma chance digamos de sair um milhão de vezes consecutivas
cara por exemplo né existe essa chance mesmo que ela seja
ínfima mas ela existe agora não há no mundo entre os alunos do
ensino médio e imagina pelo menos que existe alguém com uma mão cujo palmo
meça uma milha por exemplo não existe né imagina alguém com a mão desse tamanho
agora no nosso mundo que a gente vive né isso aqui é uma boa aproximação para
distribuição normal ea distribuição normal mas sim modelar esse problema
aproximadamente como expliquei falou agora eu pensei também aqui de uma outra
maneira como está falando aqui estudante do ensino médio
imagino sei lá que seja falando de homens mas se vai falando de um homem de
mulher o seguinte eu teria aqui uma
distribuição bimodal é isso aí pois imagino eu sou homem né
imagino que os homens tenham à mão em média maior que das mulheres
então eu diria que essa distribuição aqui teria um pico na mão dos homens em
um outro pico aqui ó para muitas mulheres e ficaria mais ou menos dessa
forma aqui ó um é então é bem possível e seu trato de homem e de mulher eu tenha
essa distribuição bimodal aqui mas na minha humilde opinião imagina que essa
letra realmente tem uma aproximação com a distribuição binomial agora letra b
letra é o seguinte o salário anual de todos os empregados de uma companhia de
navegação aí é o seguinte eu estou falando de uma
companhia né a gente tem um limite para esse salário
né ninguém pode ganhar um salário digamos negativo
então a gente tem esse limite aqui e aí eu penso da seguinte maneira existe
nessa companhia vários empregados ea maioria deles é
claro ganha um salário baixo enquanto uma minoria ganha um salário bem alto
eu pensaria da seguinte maneira eu tenho vários empregados que ganham um salário
baixo e depois aqui vai diminuindo mas chega lá nos gerentes e administradores
de médio escalão e isso vai diminuindo diminuindo até que chega aqui um vão bem
grande até chegarmos se ou seria esse pedacinho
pequena aqui né eu imagino que esse salário aqui ó que a
maioria ganhe seja de sei lá de 40 mil reais por ano um salário bastante alto
para os padrões brasileiros né e aqui digamos pro gerentes aqui médios
dessa empresa eles ganham em 80 mil reais por ano
e finalmente digamos que esse salário daqui ó senhor da empresa seja de 200
mil reais a cada ano um salário razoável para um se ou de uma empresa ou pode até
acontecer aqui de não ser assim né já havia um gap bem maior aqui um vão
bem maior e lá embaixo tem um se ou sei lá ou alguns senhores que ganhe 5
milhões e 5 milhões por ano pode ser que aconteça também né então
essa distribuição aqui da letra b não é uma distribuição normal estão
reparando aqui que vai ter um pico bem aqui e um outro pico aqui embaixo
pequenininho sobre se os então é uma distribuição que eu diria bimodal também
mas aqui alguma a gente pode perceber tem esse limite então essa distribuição
normal não vai pra cá pra esquerda ela tem um limite
e aí eu chamaria isso aqui esse tipo de distribuição né
uma distribuição um enviado ao celular nem enviesada direito enviesada mottaki
direita enviesada agora vamos lá pra nossa
a ser o salário anual de uma amostra aleatória de 50 ceos de grandes empresas
sendo eles 25 mulheres e 25 homens e aí imagina quando ele coloca 25 mulheres e
25 homens ele está querendo dizer aqui da
discrepância que há entre o salário das mulheres e dos homens
infelizmente mulheres ganham menos que os homens ainda não foi consertado essa
aberração nossa sociedade é um é nesse caso aqui imagine o seguinte se ele não
colocasse o gênero a lina está colocando mulheres e homens não colocasse gênero
eu acho que seria da seguinte forma e ter um limite mínimo nem de salário
anunciou e aí depois essa curva que irá aumentar
depois de uma longa cauda aqui pra direita certo e aí seria mais ou menos
como a letra b é uma direita enviesada que denomina só que a gente está falando
de gênero é um é olha só então se está falando de gênero fazendo aquela letra
cena está falando de gênero provavelmente a 1 vão aqui entre homens
e mulheres então será algo bimodal o digamos assim
que sobe trocar coac para ficar mais fácil a visualização aqui sobe e desce
depois sobe de novo e aí tem a longa cauda para a direita e aí eu acho claro
é que essa longa cauda que tem pra direita
pode ser que lá embaixo vai ter saído até lá né
lá embaixo forme aquele pequeno monte aqui né disse os que ganham salários
astronômicos é um é mais para o nosso propósito o gráfico seria mais ou menos
assim então quando isso acontece não poderia
até dizer que essa distribuição é uma distribuição sei lá tribunal pois teria
esses picos sakineh e até agora pelo que nós fizemos aqui na letra a é aquela que
se aproxima mais de uma distribuição normal é a nossa melhor candidata mas
ainda falta a letra de a letra dia seguinte às datas de cem moedas de cinco
centavos retiradas de um caixa de uma loja de conveniência e o que eu penso
dessa questão aqui da letra de neve já que essa questão é uma questão de
achismo como falei no início né aqui na letra d é o seguinte o que eu
acho desde que esse achismo seja razoável né
não seja algo muito está por um lado eu diria que a maior parte das moedas que
circulam por aí são moedas relativamente novas pois elas são fabricadas
distribuídas no mercado as pessoas gastam enquanto as antigas vão sendo
retirados de circulação é um é muitas dessas moedas por exemplo são perdidas
ou então turistas levam embora do país né
então na minha opinião esse gráfico fica da seguinte maneira a maior parte das
moedas são moedas relativamente novas né e a gente tem que lembrar que o problema
está falando da data da moeda não da idade dessa moeda ou seja data que é que
está cunhada na moeda então digamos tenham a moeda saque de chela 2013
acreditar em 2014 né e aí como a gente tá em 2014
colocar aqui o ano 2014 eu acho que a maior parte das moedas que a gente vai
ter são moedas de 2013 é que vai ter um grande monte né
e depois isso vai reduzindo reduzindo reduzindo até uma data que sei lá não
exista mais moeda né com certeza um limite não acha que tem um limite
agora claro que tem imagina uma moeda que seja mais velha que o brasil por
exemplo a moeda claro brasileira não existe não pode haver a moeda mais
antiga que o próprio país então existe um limite mas você pode
falar hora têm moedas de outros países são bem antigas mas claro tem limite
também né houve uma época em que começaram a
fabricar moedas mas antes disso não havia moedas estão com certeza um limite
e neste caso aqui desse gráfico eu chamaria esse gráfico de esquerda
enviesada não há esquerda enviesada certo
acho que minha sala então quando você tem aquele amontoado de coisas do lado
direito ea cauda esse gráfico vai se estendendo para a
esquerda indefinidamente nesse caso aqui definidamente que tem um
limite eu poderia ter chamado também de negativamente negativamente enviesada
uma distribuição negativamente enviesada em para a esquerda aqui né
já essa daqui por exemplo a letra b seria uma distribuição positivamente
enviesada beleza agora nesse caso aqui houvesse esses
gráficos digamos que aqui seja a cena mediana no gráfico a média dele não vai
ficar aqui né a média é ficasse lá em algum lugar por
aqui assim certo da mesma forma nesse outro gráfico aqui
né o seu valor médio sei lá estaria por aqui assim mas a média como ela vem aqui
esse gráfico segue para a direita e tem até um outro pico aqui a média estaria à
direita esse valor mediano é que eu coloquei a
estadia por aqui assim então tá direita por isso também o chamei de direito
enviesada daí pela minha opinião a resposta que daria esse problema aqui né
seria realmente a letra a letra é aquela que se aproxima mais da distribuição
binomial não é isso até o próximo vídeo