Conteúdo principal
Estatística Avançada
Curso: Estatística Avançada > Unidade 4
Lição 4: Distribuições normais e a regra empíricaProblemas de distribuição normal: Regra empírica
A regra empírica (também chamada de regra "68-95-99,7") é uma diretriz de como os dados são distribuídos em uma distribuição normal.
A regra afirma que (aproximadamente):
- 68% dos dados estarão a um desvio-padrão da média.
- 95% dos dados estarão a dois desvios-padrão da média.
- 99,7% dos dados estarão a três desvios-padrão da média. Versão original criada por Sal Khan.
Quer participar da conversa?
- Por que regra empírica? Ela foi obtida experimentalmente? Quer dizer, conhecimento empírico é por meio da observação não é?!(5 votos)
- Boa pergunta.... que eu saiba tem que ter a função e fazer uma integração (cálculo integral) para se saber a probabilidade de algo estar entre x1 e x2, na distribuição... Eu pesquisei, e há autores que não chama isso de regra empírica.(4 votos)
Transcrição de vídeo
[LEGENDA AUTOMÁTICA] vamos fazer outro problema sobre
distribuição normal do ck 12.1 org estou fazendo isso mas esse problema é
que ele está aberto para quem quiser ver e eu acho esse livro aberto aqui muito
bom e os problemas são excelentes para a gente treinar
se você quiser que você pode até entrar nesse site e fazer o download do livro
só que ele está em inglês beleza da mulher
considere que a média de peso de meninas de 11 anos de idade nos estados unidos é
normalmente distribuída com uma média de cerca de 9,5 gramas e com um desvio
padrão de aproximadamente 1,1 gramas só tem um erro no enunciado é porque é
claro que a criança de 1 ano de idade não vai pesar 9,5 gramas né isso aqui é
quase nada imagina que seja quilogramas estão com certa aí tá quilogramas
então aqui a gente tem o seguinte que a média caiu a letra grega mina é igual a
9,5 quilogramas e o desvio padrão que a letra grega sigma é igual a 1,1 gramas
aí ele segue assim sem usar uma calculadora que a sem usar uma
calculadora estime a quantidade de meninas de 11 anos de idade nos estados
unidos que tenha as seguintes condições quando ele diz sem usar a calculadora
ele quer provavelmente a gente use a regra empírica esteve aqui é regra
empírica beleza e essa regra implica também é
conhecida como a regra 6895 99,7 olha aí então se você lembrar disso daqui você
vai lembrar da regra e aqui é o seguinte eu vou fazer uma pequena revisão antes
de atacar esse problema e está falando que a distribuição é normal então voltei
um gráfico mais ou menos assim né certo aqui a minha distribuição normal
é claro que eu não desviei perfeitamente dever é simétrico mas aqui ó
a média daqui a média mesa onde vai estar o mir aqui digamos que é um
desvio-padrão à direita da média portanto vai ser me mais o sigma e aqui
vai ser um desvio-padrão à esquerda da média então me - sigma e o valor dessa
área aqui ó compreende a média - um desvio padrão ea média mais um desvio
padrão como você pode imaginar é de 68 a probabilidade de cairmos nesse espaço
aqui é de 68% ou seja a gente tem aqui ó 68 por cento
de chance de cair nessa área que está um desvio-padrão à esquerda da média
desvio-padrão a mais que a média agora a gente andar mais um desvio
padrão tanto pela esquerda quanto para a direita
na média certo desvio padrão da esquerda para a direita
qual vai ser a probabilidade do valor que eu pegar estar nessa região aqui
hora como você pode imaginar esse valor vai ser de 95% aqui ó beleza e aí é
claro que esse 95% vão incluir essa área que central de 68% então 68% é um
sub-conjunto desse conjunto de 95% é um é digamos que eu vá ainda mais além o vá
mais um desvio padrão aqui pra esquerda e mais um desvio padrão para a direita
da média como você já deve imaginar essa área
aqui ó a probabilidade de o valor está dentro
dessa região vai ser de 99,7 por cento beleza então aqui a 99
a 7% de chance portanto aqui nós temos 99,7 por cento de chance de encontrar um
valor que esteja nessa área aqui três desvios padrões a mais ea menos que a
média tranquilo então é isso aqui que essa
regra empírica diz vamos ver se a gente consegue agora
aplicar a este problema ora primeiro então eu vou desenhar esse problema
fazer aqui o meu eixo melhor que eu puder aqui tomam livre e agora fazer a
minha curva glauciana melhor que eu puder eu tô aqui à mão livre né então né
melhor que eu pude fazer a mão livre vamos lá o que você deve saber aqui é
que essa curva é simétrica então esse lado aqui claro deveria ser igual a esse
mas é um desenho livre vamos continuar não só um computador não
aqui vai estar minha média certo é que vai ser move vírgula cinco
quilogramas não é que ele me diz aqui ó que a média e é o seguinte um
desvio-padrão à direita dessa média vai ser um figura um quilograma que na
verdade né em gramas também mas vamos considerar quilogramas beleza e aí
quando adicionar 1,1 a 9,5 botei o que eu voltei 10,6 quilogramas e aí olha só
desenhar que o pontilhado está por aqui assim e um desvio-padrão a menos que a
média é pra cá sim mas tá aonde ora esse ponto aqui vai ser o ponto 9,5
menos 1,1 isso vai dar então 8,4 agora se eu for
mais um desvio padrão aqui pra direita esse ponto aqui ó mas sei qual vai ser
10,6 mais um erro 11,7 e se eu for um terceiro ainda um terceiro desvio padrão
para a capa direito né esse ponto aqui vai ser o 12,81 é cada
desvio padrão é só somar 1,1 a mesma coisa aqui para a esquerda só que eu vou
subtrair né esse ponto aqui vai ser 8,4 menos 1,1
7,3 e esse ponto aqui ó que um desvio-padrão esquerda mas um desvio
padrão esquerda com seu terceiro aqui você 7,3 menos 1,1 6,2
então aqui está o nosso problema lado bonitinho com a nossa curva
glauciano agora é o seguinte qual vai ser a quantidade de meninas de 1 ano de
idade que tenha menos que 8,4 quilogramas
ora a probabilidade de encontrar uma menina nessas condições com menos 8,4
quilogramas mais e essa área aqui ó é ou não é esse aqui pois bem nós
sabemos qual é o valor dessa área aqui ó um desvio-padrão à esquerda e à direita
da média que é 68% é ou não é ora se a 15 68% nós sabemos que tanto
essa área que a esquerda quanto à direita
nessa parte central tem que ter 32% sim ou não mas é simétrico e aí falta 32%
para a gente chegar aos 100% é um é e aí eu sei o seguinte eu sei que essa área
aqui ó mas essa outra área aqui elas têm que
somar quanto horas tem que somar 32 por cento não é exatamente para atingir os
100% sem - 6832 beleza aí é o seguinte eu sei que a soma dessa
perna você chama de perna essa perna esquerda e essa perna direita aqui tem
que ser igual a 32 por cento e como ele não está dizendo aqui que essa
distribuição é normal então ambos os lados são perfeitamente simétricos logo
eles têm a mesma área sim ou não então essa área aqui ó é claro vai ser
igual a essa outra área aqui e ambas serão iguais a 16% em seu lado direito
aqui e 16% e esse outro lado aqui lado esquerdo 16% também então a
probabilidade de ter um resultado maior que um desvio padrão acima da média é de
16 por cento assim como a minha probabilidade de ter um resultado que
seja menor do que um desvio padrão abaixo da média é também de 16%
então como ele quer saber a quantidade de meninos de um ano que vai estar nessa
condição aqui de menos de 8,4 por cento não vou nem colocar quantidade não vamos
botar porcentagem a porcentagem essa porcentagem aqui vai
ser de 16 por cento certo para o que nós acabamos de ver agora é o seguinte na
letra b ele quer que a gente calcula a
porcentagem de meninas que estejam entre 7,3 quilogramas e 11,7 quilogramas
ora vamos voltar no gráfico e você vai ver que 7,3 quilograma está bem aqui ó
são dois desvios padrões menos que a média e 11,72 desvios padrões a mais que
a média aí então quem está falando é que ele quer um resultado que esteja entre
dois desvios padrões em relação à média já que 7,3 dos desvios padrões a menos
em 11,7 dos desvios padrões a mais ora isso há que sair de cara é ou não é
através da regra empírica olha só a regra implica nos diz que dois desvios
padrões se você olhar aqui porque nós deduzimos antes né
mas a 95% esse resultado dá entre 2 de junho os padrões para baixo ou para cima
né então resultado aqui 95% daí essa resposta da letra bené foi bem
rápida saiu através da regra empírica tranquilinho bem fácil agora letras e a
letra c é que a gente calcula a porcentagem de meninas de 11 anos
estados unidos que tenham mais do que 12,8 quilogramas e 12,8 quilogramas como
você pode perceber aqui são três desvios padrões o três desvios padrões acima da
média ele quer saber essa área que a direita né eu fiz aqui em laranja mas eu
vou fazer uma outra copa contra está fazendo um verde aqui
ele quer saber qual é essa área toda aqui essa longa perna pra cá né
e aí como essa probabilidade vamos retornar à nossa regra empírica
a gente teve esse valor ora nós sabemos o valor dessa área que ó entre três
giros padrões a menos na média e três desvios padrões acima da média mas
sabemos que essa área aqui ó toda ela é igual a quanto montar a nossa
regra empírica né essa área toda aqui mas é igual então a
99,7 por cento 99,7 por cento é ou não é daí se a gente sabe que essa área aqui
central é de 99,7 por cento o que nos sobra para essa perna aqui
e pra essa aqui elas só elas têm a mesma área né
é a mesma coisa da letra que a gente fez né
e aí vai sobrar o resto é de 99,7 por cento para dar 100%
esse resto aqui ó combinado esse mas esse aqui é de 0,3 por cento é um é como
a gente já sabe essas duas pernas aqui tanto à esquerda
quanto à direita são simétricas então elas têm a mesma medida vai ter a mesma
área então vai ser a metade de 0,3 por cento
beleza essa parte aqui vai ter 0,15 por cento
e essa outra parte aqui também 0,15 por cento
daí a probabilidade que encontra uma menina que tenha mais que 12,8
quilogramas que a mesma coisa que três desvios padrões é mais do que três
devido a desvios padrões acima da média vai ser igual a área sob essa curva que
essa área sim ou não enquanto média essa área 0,15
então 0,15 por cento eu espero que esse conhecimento eu
trouxe pra você tenha sido útil ea gente se vê no próximo vídeo