Conteúdo principal
Estatística e probabilidade
Curso: Estatística e probabilidade > Unidade 10
Lição 3: Distribuição de amostragem de uma média amostral- Inferências sobre a média da população a partir da média amostral
- Teorema central do limite
- Distribuição da amostragem da média amostral
- Distribuição da amostragem da média amostral (parte 2)
- Erro padrão da média
- Exemplo: Probabilidade de média amostral que excede um valor
- Média e desvio-padrão de médias amostrais
- Médias amostrais e o teorema central do limite
- Como calcular probabilidades com médias amostrais
- Exemplo de distribuição de amostragem de uma média amostral
© 2023 Khan AcademyTermos de usoPolítica de privacidadeAviso de cookies
Teorema central do limite
Introdução ao teorema central do limite e à distribuição amostral da média. Versão original criada por Sal Khan.
Quer participar da conversa?
Nenhuma postagem por enquanto.
Transcrição de vídeo
[LEGENDA AUTOMÁTICA] nesse vídeo quero falar de algo que é
facilmente uma das coisas mais importantes e mais profundas de toda a
estatística e talvez de toda a matemática é o teorema do limite central
europeu uma do limite central o que ele nos diz é que nós podemos
a distribuição que tiveram uma média de uma variância bem definidas e é claro se
tiver uma variação bem definida vai ter também um desvio padrão bem definido e
essa distribuição ela pode ser contínua ou pode ser discreta também eu vou
desenhar aqui uma discreta apenas fica mais fácil não vai ser mais fácil aqui
para os propósitos deste vídeo então imagina aqui que eu tenho uma
distribuição de probabilidades discreta beleza
eu quero ser bem cauteloso para que isso não pareça com uma distribuição normal
pra você percebeu o poder do teorema do limite central vão dizer que eu tenha
valores de uma terceira estão lá num 123456 como se fosse um dado meio louco
aqui tá e ele é louco pelo seguinte é muito provável que nesse dado saia o
número um mas é improvável é impossível sem o número dois mas é razoavelmente
provável que saia o número 3 e número 4 beleza não vai ser por aqui assim vamos
dizer que é impossível que sai assim com esse dado e que é bem provável que saiam
6 ac assim inglesa então essa aqui é a minha função de
distribuição de probabilidades então aqui vamos dizer que a gente tenha
média por aqui assim ó a média vai estar bem no meio aqui vai ter a minha média
me beleza talvez o meu desvio-padrão esteja aqui ó
é prá cair prá cá em relação à média e essa aqui então a minha função de
distribuição de probabilidades que vou fazer aqui é o seguinte ao invés de
simplesmente pegar amostras dessa variável aleatória está descrita por
essa função eu vou fazer umas amostras mas eu irei
tomar a média das amostras então olhar para essas amostras e ver a
freqüência dos valores mais comuns que obtive e quando eu digo valores eu quero
dizer claro a média então vamos dizer aqui que o tamanho da
minha mostra um poderia pegar qualquer tamanho
vamos dizer que o tamanho da minha mostra o tamanho da amostra seja n igual a quatro então vou pegar
aqui quatro amostras meu tamanho amostral é igual a 4 beleza
então digamos que eu tenha essa mostra é tenha saído um depois um depois do 3d
pois os 6 então isso daqui vai ser a minha
primeira mostra desse tamanho mostrar o guará 4 beleza
eu sei que a tecnologia que pode confundir porque isso aqui é uma
amostragem foi produzida com quatro amostras mas quando nós falamos da média
mostrao ea distribuição nas médias amostrais
nós iremos ainda falar nos próximos vídeos normalmente a mostra se refere ao
conjunto de amostras de uma distribuição e o tamanho da amostra nos diz quantas
amostras você de fato pegou o lado da sua distribuição
mas a tecnologia pode ser bem confuso eu sei o que você pode facilmente ver uma
delas aqui ó uma mostra assim ou não você está
pegando aqui o quatro amostras nós temos um tamanho amostral aqui de 4
o que eu vou fazer aqui ó essas amostras eu vou tirar a média
delas portanto à média desse primeiro dessa primeira mostra aqui né
mas chegou a quanto um mais um é 22 mais 355 mais seis a 11 11 / 4 enquanto hora
11 / 4 2,75 então essa aqui é a minha primeira média
mostrar para minha primeira amostragem de tamanho quatro tranquilo
agora vou fazer uma segunda amostra digamos que nessa amostra dois aqui eu
tenha tirado um sei lá 13 depois de 314 depois um outro 3 e por fim um empate
que eu não tirei 6 dessa vez e repare também que nunca sai nenhum
2005 pois é impossível para distribuição via que determinei beleza a chance de
obter 1 215 aqui é zero então por isso que não posso ter dois
fica parecendo nunca aqui beleza então para essa segunda amostragem aqui de
tamanha mostrou igual a quatro a minha média mostrar o de terminar aqui
ó x 2 é igual a quanto é que eu vou ter o
seguinte então três mais 477 mais 13 10 10 mais um e 11 / 4 acabamos de calcular
2,75 vamos fazer aqui mais um
na verdade eu fazer um montão nós vamos fazer mais um aqui fazer mais um detalhe
então a minha amostra 3 de tamanho mostrar o a4
digamos que obtive os seguintes resultados 1º vamos dizer que eu tive
aqui um depois sei lá um de novo depois 16 depois 16
beleza então a minha terceira média mostrou
aqui é igual a quanto mais um guarda 26 mais seis é 12 então vai dar 14 14 / 2 1
+ 1 e 26 mas é 12 então aqui vai dar 14 14 / 4 é igual a três e meio 3,5 né
agora vou fazer o seguinte aqui tá pra cada amostra dessa aqui de tamanha
mostrar o a4 eu calculei a média e agora eu vou botar esses valores aqui numa
tabela de freqüência e tudo isso daqui vai te impressionar apenas em alguns
segundos olha só vou fazer isso aqui então a ser o seguinte aqui eu vou fazer
a plotagem desses valores então a minha primeira média mostrou que
foi 2,75 digamos que esteja por aqui assim a 2,75
eu vou fazer aqui então vai se colocar a freqüência com que essas médias aparecem
então a primeira vez ali que eu pulei 2,75 tudo isso aqui né
digamos que isso aqui é referente a essa média mostrou aqui beleza depois depois
calculei 2,75 de novo olha aí vamos colocar aqui assim ó poema aqui mais uma
vez 2,75 e depois eu tive um 3,5 então não está aqui esteja o 3
aqui o 3,25 aqui eu tenha um 3,5 então aqui eu vou ter aquela terceira média
beleza agora digamos que a gente siga calculando esses valores aqui até
digamos sei lá o a 10.000 beleza a mostra 10 mil
então com o passar do tempo é quando fizesse 10.000 ac
vou fazer aqui em forma de pontos só que eu tenho que dar na verdade o zoom out
aqui né vamos fazer aqui em baixo de forma de
ponto certo e aí com esse passado tempo que eu falei
digamos que o 2,75 esteja por aqui assim né
e aí esse primeiro ponto vai ser esse aqui esse segundo ponto ali que eu fiz
em azul vai estar por aqui assim né depois de 3,5 está por aqui né
só que como eu disse eu vou fazer isso daí com o passar do tempo então eu vou
apenas colocar aqui vários pontos está isso vai aparecer assim ó ele vai
perceber que quando eu pegar vários pontos aqui com o tamanho a mostrar o a4
isso vai se aproximar bastante de uma distribuição normal sim ou não
olha aí então cada um desses pontos aqui representa uma incidência dessa média
amostral e isso tudo aqui olha só esse não é algo fantástico está relacionado
ao teorema do limite central e aí ó esse caso aqui é para o caso onde o n é igual
a quatro tamanhos mostrar ou igual a 4 tranquila mas e se eu pegasse um n igual
a 20 o que será que vai acontecer ora em vez de quatro
estou considerando 20 elementos naquela amostra né
e aí eu vou tirar uma média dessas 20 amostras e aí após concluir essas médias
eu vou pilotar no gráfico exatamente como eu fiz anteriormente
e quando eu pilotar essas médias eu voltei algo assim ó olha aí o que vai
acontecer aqui então quando eu tomar o n igual a 20 é que eu vou ter ainda mesma
média é digamos que o médio esteja aqui assim é a média vai ser a mesma
só que a única coisa que vai mudar aqui é que o desvio padrão vai ser menor
é isso aí mas o que acontece então conforme você vai aumentando
há um número de elementos ali na mostra é que vai se aproximando cada vez mais
de uma distribuição normal beleza e o que é realmente legal aqui né
na no teorema do limite central é que quando o seu tamanho amostral tende ao infinito
você nem precisa chegar no infinito é claro que não quando você pega um
tamanho amostral relativamente grande você se aproxima bastante na
distribuição normal mesmo por exemplo se você tiver um tamanho mostrou de 10 hoje
30 você já vai estar chegando bem perto aí
na distribuição normal isso aí já é de fato uma aproximação
muito boa o que a gente percebe a nossa vida cotidiana mas o que é muito muito
muito legal é que nós podemos começar com uma distribuição qualquer um pode
ser uma distribuição bem louca como essa primeira aqui né
a primeira que nós fizemos a distribuição bem maluca isso aqui não
tem nada a ver com a distribuição normal mas se nós tivermos um tamanho mostrao
nesse caso aqui em igual a quatro mas se nós tivéssemos um tamanho mostrar
o seu ladinho igual a 10 ou igual a 100 e aí nós pegaremos 100 desses valores
aqui e calculamos a média ea gente vai lá naquele gráfico e pilota esses
valores lá na freqüência que eles aparecem depois eu pego um outro valor
com 100 amostras calcula média ou apronto valor da média que deu nem vou
fazendo isso várias vezes quando nos aproximamos lado infinito não é um valor
muito alto essas médias isso vai dar algo muito
próximo da distribuição normal principalmente se o tamanho amostral ele
foi um tamanho bem grande perto do infinito também né
e essa é a coisa louca sobre o teorema do limite central
isso não se aplica apenas a pegar a média mostrar o aqui nesse caso nós
pegamos a média mostrar mas não podemos pegar a soma amostral e com essa soma se
ao máximo esses valores aqui potássicos no gráfico o teorema do limite central
também seria válido seria aplicável né e é isso que o torna
super útil né porque na vida existe toda espécie de processos por exemplo
proteínas esbarrando nas outras pessoas fazendo coisas loucas seres humanos
interagir de maneira bizarra e você não sabe a função de distribuição da
probabilidade para nenhuma dessas coisas é ou não é
mas o teorema do limite central então nos diz é que se nós somarmos um bocado
dessas ações em conjunto assumindo que todas elas tenham a mesma distribuição
ou se nós tivemos que pegar a média de todas essas ações conjuntas e aí nós
portarmos essa freqüência dessas média mas iremos resultar em uma distribuição
normal e é isso que faz a distribuição normal nos dar tanta informação assim
olha aí nós temos que a distribuição normal é uma excelente aproximação é um
bocado de soma de várias coisas a lei isso aqui então é uma distribuição
normal a distribuição normal eu vou mostrar
agora nos próximos vídeos é que isso aqui é a realidade
ou seja se você aumentar o tamanho amostral
à medida que você aumenta o seu n você pega uma porção de médias amostrais
você irá ter um gráfico de frequências que se parece muito muito próximo na
distribuição normal portanto até os próximos vídeos