If you're seeing this message, it means we're having trouble loading external resources on our website.

Se você está atrás de um filtro da Web, certifique-se que os domínios *.kastatic.org e *.kasandbox.org estão desbloqueados.

Conteúdo principal

Teorema central do limite

Introdução ao teorema central do limite e à distribuição amostral da média. Versão original criada por Sal Khan.

Quer participar da conversa?

Nenhuma postagem por enquanto.
Você entende inglês? Clique aqui para ver mais debates na versão em inglês do site da Khan Academy.

Transcrição de vídeo

[LEGENDA AUTOMÁTICA] nesse vídeo quero falar de algo que é facilmente uma das coisas mais importantes e mais profundas de toda a estatística e talvez de toda a matemática é o teorema do limite central europeu uma do limite central o que ele nos diz é que nós podemos a distribuição que tiveram uma média de uma variância bem definidas e é claro se tiver uma variação bem definida vai ter também um desvio padrão bem definido e essa distribuição ela pode ser contínua ou pode ser discreta também eu vou desenhar aqui uma discreta apenas fica mais fácil não vai ser mais fácil aqui para os propósitos deste vídeo então imagina aqui que eu tenho uma distribuição de probabilidades discreta beleza eu quero ser bem cauteloso para que isso não pareça com uma distribuição normal pra você percebeu o poder do teorema do limite central vão dizer que eu tenha valores de uma terceira estão lá num 123456 como se fosse um dado meio louco aqui tá e ele é louco pelo seguinte é muito provável que nesse dado saia o número um mas é improvável é impossível sem o número dois mas é razoavelmente provável que saia o número 3 e número 4 beleza não vai ser por aqui assim vamos dizer que é impossível que sai assim com esse dado e que é bem provável que saiam 6 ac assim inglesa então essa aqui é a minha função de distribuição de probabilidades então aqui vamos dizer que a gente tenha média por aqui assim ó a média vai estar bem no meio aqui vai ter a minha média me beleza talvez o meu desvio-padrão esteja aqui ó é prá cair prá cá em relação à média e essa aqui então a minha função de distribuição de probabilidades que vou fazer aqui é o seguinte ao invés de simplesmente pegar amostras dessa variável aleatória está descrita por essa função eu vou fazer umas amostras mas eu irei tomar a média das amostras então olhar para essas amostras e ver a freqüência dos valores mais comuns que obtive e quando eu digo valores eu quero dizer claro a média então vamos dizer aqui que o tamanho da minha mostra um poderia pegar qualquer tamanho vamos dizer que o tamanho da minha mostra o tamanho da amostra seja n igual a quatro então vou pegar aqui quatro amostras meu tamanho amostral é igual a 4 beleza então digamos que eu tenha essa mostra é tenha saído um depois um depois do 3d pois os 6 então isso daqui vai ser a minha primeira mostra desse tamanho mostrar o guará 4 beleza eu sei que a tecnologia que pode confundir porque isso aqui é uma amostragem foi produzida com quatro amostras mas quando nós falamos da média mostrao ea distribuição nas médias amostrais nós iremos ainda falar nos próximos vídeos normalmente a mostra se refere ao conjunto de amostras de uma distribuição e o tamanho da amostra nos diz quantas amostras você de fato pegou o lado da sua distribuição mas a tecnologia pode ser bem confuso eu sei o que você pode facilmente ver uma delas aqui ó uma mostra assim ou não você está pegando aqui o quatro amostras nós temos um tamanho amostral aqui de 4 o que eu vou fazer aqui ó essas amostras eu vou tirar a média delas portanto à média desse primeiro dessa primeira mostra aqui né mas chegou a quanto um mais um é 22 mais 355 mais seis a 11 11 / 4 enquanto hora 11 / 4 2,75 então essa aqui é a minha primeira média mostrar para minha primeira amostragem de tamanho quatro tranquilo agora vou fazer uma segunda amostra digamos que nessa amostra dois aqui eu tenha tirado um sei lá 13 depois de 314 depois um outro 3 e por fim um empate que eu não tirei 6 dessa vez e repare também que nunca sai nenhum 2005 pois é impossível para distribuição via que determinei beleza a chance de obter 1 215 aqui é zero então por isso que não posso ter dois fica parecendo nunca aqui beleza então para essa segunda amostragem aqui de tamanha mostrou igual a quatro a minha média mostrar o de terminar aqui ó x 2 é igual a quanto é que eu vou ter o seguinte então três mais 477 mais 13 10 10 mais um e 11 / 4 acabamos de calcular 2,75 vamos fazer aqui mais um na verdade eu fazer um montão nós vamos fazer mais um aqui fazer mais um detalhe então a minha amostra 3 de tamanho mostrar o a4 digamos que obtive os seguintes resultados 1º vamos dizer que eu tive aqui um depois sei lá um de novo depois 16 depois 16 beleza então a minha terceira média mostrou aqui é igual a quanto mais um guarda 26 mais seis é 12 então vai dar 14 14 / 2 1 + 1 e 26 mas é 12 então aqui vai dar 14 14 / 4 é igual a três e meio 3,5 né agora vou fazer o seguinte aqui tá pra cada amostra dessa aqui de tamanha mostrar o a4 eu calculei a média e agora eu vou botar esses valores aqui numa tabela de freqüência e tudo isso daqui vai te impressionar apenas em alguns segundos olha só vou fazer isso aqui então a ser o seguinte aqui eu vou fazer a plotagem desses valores então a minha primeira média mostrou que foi 2,75 digamos que esteja por aqui assim a 2,75 eu vou fazer aqui então vai se colocar a freqüência com que essas médias aparecem então a primeira vez ali que eu pulei 2,75 tudo isso aqui né digamos que isso aqui é referente a essa média mostrou aqui beleza depois depois calculei 2,75 de novo olha aí vamos colocar aqui assim ó poema aqui mais uma vez 2,75 e depois eu tive um 3,5 então não está aqui esteja o 3 aqui o 3,25 aqui eu tenha um 3,5 então aqui eu vou ter aquela terceira média beleza agora digamos que a gente siga calculando esses valores aqui até digamos sei lá o a 10.000 beleza a mostra 10 mil então com o passar do tempo é quando fizesse 10.000 ac vou fazer aqui em forma de pontos só que eu tenho que dar na verdade o zoom out aqui né vamos fazer aqui em baixo de forma de ponto certo e aí com esse passado tempo que eu falei digamos que o 2,75 esteja por aqui assim né e aí esse primeiro ponto vai ser esse aqui esse segundo ponto ali que eu fiz em azul vai estar por aqui assim né depois de 3,5 está por aqui né só que como eu disse eu vou fazer isso daí com o passar do tempo então eu vou apenas colocar aqui vários pontos está isso vai aparecer assim ó ele vai perceber que quando eu pegar vários pontos aqui com o tamanho a mostrar o a4 isso vai se aproximar bastante de uma distribuição normal sim ou não olha aí então cada um desses pontos aqui representa uma incidência dessa média amostral e isso tudo aqui olha só esse não é algo fantástico está relacionado ao teorema do limite central e aí ó esse caso aqui é para o caso onde o n é igual a quatro tamanhos mostrar ou igual a 4 tranquila mas e se eu pegasse um n igual a 20 o que será que vai acontecer ora em vez de quatro estou considerando 20 elementos naquela amostra né e aí eu vou tirar uma média dessas 20 amostras e aí após concluir essas médias eu vou pilotar no gráfico exatamente como eu fiz anteriormente e quando eu pilotar essas médias eu voltei algo assim ó olha aí o que vai acontecer aqui então quando eu tomar o n igual a 20 é que eu vou ter ainda mesma média é digamos que o médio esteja aqui assim é a média vai ser a mesma só que a única coisa que vai mudar aqui é que o desvio padrão vai ser menor é isso aí mas o que acontece então conforme você vai aumentando há um número de elementos ali na mostra é que vai se aproximando cada vez mais de uma distribuição normal beleza e o que é realmente legal aqui né na no teorema do limite central é que quando o seu tamanho amostral tende ao infinito você nem precisa chegar no infinito é claro que não quando você pega um tamanho amostral relativamente grande você se aproxima bastante na distribuição normal mesmo por exemplo se você tiver um tamanho mostrou de 10 hoje 30 você já vai estar chegando bem perto aí na distribuição normal isso aí já é de fato uma aproximação muito boa o que a gente percebe a nossa vida cotidiana mas o que é muito muito muito legal é que nós podemos começar com uma distribuição qualquer um pode ser uma distribuição bem louca como essa primeira aqui né a primeira que nós fizemos a distribuição bem maluca isso aqui não tem nada a ver com a distribuição normal mas se nós tivermos um tamanho mostrao nesse caso aqui em igual a quatro mas se nós tivéssemos um tamanho mostrar o seu ladinho igual a 10 ou igual a 100 e aí nós pegaremos 100 desses valores aqui e calculamos a média ea gente vai lá naquele gráfico e pilota esses valores lá na freqüência que eles aparecem depois eu pego um outro valor com 100 amostras calcula média ou apronto valor da média que deu nem vou fazendo isso várias vezes quando nos aproximamos lado infinito não é um valor muito alto essas médias isso vai dar algo muito próximo da distribuição normal principalmente se o tamanho amostral ele foi um tamanho bem grande perto do infinito também né e essa é a coisa louca sobre o teorema do limite central isso não se aplica apenas a pegar a média mostrar o aqui nesse caso nós pegamos a média mostrar mas não podemos pegar a soma amostral e com essa soma se ao máximo esses valores aqui potássicos no gráfico o teorema do limite central também seria válido seria aplicável né e é isso que o torna super útil né porque na vida existe toda espécie de processos por exemplo proteínas esbarrando nas outras pessoas fazendo coisas loucas seres humanos interagir de maneira bizarra e você não sabe a função de distribuição da probabilidade para nenhuma dessas coisas é ou não é mas o teorema do limite central então nos diz é que se nós somarmos um bocado dessas ações em conjunto assumindo que todas elas tenham a mesma distribuição ou se nós tivemos que pegar a média de todas essas ações conjuntas e aí nós portarmos essa freqüência dessas média mas iremos resultar em uma distribuição normal e é isso que faz a distribuição normal nos dar tanta informação assim olha aí nós temos que a distribuição normal é uma excelente aproximação é um bocado de soma de várias coisas a lei isso aqui então é uma distribuição normal a distribuição normal eu vou mostrar agora nos próximos vídeos é que isso aqui é a realidade ou seja se você aumentar o tamanho amostral à medida que você aumenta o seu n você pega uma porção de médias amostrais você irá ter um gráfico de frequências que se parece muito muito próximo na distribuição normal portanto até os próximos vídeos