If you're seeing this message, it means we're having trouble loading external resources on our website.

Se você está atrás de um filtro da Web, certifique-se que os domínios *.kastatic.org e *.kasandbox.org estão desbloqueados.

Conteúdo principal

Intervalos de confiança de amostras pequenas

Construção de uma pequena amostra de intervalos de confiança usando distribuições t. Versão original criada por Sal Khan.

Quer participar da conversa?

Nenhuma postagem por enquanto.
Você entende inglês? Clique aqui para ver mais debates na versão em inglês do site da Khan Academy.

Transcrição de vídeo

[LEGENDA AUTOMÁTICA] a pressão sanguínea de sete pacientes foi medida após eles terem submetido a uma nova droga por três meses eles tiveram a pressão sanguínea aumentada em a ele nos dá 7 valores aqui que está em determinada unidade de medida de pressão arterial construa um intervalo de confiança de 95 por cento para o real aumento da pressão sanguínea para todos os pacientes numa população então nós temos aqui uma distribuição da população e é bem razoável pensar que ela é uma distribuição normal já que isso aqui é um processo biológico certo e aí você deu essa droga para todo ser humano que já existe na face da terra digamos que teve um certo aumento médio da pressão arterial o decréscimo quem sabe isso aqui também terá um certo desvio padrão já que é uma distribuição normal isso ter aqui um desvio-padrão sigma é a razão pela qual é fácil dizer que isso aqui é uma distribuição normal é porque esse processo biológico ou seja é a soma de diversos fatores aleatórios que vão resultar em milhares milhões de resultado diferente e aí sempre que a gente tem esse montão de resultados aleatórios isso tende a dar uma distribuição normal é ou não é então aqui vai ser a nossa distribuição da população distribuição da população beleza nós não sabemos nada além dessas amostras que eles nos deram aqui nesse problema certo então quando você tem um problema que te dá esse pouquinho de informação aqui né você tem que tentar reduzir as outras informações a partir dessa como lá aqui nós temos sete amostras nós podemos somar todas elas / 7 que nós vamos ter a nossa média amostral certo portanto essa conta ali né a nossa média ela vai ser igual a 2,34 e nós podemos calcular também o desvio padrão dessa mostra aqui ou seja você vai encontrar o quadro da distância de cada um desses pontos até essa média amostral aqui mas somar tudo isso e depois vai dividir por ele - um s n ao tamanho amostral né daí depois basta você tirar a raiz quadrada desse resultado que você vai ter o desvio padrão dessa mostra bem eu fiz isso já de antemão é só pra poupar um pouco de tempo aqui da gente pra não ficar fazendo um trabalho braçal isso deu 1,04 e agora nós não sabemos mais nenhuma informação e tudo isso aqui que eu determinei na verdade foram estimativas certo pra esse cara aqui ó então com essa estimativa eu posso dizer que o nosso desvio padrão ele será aproximadamente o desvio padrão da mostra certo que vai ser igual a 1,04 e neste caso aqui do problema você pode reparar nós estamos estimulando esse valor aqui ó com apenas sete amostras certo então uma ambição pouquinhos amostras provavelmente não vai ser uma boa estimativa então colocar aqui ou não será tão boa não será tão boa estimativa porque não porque eu acabei de falar e se n pequeno tamanho e espaço amostral aqui é muito pequeno escrevendo aqui ó que o n é pequeno normalmente é considerada uma má estimativa quando o nosso n for menor que 30 beleza portanto acima de 30 acima de 11 é igual a 30 você está lidando o mundo das boas estimativas tranquilo e agora é o seguinte como essa nossa distribuição é que ela teve uma má estimativa é por causa do nosso tamanho mostrou muito pequeno o que nós vamos fazer essa distribuição aqui eu não posso já garantiu com ela é uma distribuição maior para nós temos um pequeno sítio padrão aqui não foi uma boa estimativa porém eu posso usar uma coisa chamada distribuição t e essa distribuição ter por exemplo ela é projetada para lidar com esses tamanhos amostrais bem pequenos essa distribuição tela se parece bastante com a distribuição normal né mas o gráfico aqui mais ou menos então ela tem também uma média é que nós temos a nossa média só que esses braços aqui o braço do lado esquerdo esse braço do lado direito eles são pouco mais gordinhos mais cheinhos né mas acima desse eixo então posso dizer que esses braços aqui eles são mais gordinhos né voltar aqui braços mas gordinhos tranqüilo e o fato desses braços aqui serem mais gordinhos eu pressuponho que isso aconteça porque é bom o que normalmente nós fazemos encontrar uma estimativa aqui para o verdadeiro desvio padrão então nós dizemos que o verdadeiro desvio padrão da mostra certo se eu escrever aqui só pra gente ter uma noção melhor o nosso desvio-padrão a nossa distribuição mostrar hoje vai ser igual ao desvio padrão da distribuição original dividido pela raiz quadrada do enem que é o nosso tamanho mostrao nesse nosso caso o n ele é igual a quanto a 7 né então normalmente nós não sabemos qual é o valor do verdadeiro desvio padrão então se nós não sabemos o valor exato valor real esse desvio padrão que a distribuição das médias amostrais nós podemos fazer uma estimativa mas podemos determinar esse valor através dessas aqui nesse cálculo aqui né e como a gente fazer essa estimativa hora usando o desvio-padrão mostrar o s seu s dividido pela raiz quadrada de 7 e é por isso que nós chamamos aqui de intervalo de confiança nós estamos confiando esse valor aqui já que esse valor varia bastante dependendo do tamanho amostral beleza então como estava dizendo né esse valor é se aquilo vai ter um uma péssima estimativa o nosso n for pequeno como disse antes do s n for menor do que 30 então quando você está estimando o valor do desvio padrão da sua distribuição mostrar através do desvio padrão das da sua mostra que você não está assumindo que essa distribuição é uma distribuição normal você está assumindo que ela tem esses braços mais gordinhos aqui e ele tem braços mais gordinhos e distribuição de ingressos mais gordinhos porquê porque você está subestimando o valor do desvio padrão bom com tudo isso daqui dito vamos votar o problema nós precisamos de um intervalo de confiança de 95% ao redor dessa média mostrou aqui e portanto pra gente achar esse intervalo de confiança e essa distribuição que fosse uma distribuição o mal bastaria a gente olhar para a nossa tabela de índices e certo como nós fizemos alguns vídeos anteriores mas como essa distribuição aqui não é normal é uma distribuição te amo escrever aqui ó essa distribuição aqui ela é uma distribuição te né nós estamos procurando por um intervalo de confiança de 95% então alguma coisa por aqui assim né beleza é alguma área que em torno da média que vai encapsula em 95 por cento de confiança dos nossos resultados e para uma distribuição que você vai usar a tabela da distribuição te olha aqui já tem aqui ó pré-pronta aí ó e nesse caso da nossa distribuição daqui de cima como a gente está percebendo que ela é uma distribuição simétrica aqui né eu vou usar essa parte que eu to sider dois lados e eu quero 95% ele aqui 95% beleza essa daqui é a distribuição mostrao distribuição amostral para n igual a 7 e quando em igual a 7 aqui eu não vou entrar em maiores detalhes agora mas nós temos seis graus de liberdade esses seis é a mesma coisa que o enem - um beleza então da maneira como essa tabela da distribuição têm aqui está configurada é que você vai procurar pelos graus de liberdade então nesse caso aqui e menos 15 na procura pelo msn - ontem que os 6 certo e aí se você quer 95 por cento de confiança e tá aqui ó nuno grau de liberdade 6 então você vai ter que chegar aqui olham desvio-padrão a 2,447 desvios padrões além da média certa portanto em cada direção aqui o tanto a direita quanto a esquerda da média eu vou ter que percorrer 2,447 desvios padrões e essa tabela ter aqui ela assume que você está se aproximando do desvio padrão usando seu desvio padrão amostral esse s aqui e portanto você tem que percorrer então 2,447 desses desvios padrões aqui aproximadamente é um desvio-padrão valor dele é aproximado tranquilo logo a gente pode dizer que essa distância aqui ó é de 2,4 47 e tudo isso claro vão multiplicar pelo valor aproximado né do desvio padrão em muitos livros de estatística por exemplo você vai ver que esse valor aqui ele é igual a um desvio padrão nas médias amostrais com um circunflexo em cima de um chapeuzinho isso é que significa que esse desvio padrão e foi aproximadamente calculado usando então desvio-padrão mostrao logo seguindo esse padrão vou colocar um chapeuzinho e também porque essa aqui é a única maneira de calcular o desvio-padrão certa e agora vou pegar a calculadora pois nós sabemos o valor desse sr né 1,04 e nós podemos calcular então valor desse desvio padrão de beleza vão pegar a calculadora ligá lo aqui em pa beleza vão calcular agora 1.04 dividido pela raiz quadrada de 7 quanto vai dar isso olha aí o valor de us 0,39 não posso colocar aqui ó 0,39 então se eu quiser encontrar as distâncias ao redor dessa média aqui basta que multiplique 2,447 por 0,39 e assim eu sei que esse intervalo aqui vai ter 95% de confiança portanto vamos fazer essa multiplicação aí vamos lá portanto vou fazer aqui é pegar a nossa resposta anterior e multiplicar por 2.447 quanto vai dar isso a lei deu 0,96 então essa distância aqui ó médio 0,96 e por conseguinte né essa distância equipes e simétrica também médio 0,96 então se você pegar aqui poucos poucas amostras foi o que nós fizemos aqui né apenas sete amostras calcular a média essa média aqui pode ser vista como uma amostra aleatória dessa distribuição a mostrar o aqui e agora não posso escrever o seguinte eu já posso dizer que eu estou confiante daqui o confiante que eu tenho 95% de chance certo e essa confiança que ela vem por causa de todas essas estimativas que nós fizemos né não são valores que nós consideremos exatos perfeitos são valores que nós estamos confiando são estimativas por isso que tem essa palavra confiante aqui então nós estamos confiantes que nós temos 95% de chance que a nossa média mostrou aleatória aqui ou seja 2,34 escrever ali né 2,34 está dentro ali onde continua escrevendo aqui está dentro de 0,96 da nossa verdadeira distribuição mostrar que também posso dizer que a distribuição da população aqui então está dentro de 0,96 da média daquela população ali ou então nós podemos reafirmar toda essa sentença lhe escreveu o seguinte que nós temos 95% de chance que a média verdadeira daquela população que é a mesma média claro daqui dessa daqui né da distribuição das amostras está dentro de 0,96 da nossa média mostrou tão de 2,34 portanto vamos a calculadora aqui ó saber o nosso intervalo de confiança agora né ligar então eu vou ter 2.34 - 0.96 da 1,38 então esse aqui é o ponto mínimo dentro desse nosso intervalo de confiança e o ponto mais alto vai ser quando eu sou má e 0,96 beleza então vamos lá 2.34 mais em 0,96 isso vai ser igual a 3,3 então o nosso intervalo de confiança de 95% que nós queremos calcular este exercício vai de 1,38 até 3,3 beleza não é isso até o próximo vídeo