Conteúdo principal
Curso: Estatística e probabilidade > Unidade 11
Lição 4: Mais vídeos sobre intervalos de confiançaIntervalos de confiança de amostras pequenas
Construção de uma pequena amostra de intervalos de confiança usando distribuições t. Versão original criada por Sal Khan.
Quer participar da conversa?
Nenhuma postagem por enquanto.
Transcrição de vídeo
[LEGENDA AUTOMÁTICA] a pressão sanguínea de sete pacientes
foi medida após eles terem submetido a uma nova droga por três meses eles
tiveram a pressão sanguínea aumentada em a ele nos dá 7 valores aqui que está em
determinada unidade de medida de pressão arterial
construa um intervalo de confiança de 95 por cento para o real aumento da pressão
sanguínea para todos os pacientes numa população então nós temos aqui uma
distribuição da população e é bem razoável pensar que ela é uma
distribuição normal já que isso aqui é um processo biológico certo e aí você
deu essa droga para todo ser humano que já existe na face da terra
digamos que teve um certo aumento médio da pressão arterial o decréscimo quem
sabe isso aqui também terá um certo desvio padrão já que é uma distribuição
normal isso ter aqui um desvio-padrão sigma é a razão pela qual é fácil dizer
que isso aqui é uma distribuição normal é porque esse processo biológico ou seja
é a soma de diversos fatores aleatórios que vão resultar em milhares milhões de
resultado diferente e aí sempre que a gente tem esse montão de resultados
aleatórios isso tende a dar uma distribuição normal
é ou não é então aqui vai ser a nossa distribuição da população distribuição
da população beleza nós não sabemos nada além dessas
amostras que eles nos deram aqui nesse problema certo
então quando você tem um problema que te dá esse pouquinho de informação aqui né
você tem que tentar reduzir as outras informações a partir dessa como lá
aqui nós temos sete amostras nós podemos somar todas elas / 7 que nós vamos ter a
nossa média amostral certo portanto essa conta ali né a nossa média
ela vai ser igual a 2,34 e nós podemos calcular também o desvio padrão dessa
mostra aqui ou seja você vai encontrar o quadro da distância de cada um desses
pontos até essa média amostral aqui mas somar
tudo isso e depois vai dividir por ele - um s n ao tamanho amostral né
daí depois basta você tirar a raiz quadrada desse resultado que você vai
ter o desvio padrão dessa mostra bem eu fiz isso já de antemão é só pra poupar
um pouco de tempo aqui da gente pra não ficar fazendo um trabalho braçal isso
deu 1,04 e agora nós não sabemos mais nenhuma informação e tudo isso aqui que
eu determinei na verdade foram estimativas certo pra esse cara aqui ó
então com essa estimativa eu posso dizer que o nosso desvio padrão
ele será aproximadamente o desvio padrão da mostra certo que vai ser igual a 1,04
e neste caso aqui do problema você pode reparar
nós estamos estimulando esse valor aqui ó com apenas sete amostras certo então
uma ambição pouquinhos amostras provavelmente não vai ser uma boa
estimativa então colocar aqui ou não será tão boa não será tão boa estimativa
porque não porque eu acabei de falar e se n pequeno tamanho e espaço amostral
aqui é muito pequeno escrevendo aqui ó que o n é pequeno
normalmente é considerada uma má estimativa
quando o nosso n for menor que 30 beleza portanto acima de 30 acima de 11 é igual
a 30 você está lidando o mundo das boas estimativas tranquilo e agora é o
seguinte como essa nossa distribuição é que ela teve uma má estimativa é por
causa do nosso tamanho mostrou muito pequeno o que nós vamos fazer essa
distribuição aqui eu não posso já garantiu com ela é uma distribuição
maior para nós temos um pequeno sítio padrão aqui não foi uma boa estimativa
porém eu posso usar uma coisa chamada distribuição t
e essa distribuição ter por exemplo ela é projetada para lidar com esses
tamanhos amostrais bem pequenos essa distribuição tela se parece
bastante com a distribuição normal né mas o gráfico aqui mais ou menos então
ela tem também uma média é que nós temos a nossa média
só que esses braços aqui o braço do lado esquerdo esse braço do lado direito eles
são pouco mais gordinhos mais cheinhos né
mas acima desse eixo então posso dizer que esses braços aqui eles são mais
gordinhos né voltar aqui braços mas gordinhos tranqüilo e o fato desses braços aqui
serem mais gordinhos eu pressuponho que isso aconteça porque é bom o que
normalmente nós fazemos encontrar uma estimativa aqui para o verdadeiro desvio
padrão então nós dizemos que o verdadeiro desvio padrão da mostra certo
se eu escrever aqui só pra gente ter uma noção melhor o nosso desvio-padrão a
nossa distribuição mostrar hoje vai ser igual ao desvio padrão da distribuição
original dividido pela raiz quadrada do enem que é o nosso tamanho mostrao nesse
nosso caso o n ele é igual a quanto a 7 né
então normalmente nós não sabemos qual é o valor do verdadeiro desvio padrão
então se nós não sabemos o valor exato valor real
esse desvio padrão que a distribuição das médias amostrais nós podemos fazer
uma estimativa mas podemos determinar esse valor através dessas aqui nesse
cálculo aqui né e como a gente fazer essa estimativa hora usando o
desvio-padrão mostrar o s seu s dividido pela raiz quadrada de 7 e é por
isso que nós chamamos aqui de intervalo de confiança nós estamos confiando esse
valor aqui já que esse valor varia bastante dependendo do tamanho amostral
beleza então como estava dizendo né esse valor é se aquilo vai ter um uma péssima
estimativa o nosso n for pequeno como disse antes do s n for menor do que 30
então quando você está estimando o valor do desvio padrão da sua distribuição
mostrar através do desvio padrão das da sua mostra que você não está assumindo
que essa distribuição é uma distribuição normal você está assumindo que ela tem
esses braços mais gordinhos aqui e ele tem braços mais gordinhos e distribuição
de ingressos mais gordinhos porquê porque você está subestimando o valor do
desvio padrão bom com tudo isso daqui dito vamos votar o problema nós
precisamos de um intervalo de confiança de 95% ao redor dessa média mostrou aqui
e portanto pra gente achar esse intervalo de confiança e essa
distribuição que fosse uma distribuição o mal bastaria a gente olhar para a
nossa tabela de índices e certo como nós fizemos alguns vídeos anteriores mas
como essa distribuição aqui não é normal é uma distribuição te amo escrever aqui
ó essa distribuição aqui ela é uma
distribuição te né nós estamos procurando por um intervalo
de confiança de 95% então alguma coisa por aqui assim né
beleza é alguma área que em torno da média que vai encapsula em 95 por cento
de confiança dos nossos resultados e para uma distribuição que você vai usar
a tabela da distribuição te olha aqui já tem aqui ó pré-pronta aí ó e nesse caso
da nossa distribuição daqui de cima como a gente está percebendo que ela é uma
distribuição simétrica aqui né eu vou usar essa parte que eu to sider
dois lados e eu quero 95% ele aqui 95% beleza essa daqui é a distribuição
mostrao distribuição amostral para n igual a 7
e quando em igual a 7 aqui eu não vou entrar em maiores detalhes agora mas nós
temos seis graus de liberdade esses seis é a mesma coisa que o enem -
um beleza então da maneira como essa tabela da distribuição têm aqui está
configurada é que você vai procurar pelos graus de liberdade então nesse
caso aqui e menos 15 na procura pelo msn - ontem que os 6 certo e aí se você quer
95 por cento de confiança e tá aqui ó nuno grau de liberdade 6
então você vai ter que chegar aqui olham desvio-padrão a 2,447 desvios padrões
além da média certa portanto em cada direção aqui o tanto a
direita quanto a esquerda da média eu vou ter que percorrer 2,447 desvios
padrões e essa tabela ter aqui ela assume que você está se aproximando do
desvio padrão usando seu desvio padrão amostral esse s aqui e portanto você tem
que percorrer então 2,447 desses desvios padrões aqui aproximadamente é um
desvio-padrão valor dele é aproximado tranquilo logo a gente pode dizer que
essa distância aqui ó é de 2,4 47 e tudo isso claro vão
multiplicar pelo valor aproximado né do desvio padrão em muitos livros de
estatística por exemplo você vai ver que esse valor aqui ele é igual a um desvio
padrão nas médias amostrais com um circunflexo em cima de um chapeuzinho
isso é que significa que esse desvio padrão e foi aproximadamente calculado
usando então desvio-padrão mostrao logo seguindo esse padrão vou colocar um
chapeuzinho e também porque essa aqui é a única maneira de calcular o
desvio-padrão certa e agora vou pegar a calculadora pois nós sabemos o valor
desse sr né 1,04 e nós podemos calcular então valor desse desvio padrão de
beleza vão pegar a calculadora ligá lo aqui em pa beleza vão calcular agora
1.04 dividido pela raiz quadrada de 7 quanto vai dar isso
olha aí o valor de us 0,39 não posso colocar aqui ó 0,39
então se eu quiser encontrar as distâncias ao redor dessa média aqui
basta que multiplique 2,447 por 0,39 e assim eu sei que esse intervalo aqui vai
ter 95% de confiança portanto vamos fazer essa multiplicação
aí vamos lá portanto vou fazer aqui é pegar a nossa resposta anterior e
multiplicar por 2.447 quanto vai dar isso a lei deu 0,96 então essa distância
aqui ó médio 0,96 e por conseguinte né essa distância equipes e simétrica
também médio 0,96 então se você pegar aqui poucos poucas
amostras foi o que nós fizemos aqui né apenas sete amostras calcular a média
essa média aqui pode ser vista como uma amostra aleatória dessa distribuição a
mostrar o aqui e agora não posso escrever o seguinte eu já posso dizer
que eu estou confiante daqui o confiante que eu tenho 95% de chance
certo e essa confiança que ela vem por causa de todas essas estimativas que nós
fizemos né não são valores que nós consideremos
exatos perfeitos são valores que nós estamos
confiando são estimativas por isso que tem essa palavra confiante aqui então
nós estamos confiantes que nós temos 95% de chance que a nossa média mostrou
aleatória aqui ou seja 2,34 escrever ali né 2,34 está dentro ali onde continua
escrevendo aqui está dentro de 0,96 da nossa verdadeira distribuição mostrar
que também posso dizer que a distribuição da população aqui então
está dentro de 0,96 da média daquela população ali ou então nós podemos
reafirmar toda essa sentença lhe escreveu o seguinte que nós temos 95% de
chance que a média verdadeira daquela população que é a mesma média claro
daqui dessa daqui né da distribuição das amostras está dentro de 0,96 da nossa
média mostrou tão de 2,34 portanto vamos a calculadora aqui ó
saber o nosso intervalo de confiança agora né ligar
então eu vou ter 2.34 - 0.96 da 1,38 então esse aqui é o ponto mínimo dentro
desse nosso intervalo de confiança e o ponto mais alto vai ser quando eu sou má
e 0,96 beleza então vamos lá 2.34 mais em 0,96
isso vai ser igual a 3,3 então o nosso intervalo de confiança de
95% que nós queremos calcular este exercício vai de 1,38 até 3,3
beleza não é isso até o próximo vídeo