Conteúdo principal
Curso: Estatística e probabilidade > Unidade 11
Lição 3: Como estimar a média de uma população- Introdução ao T estatístico
- Simulação mostrando a importância do T estatístico
- Condições para intervalos t válidos
- Referência: condições para inferência de uma média
- Condições para um intervalo t de uma média
- Exemplo: como calcular o valor t crítico
- Como calcular o valor crítico t* para um nível de confiança desejado
- Exemplo: como construir um intervalo t para uma média
- Como calcular um intervalo t para uma média
- Intervalo de confiança para uma média com dados emparelhados
- Como criar um intervalo t para dados emparelhados
- Como interpretar um intervalo de confiança para uma média
- Tamanho amostral para uma determinada margem de erro para uma média
- Tamanho amostral e margem de erro em um intervalo de confiança para uma média
© 2024 Khan AcademyTermos de usoPolítica de privacidadeAviso de cookies
Introdução ao T estatístico
Uma introdução ao porque usamos o T estatístico.
Quer participar da conversa?
Nenhuma postagem por enquanto.
Transcrição de vídeo
RKA2G - Nós Já estudamos uma situação em que algum parâmetro é
associado com a população. Por exemplo, a proporção da população
que apoia um candidato, ou talvez a média da população, a média da altura
de todos os habitantes de uma cidade. E nós já verificamos que, às vezes,é impraticável conhecer o valor real
do parâmetro populacional. Mas nós podemos estimar esse valor
tomando uma amostra, essa amostra com um certo tamanho "n". E a partir dessa amostra de tamanho "n", nós calculamos uma estatística quenos interessa para essa amostra. E nós vimos que, uma vez calculado
esse dado estatístico, com a intenção de estimar
o parâmetro populacional, nós podemos construir
um intervalo de confiança sobre esse dado estatístico, baseado em algum nível de confiança. O intervalo de confiança
se parece com algo assim: o valor do dado estatístico, mais ou menos
uma margem de erro, que é normalmente o valor crítico (z*), e esse valor será baseado no número
de desvios-padrão que nós queremos em torno do valor
do dado estatístico estudado. E esse z* é multiplicado pelo desvio-padrão
da distribuição amostral desse dado estatístico. E o que nós vamos ver é que, normalmente,
nós não conhecemos este desvio-padrão. Para conhecer este desvio-padrão, muitas vezes, nós precisamos conhecer
o valor do parâmetro populacional. E nem sempre o temos. Por exemplo, na situação em que
o parâmetro que nós estamos estudando para tentar estimar e construir intervalos
de confiança. Digamos que seja a proporção da população
que apoia um certo candidato Ou seja, que porcentagem da população
apoia aquele candidato? Esse parâmetro, esse dado, na amostra, é o dado estatístico, ou simplesmente
a estatística amostral, ou seja, a proporção dos elementos
da amostra que apoiam aquele candidato. E o intervalo de confiança, então, é: a proporção amostral (p^), mais ou menos z* (o valor crítico), vezes... Bem, agora nós não conseguimos
calcular o desvio-padrão aqui, a menos que eu saiba a proporção
populacional. Mas eu não a tenho. Mas nós podemos estimá-lo com o erro-padrão, que neste caso é a raiz quadrada de p^, vezes (1 - p^), ou seja, a proporção amostral vezes
1 menos a proporção amostral, sobre "n", que é o número de elementos
da amostra, o tamanho da amostra. Se o parâmetro que nós estamos
tentando estimar é a média populacional, então, a nossa estatística amostral, o nosso dado
estatístico na amostra, será a média amostral. Então, neste contexto, para a média, nós teremos o intervalo de confiança
dado pela média amostral, mais ou menos z*. Agora, se nós soubéssemos o
desvio-padrão populacional, nós saberíamos o desvio-padrão para a distribuição da nossa estatística,
do nosso dado estatístico. Ele seria igual ao desvio-padrão
da população, sobre a raiz quadrada do tamanho
da amostra. Mas nem sempre conhecemos
o desvio-padrão populacional. Você poderia dizer: Ok, se nós não
sabemos o desvio-padrão populacional, vamos obter o desvio-padrão da amostra. Então, vamos pegar a nossa média
amostral, mais ou menos z*, vezes o desvio-padrão amostral, dividido pela raiz quadrada de "n". Bem, isto poderia parecer muito bom se estivéssemos construindo um intervalo
de confiança para nossa amostra, para a média na nossa amostra. Mas isto não é tão bom. Porque esta parte aqui vai subestimar
o intervalo real. Ou seja, vai subestimar a margem de erro que você precisa para o seu intervalo
de confiança. E é por isso que os estatísticos inventaram
uma "nova estatística". E vez de usar "z", eles chamam de "t". E, em vez de usar a tabela Z, usa-se a tabela T. Nós vamos ver bastante isso em vídeos futuros. Então, se você está realmente tentando
construir um intervalo de confiança para a média amostral e você não conhece o desvio-padrão
populacional, que é o que acontece normalmente, o que deve ser feito é: tomar a média amostral, mais ou menos nosso valor crítico,
que agora vai ser t*, vezes o desvio-padrão amostral, dividido pela raiz quadrada de "n". E a diferença aqui é que isto nos vai dar
um intervalo de confiança que realmente tem o nível de confiança
que nós queremos. Então, se queremos 95% de confiança, se nós ficarmos calculando o intervalo
de confiança para várias amostras, em 95% das vezes, nós vamos ter a média populacional
contida no intervalo de confiança. E nos próximos vídeos, nós vamos verificar
como usar a tabela T ao invés da tabela Z. Até lá!