If you're seeing this message, it means we're having trouble loading external resources on our website.

Se você está atrás de um filtro da Web, certifique-se que os domínios *.kastatic.org e *.kasandbox.org estão desbloqueados.

Conteúdo principal

Introdução ao T estatístico

Uma introdução ao porque usamos o T estatístico.

Quer participar da conversa?

Nenhuma postagem por enquanto.
Você entende inglês? Clique aqui para ver mais debates na versão em inglês do site da Khan Academy.

Transcrição de vídeo

RKA2G - Nós Já estudamos uma situação em que algum parâmetro é associado com a população. Por exemplo, a proporção da população que apoia um candidato, ou talvez a média da população, a média da altura de todos os habitantes de uma cidade. E nós já verificamos que, às vezes,é impraticável conhecer o valor real do parâmetro populacional. Mas nós podemos estimar esse valor tomando uma amostra, essa amostra com um certo tamanho "n". E a partir dessa amostra de tamanho "n", nós calculamos uma estatística quenos interessa para essa amostra. E nós vimos que, uma vez calculado esse dado estatístico, com a intenção de estimar o parâmetro populacional, nós podemos construir um intervalo de confiança sobre esse dado estatístico, baseado em algum nível de confiança. O intervalo de confiança se parece com algo assim: o valor do dado estatístico, mais ou menos uma margem de erro, que é normalmente o valor crítico (z*), e esse valor será baseado no número de desvios-padrão que nós queremos em torno do valor do dado estatístico estudado. E esse z* é multiplicado pelo desvio-padrão da distribuição amostral desse dado estatístico. E o que nós vamos ver é que, normalmente, nós não conhecemos este desvio-padrão. Para conhecer este desvio-padrão, muitas vezes, nós precisamos conhecer o valor do parâmetro populacional. E nem sempre o temos. Por exemplo, na situação em que o parâmetro que nós estamos estudando para tentar estimar e construir intervalos de confiança. Digamos que seja a proporção da população que apoia um certo candidato Ou seja, que porcentagem da população apoia aquele candidato? Esse parâmetro, esse dado, na amostra, é o dado estatístico, ou simplesmente a estatística amostral, ou seja, a proporção dos elementos da amostra que apoiam aquele candidato. E o intervalo de confiança, então, é: a proporção amostral (p^), mais ou menos z* (o valor crítico), vezes... Bem, agora nós não conseguimos calcular o desvio-padrão aqui, a menos que eu saiba a proporção populacional. Mas eu não a tenho. Mas nós podemos estimá-lo com o erro-padrão, que neste caso é a raiz quadrada de p^, vezes (1 - p^), ou seja, a proporção amostral vezes 1 menos a proporção amostral, sobre "n", que é o número de elementos da amostra, o tamanho da amostra. Se o parâmetro que nós estamos tentando estimar é a média populacional, então, a nossa estatística amostral, o nosso dado estatístico na amostra, será a média amostral. Então, neste contexto, para a média, nós teremos o intervalo de confiança dado pela média amostral, mais ou menos z*. Agora, se nós soubéssemos o desvio-padrão populacional, nós saberíamos o desvio-padrão para a distribuição da nossa estatística, do nosso dado estatístico. Ele seria igual ao desvio-padrão da população, sobre a raiz quadrada do tamanho da amostra. Mas nem sempre conhecemos o desvio-padrão populacional. Você poderia dizer: Ok, se nós não sabemos o desvio-padrão populacional, vamos obter o desvio-padrão da amostra. Então, vamos pegar a nossa média amostral, mais ou menos z*, vezes o desvio-padrão amostral, dividido pela raiz quadrada de "n". Bem, isto poderia parecer muito bom se estivéssemos construindo um intervalo de confiança para nossa amostra, para a média na nossa amostra. Mas isto não é tão bom. Porque esta parte aqui vai subestimar o intervalo real. Ou seja, vai subestimar a margem de erro que você precisa para o seu intervalo de confiança. E é por isso que os estatísticos inventaram uma "nova estatística". E vez de usar "z", eles chamam de "t". E, em vez de usar a tabela Z, usa-se a tabela T. Nós vamos ver bastante isso em vídeos futuros. Então, se você está realmente tentando construir um intervalo de confiança para a média amostral e você não conhece o desvio-padrão populacional, que é o que acontece normalmente, o que deve ser feito é: tomar a média amostral, mais ou menos nosso valor crítico, que agora vai ser t*, vezes o desvio-padrão amostral, dividido pela raiz quadrada de "n". E a diferença aqui é que isto nos vai dar um intervalo de confiança que realmente tem o nível de confiança que nós queremos. Então, se queremos 95% de confiança, se nós ficarmos calculando o intervalo de confiança para várias amostras, em 95% das vezes, nós vamos ter a média populacional contida no intervalo de confiança. E nos próximos vídeos, nós vamos verificar como usar a tabela T ao invés da tabela Z. Até lá!