If you're seeing this message, it means we're having trouble loading external resources on our website.

Se você está atrás de um filtro da Web, certifique-se que os domínios *.kastatic.org e *.kasandbox.org estão desbloqueados.

Conteúdo principal

Condições para um teste-T sobre uma média

Exemplo mostrando como verificar quais condições foram atendidas para um teste t sobre uma média.

Quer participar da conversa?

Nenhuma postagem por enquanto.
Você entende inglês? Clique aqui para ver mais debates na versão em inglês do site da Khan Academy.

Transcrição de vídeo

RKA3JV - E aí, pessoal! Tudo bem? Nesta aula, nós vamos ver as condições para um teste "t" sobre uma média. E, para isso, nós temos um exercício aqui. Suelen e seus amigos têm um grupo de um aplicativo de mensagens para manter a conversa em dia. Ela suspeita que, em média, eles enviam mais de 100 mensagens por dia. Suelen pega uma amostra aleatória de 7 dias do histórico das conversas e registra a quantidade de mensagens que foram enviadas nesses dias. Os dados da amostra são fortemente inclinados para a direita, com uma média de 125 mensagens e um desvio-padrão de 44 mensagens. Ela quer usar estes dados para realizar um teste "t" sobre a média. Quais condições são atendidas para realizar esse tipo de teste de significância? Primeiramente, nós temos que criar as nossas hipóteses. E a hipótese nula, que vamos chamar de "µ", vai ser igual a 100 mensagens por dia. Eu não sei bem como a Suelen fez isso, mas ela suspeita que, em média, eles enviam mais de 100 mensagens por dia. Portanto, a hipótese nula é que este µ = 100. E é bem comum ter muitas mensagens em grupos, não é? E a hipótese alternativa é a dúvida da Suelen, isso porque ela suspeita que os seus amigos enviam mais de 100 mensagens por dia. Portanto, a hipótese alternativa é de que o "µ" é maior do que 100. Ou seja, que os amigos da Suelen enviam mais de 100 mensagens por dia. E para Suelen realizar este teste, ela pega uma população que são vários dias e observa apenas 7 dias que no caso é a amostra. Então, o n = 7. E, a partir disso, ela calcula algumas estatísticas da amostra. Ela calcula a média, que nada mais é do que tentar estimar a verdadeira média da população. Ou seja, este "µ" aqui é a média da população. E ela também calcula o desvio-padrão da amostra. E, a partir disso, ela faz um teste de significância que diz qual é a probabilidade de se obter esta média aqui da amostra, ou algo mais extremo. Assumindo que a hipótese nula seja verdadeira. E se esta probabilidade estiver abaixo de um limite pré-estabelecido, então, a Suelen rejeita a hipótese nula e sugere a hipótese alternativa. Mas, para nos sentirmos mais confiantes com este teste de significância e ficar mais tranquilo em calcular este valor "p", existem algumas condições que este teste precisa atender. A primeira delas, é que esta amostra precisa ser aleatória. E nós já até estudamos isso em aulas passadas, quando falamos de teste de significância. E nós utilizamos a média da população e a média da amostra. E será que essa condição é atendida? Veja bem, Suelen pega uma amostra aleatória de 7 dias do histórico. Eu não sei como ela fez isso, mas eu vou confiar que essa amostra foi coletada de forma aleatória. Portanto, a condição aleatória é atendida. E a próxima condição é conhecida como independência. Isso quer dizer que os indivíduos da nossa amostra são independentes. Isso quer dizer que cada indivíduo da nossa amostra é aproximadamente independente. Por que aproximadamente? Porque nós só teríamos certeza de que eles são independentes se a Suelen estivesse realizando uma substituição, e isso não está claro aqui. Então, uma maneira de descobrir se essa condição de independência é atendida, é com substituição. E tem uma outra maneira de saber se a amostra é mais ou menos independente. Basicamente, se o tamanho da amostra for menor ou igual a 10% da população, então, nós podemos dizer que essa amostra é aproximadamente independente. E, neste caso, a Suelen pegou uma amostra de 7 dias em um período de tempo que ela não relatou. Mas, vamos dizer que este grupo tenha 1 ano. Isso significa que a Suelen e seus amigos utilizaram o grupo por 365 dias. E, com toda certeza, 7 é menor do que 10% de 365. Então, neste caso, a condição de independência é atendida. Mas, claro, isso depende muito. Eu coloquei aqui que o grupo foi criado há 1 ano. E, por isso, dentro desta situação essa condição de independência é atendida. Ou seja, a condição de independência é atendida. E a última condição que tem que ser atendida é a condição normal. Ou seja, nós queremos nos sentir seguros de que esta amostra aqui é aproximadamente normal. Mas aqui nós vamos ver um pouco diferente do que já estamos acostumados com o teste de significância. Existem algumas maneiras de ver se esta amostra é normal. Uma delas é descobrir se a população parental é normal. E, neste exercício, não tem nada a respeito de uma distribuição normal para a quantidade de tempo gasta em um determinado dia. Portanto, essa condição aqui não dá para ter certeza. Mas, uma maneira de descobrir se essa amostra é quase normal, é descobrir se ela é maior ou igual a 30. Mas, claramente, nós podemos ver que a nossa amostra é igual a 7. E, portanto, esta condição também não é atendida. E uma terceira maneira de descobrir se essa amostra aqui é normal é se a amostra for simétrica e sem "outliers". Ou seja, sem valor atípico, valor aberrante. O que significa que a observação não apresenta um grande afastamento das demais da série. E será que neste caso nós temos isso? Observe que os dados da amostra são fortemente inclinados para a direita, com uma média de 125 mensagens e um desvio-padrão de 44 mensagens. Claramente, os dados da amostra são fortemente inclinados para a direita. Isso significa que eles não são simétricos. Portanto, nenhuma dessas subcondições são atendidas. E, com isso, a condição normal também não é. Eu espero que você tenha entendido a importância dessas condições. Até a próxima aula, pessoal!