Conteúdo principal
Estatística Avançada
Curso: Estatística Avançada > Unidade 11
Lição 2: Como preparar um teste para a média de uma população- Como escrever hipóteses para um teste de significância de uma média.
- Como escrever hipóteses para um teste sobre uma média
- Condições para um teste-T sobre uma média
- Referência: condições para inferência de uma média
- Condições para um teste-T sobre uma média
© 2023 Khan AcademyTermos de usoPolítica de privacidadeAviso de cookies
Condições para um teste-T sobre uma média
Exemplo mostrando como verificar quais condições foram atendidas para um teste t sobre uma média.
Quer participar da conversa?
Nenhuma postagem por enquanto.
Transcrição de vídeo
RKA3JV - E aí, pessoal!
Tudo bem? Nesta aula, nós vamos ver as condições
para um teste "t" sobre uma média. E, para isso, nós temos um exercício aqui. Suelen e seus amigos têm um
grupo de um aplicativo de mensagens para manter a conversa em dia. Ela suspeita que, em média, eles enviam mais
de 100 mensagens por dia. Suelen pega uma amostra aleatória
de 7 dias do histórico das conversas e registra a quantidade de mensagens
que foram enviadas nesses dias. Os dados da amostra são
fortemente inclinados para a direita, com uma média de 125 mensagens e um desvio-padrão de 44 mensagens. Ela quer usar estes dados
para realizar um teste "t" sobre a média. Quais condições são atendidas para realizar esse tipo
de teste de significância? Primeiramente, nós temos que
criar as nossas hipóteses. E a hipótese nula,
que vamos chamar de "µ", vai ser igual a 100 mensagens por dia. Eu não sei bem como a Suelen fez isso, mas ela suspeita que,
em média, eles enviam mais de 100 mensagens por dia. Portanto, a hipótese nula
é que este µ = 100. E é bem comum ter muitas
mensagens em grupos, não é? E a hipótese alternativa
é a dúvida da Suelen, isso porque ela suspeita que os seus amigos
enviam mais de 100 mensagens por dia. Portanto, a hipótese alternativa é de que o "µ"
é maior do que 100. Ou seja, que os amigos da Suelen enviam mais de
100 mensagens por dia. E para Suelen realizar este teste, ela pega uma população
que são vários dias e observa apenas 7 dias que no caso é a amostra. Então, o n = 7. E, a partir disso, ela calcula
algumas estatísticas da amostra. Ela calcula a média, que nada mais é do que tentar estimar a verdadeira média da população. Ou seja, este "µ" aqui é a média da população. E ela também calcula
o desvio-padrão da amostra. E, a partir disso, ela faz um
teste de significância que diz qual é a probabilidade de
se obter esta média aqui da amostra, ou algo mais extremo. Assumindo que a hipótese
nula seja verdadeira. E se esta probabilidade estiver
abaixo de um limite pré-estabelecido, então, a Suelen rejeita a hipótese nula e sugere a hipótese alternativa. Mas, para nos sentirmos mais confiantes
com este teste de significância e ficar mais tranquilo
em calcular este valor "p", existem algumas condições que este
teste precisa atender. A primeira delas, é que esta
amostra precisa ser aleatória. E nós já até estudamos
isso em aulas passadas, quando falamos de teste de significância. E nós utilizamos a média da população e a média da amostra. E será que essa condição é atendida? Veja bem, Suelen pega
uma amostra aleatória de 7 dias do histórico. Eu não sei como ela fez isso, mas eu vou confiar que essa amostra
foi coletada de forma aleatória. Portanto, a condição aleatória
é atendida. E a próxima condição é conhecida
como independência. Isso quer dizer que os
indivíduos da nossa amostra são independentes. Isso quer dizer que cada
indivíduo da nossa amostra é aproximadamente independente. Por que aproximadamente? Porque nós só teríamos certeza
de que eles são independentes se a Suelen estivesse realizando
uma substituição, e isso não está claro aqui. Então, uma maneira de descobrir
se essa condição de independência é atendida, é com substituição. E tem uma outra maneira
de saber se a amostra é mais ou menos independente. Basicamente, se o tamanho da amostra
for menor ou igual a 10% da população, então, nós podemos dizer que essa amostra é aproximadamente independente. E, neste caso, a Suelen pegou
uma amostra de 7 dias em um período de tempo
que ela não relatou. Mas, vamos dizer que este
grupo tenha 1 ano. Isso significa que a Suelen e seus amigos utilizaram o grupo por 365 dias. E, com toda certeza, 7 é menor
do que 10% de 365. Então, neste caso, a condição de independência é atendida. Mas, claro, isso depende muito. Eu coloquei aqui que
o grupo foi criado há 1 ano. E, por isso, dentro desta situação essa condição de
independência é atendida. Ou seja, a condição
de independência é atendida. E a última condição que tem
que ser atendida é a condição normal. Ou seja, nós queremos
nos sentir seguros de que esta amostra aqui é aproximadamente normal. Mas aqui nós vamos ver um
pouco diferente do que já estamos acostumados
com o teste de significância. Existem algumas maneiras de ver se esta amostra é normal. Uma delas é descobrir se
a população parental é normal. E, neste exercício, não tem nada a respeito
de uma distribuição normal para a quantidade de tempo
gasta em um determinado dia. Portanto, essa condição aqui
não dá para ter certeza. Mas, uma maneira de descobrir
se essa amostra é quase normal, é descobrir se ela é maior ou igual a 30. Mas, claramente, nós podemos ver
que a nossa amostra é igual a 7. E, portanto, esta condição também
não é atendida. E uma terceira maneira de descobrir se essa amostra aqui é normal é se a amostra for simétrica
e sem "outliers". Ou seja, sem valor atípico,
valor aberrante. O que significa que a observação não apresenta um grande afastamento
das demais da série. E será que neste caso
nós temos isso? Observe que os dados da amostra
são fortemente inclinados para a direita, com uma média de 125 mensagens e um desvio-padrão de
44 mensagens. Claramente, os dados da amostra são fortemente
inclinados para a direita. Isso significa que eles
não são simétricos. Portanto, nenhuma dessas
subcondições são atendidas. E, com isso, a condição normal também não é. Eu espero que você tenha
entendido a importância dessas condições. Até a próxima aula, pessoal!