Se você está vendo esta mensagem, significa que estamos tendo problemas para carregar recursos externos em nosso website.

If you're behind a web filter, please make sure that the domains *.kastatic.org and *.kasandbox.org are unblocked.

Conteúdo principal

Exemplo de resposta: teste de significância para uma média

Resposta de uma prova de estatística avançada sobre um teste de significância para uma média .

Quer participar da conversa?

Nenhuma postagem por enquanto.
Você entende inglês? Clique aqui para ver mais debates na versão em inglês do site da Khan Academy.

Transcrição de vídeo

RKA3JV - Olá, meu amigo ou minha amiga! Tudo bem com você? Seja muito bem-vindo ou bem-vinda a mais um vídeo da Khan Academy Brasil. Neste vídeo, vamos resolver um exemplo sobre o teste de significância para uma média. E este exemplo diz o seguinte: regulamentos exigem que os rótulos dos produtos em recipientes de comida que estão disponíveis para venda ao público diga a quantidade, de forma precisa, de comida nestes recipientes. Especificamente, se os recipientes de leite possuem embalagens que dizem ter 128 dl e o número médio de decilitro em cada recipiente de pelo menos 128, o processador de leite é considerado estar em conformidade com os regulamentos. As máquinas que enchem o recipiente podem ser definidas para a quantidade rotulada. Variabilidade no processo de enchimento faz com que o conteúdo real nos recipientes de leite seja distribuído normalmente. Uma amostra aleatória de 12 recipientes de leite foram ensacados na linha de processamento de leite em uma fábrica, e a quantidade de leite em cada recipiente foi registrada. A média da amostra e o desvio-padrão desta amostra de 12 recipientes de leite eram 127,2 dl e 2,1 dl, respectivamente. Existem evidências suficientes para concluir que a fábrica não está em conformidade com os regulamentos? Forneça estatísticas para justificar sua resposta. Que tal, agora, você pausar este vídeo e tentar resolver um exemplo sozinho ou sozinha. E aí, conseguiu? Se não, não tem problema. Vamos fazer isso juntos. Então, primeiro, deixe-me definir "µ" aqui. Isso vai ser a média, a quantidade média de leite na população de embalagens da fábrica. Agora, podemos estabelecer nossas hipóteses. Nossa hipótese nula é que estamos em conformidade. Podemos dizer que a média para nossa população de embalagens é, na verdade, 128. Este é o nosso mínimo para que a gente esteja em conformidade. Por outro lado, a nossa hipótese alternativa é que não estamos em conformidade. Então, esta é a nossa média, onde a verdadeira média da população é inferior a 128 dl. Sendo assim, a hipótese alternativa "ha", é onde temos uma situação onde não estamos em conformidade. Agora, se você vai fazer um teste de significância, você precisa definir um nível de significância. Então, vamos fazer isto aqui. Um nível de significância. E se você não percebeu, eu estou tentando fazer, neste vídeo, o que seria esperado de você em uma avaliação. Esta é uma pergunta real de uma avaliação, de uma prova. Então, o nosso nível de significância aqui é, eu vou apenas escolher 0,05, porque, isso é bastante típico. E já que a questão não forneceu isso, é importante definir isso com antecedência. Agora, vamos verificar nossas condições para a inferência. E isso é para gente se sentir bem, que a amostra que estamos usando para fazer nossa inferência, para fazer o nosso teste de significância, é razoável para fazer inferências. Bem, a primeira é a condição aleatória. Temos isso? Bem, o problema diz que temos uma amostra aleatória de 12 embalagens de leite. Se eu estivesse fazendo isso em uma avaliação, eu escreveria isso aqui. A questão diz que uma amostra aleatória de 12... Aí tem mais coisas escritas, mas vamos apenas deixar isso aqui. Sendo assim, eu diria que cumpre a condição. Ou seja, que atende a condição. Agora, a próxima com que devemos nos preocupar é a nossa condição normal. Isto serve para gente se sentir bem de que a nossa distribuição de amostragem é quase normal. E existem algumas formas de fazer isso. A primeira é que nossa amostra tem que ter um tamanho que é maior do que 30, ou maior ou igual a 30. Aí, diríamos: ok! A nossa distribuição de amostragem vai ser quase normal. Mas nesta situação o nosso tamanho da amostra é menor que 30. E, agora? Existem outras formas de atender à condição normal. E isso se os dados principais subjacentes são normalmente distribuídos. E o problema realmente diz isso aqui. Variabilidade no processo de enchimento faz com que o conteúdo real do leite possa ser distribuído normalmente. Então, poderíamos dizer que a passagem, eu posso escrever isso aqui desta forma. Então, o conteúdo real do leite possa ser distribuído normalmente. Então, isso atende à condição. Agora, a última condição que queremos pensar é a condição de independência. Isso serve para que as observações, ou seja, que cada observação individual em nossa amostra possa ser considerada aproximadamente independente. Uma forma de atender a essa condição é se a gente tiver uma amostragem com reposição, o que não está sendo feito aqui, já que a questão deixou evidenciado que foram retirados recipientes de uma vez. Porém, existe uma outra forma de atender a essa condição. Se a amostra representa menos de 10% da população em geral, então, você poderia dizer: ok, podemos ver isso como aproximadamente independente. Sendo assim, você pode escrever, apesar de não ser uma amostra com reposição, podemos assumir como independente, porque 12% é menor que 10% da população. Sendo assim, a condição também é atendida. Então, pelo que observamos, as 3 condições que precisávamos para fazer inferências foram atendidas. Pelo menos podemos assumir isso, porque não encontramos nenhuma informação que contradiz isso. Agora, podemos fazer nossos cálculos estatísticos. Sendo assim, vamos calcular uma estatística "t", e, então, a partir disso, calcular o nosso valor "p". E aí, comparar o nosso valor "p" com o nosso nível de significância. Por último, ver que tipo de conclusões que podemos tirar. Então, mais uma vez, eu gostaria que você pausasse este vídeo e tentasse calcular essa estatística "t". Fez? Ok, vamos fazer juntos agora. A nossa estatística "t" é igual à nossa média amostral menos a média assumida na hipótese zero. Eu vou dizer que isso é assumido como pressuposto de h₀. Ou seja, foi assumido a partir da hipótese nula. Aí, eu divido essa diferença por, se eu estivesse fazendo uma estatística "z", eu dividiria pelo desvio-padrão da distribuição de amostragem da média da amostra, que muitas vezes é conhecida como erro padrão da média. Mas todo o motivo de estar fazendo uma estatística "t" é que eu não sei exatamente o que isso é, mas eu posso estimar o desvio-padrão da distribuição de amostragem da média da amostra, usando o desvio padrão da amostra dividido pela √n. E, mais uma vez, meu amigo ou minha amiga, se você estiver fazendo isso em uma avaliação, é sempre bom explicar o que o "n" é, ou o que algumas dessas coisas que são. Se você estiver usando uma notação padrão, os avaliadores até podem assumir o que são. Mas se você tiver tempo nessas avaliações, é sempre bom explicar um pouco mais o que são essas variáveis. Neste caso, temos que tudo isso é igual a 127,2, já que essa é a nossa média da amostra. Aí, temos isso menos a nossa média assumida de nossa hipótese zero. Ou seja, -128. Tudo isso sobre o nosso desvio-padrão da amostra que é 2,1 / √12 Então, isso vai ser aproximadamente igual a, vamos pegar uma calculadora aqui. Então, temos, vamos ver, no numerador, temos 127,2 - 128. Então, vamos dividir isso por, eu vou abrir um parênteses aqui, aí colocamos 2,1 dividido por √12. Depois, a gente fecha os parênteses. Eu digitei que isso corretamente? Sim, sim está tudo certo. Aí clicamos em "enter", e isso é negativo, aproximadamente, -1,32. Então, temos -1,32. Agora, podemos descobrir o nosso valor "p" que é a mesma coisa que a probabilidade de obter uma estatística "t" igual ou abaixo de -1,32, que é igual a, vamos pegar nossa calculadora aqui de volta. Aqui eu uso a função distribuição cumulativa para estatística "t". E aí, eu clico em "enter". Eu me importo com a cauda esquerda. Sendo assim, eu quero a área sob a curva que vai do infinito negativo até e incluindo 1,32 negativo. Então, vamos colocar aqui -1,32. Bem, isso vai ser o tamanho da amostra da -1, meu tamanho de amostra era 12, de modo que 12 menos 1 é 11. Então, eu colo. Sendo assim, eu tenho aqui a função distribuição cumulativa para estatística "t", 1 negativo e 99, que significa -1 vezes 10 elevado a 99, até -1,32. Aí, colocamos virgula 11. É importante escrever isso que está na tela na avaliação, para que os examinadores saibam de onde você tirou o resultado. Vamos ver a resposta. Isso é igual a 0,107. Então, vamos escrever isso aqui. Isso é aproximadamente igual a 0,107. Bem, como eu disse, é importante dizer como você calculou isso. Então, a gente pode escrever isso aqui. Usando a "TCDF", que é a função distribuição cumulativa para estatística "t". E passamos essa função de -1 vezes 10 elevado a 99 até 1,32 negativo, com um grau de liberdade igual a 11. Para obter este resultado bem aqui. Também pode ser uma boa prática desenhar essa distribuição "t". Essa é a nossa distribuição "t", essa é a média de nossa distribuição "t". E aí, demarcamos a área que calculamos. É legal fazer isso para garantir que os avaliadores saibam sobre o que estamos falando. Agora, estamos prontos para fazer uma conclusão. Podemos comparar isso com o nosso nível significância. Podemos dizer que 0,107 é maior que o nosso nível de significância, que é 0,05 e que representamos aqui com "α". E aí, com isso, nós falhamos em rejeitar a hipótese nula. Vamos ter certeza que nós lemos a pergunta certa aqui. Existem evidências suficientes para concluir que a fábrica não está em conformidade com os regulamentos? Bem, eu acho que lemos certo. Podemos falar isso também de uma outra forma, falando que isso não existe. Ou seja, que não há evidências suficientes para concluir que a fábrica não está em conformidade com os regulamentos. E, pronto, terminamos! Enfim, eu espero que você tenha compreendido tudo direitinho o que conversamos aqui. E, mais uma vez, eu quero deixar para você um grande abraço e até a próxima!