If you're seeing this message, it means we're having trouble loading external resources on our website.

Se você está atrás de um filtro da Web, certifique-se que os domínios *.kastatic.org e *.kasandbox.org estão desbloqueados.

Conteúdo principal
Tempo atual:0:00Duração total:11:48

Transcrição de vídeo

RKA9C Eu estou pensando em comprar um restaurante. Aí, vou até o dono do restaurante atual e pergunto para ele: qual é a distribuição de clientes ao longo da semana? Ele me diz: "Ora, eu já sei quanto é isso". Então, ele me dá esta distribuição aqui, que me diz que 10% dos clientes vão na segunda-feira, 10% na terça, 15% na quarta e assim por diante, até que eles fecham no domingo. Então, tudo isto aqui soma os 100% dos clientes ao longo da semana. Mas eu achei essa distribuição dele meio suspeita e decidi investigar quão boa essa distribuição é e se ela se ajusta ao que é observado. Aí, eu observei quantos clientes foram ao restaurante ao longo da semana, e aqui está o que eu observei. Então, para saber se eu aceito ou rejeito essa hipótese do dono do restaurante, eu vou fazer um teste de hipóteses aqui, é ou não é? Então, eu vou configurar a minha hipótese nula como sendo que a distribuição do dono atual, que é esta coisa aqui, está correta. E a minha hipótese alternativa aqui é que essa distribuição do dono está errada, certo? Então, eu deveria rejeitar essa hipótese do dono e chegar à conclusão de que essa distribuição que ele fez é falsa. E eu quero fazer isso com um nível de significância alfa (α) de 5%, 0,05, que é a mesma coisa que 5%. E a maneira como vou fazer isso é que eu vou calcular uma estatística chamada de qui-quadrado, é uma estática qui-quadrado. Outra maneira de ver isso é que seria, aproximadamente, uma distribuição qui-quadrado. Então, assumindo que essa distribuição é aproximadamente qui-quadrado, eu vou calcular depois quantos graus de liberdade ela tem, eu quero saber qual é a probabilidade de se conseguir um resultado como esse ou, ainda mais extremo que isso, um maior que 5%. Se essa probabilidade que eu calcular for menor que 5%, então, vou rejeitar essa hipótese nula dizendo que o dono está correto. Então, vou chegar à conclusão de que o dono está errado. Agora, se eu conseguir encontrar uma probabilidade que me diga que essa distribuição qui-quadrado é maior, é mais extrema que esse meu alfa, então, eu não vou rejeitar essa hipótese do dono do restaurante, eu vou dizer que há, sim, uma chance de ele estar correto. Então, vamos fazer isso! Ora, para calcular uma distribuição qui-quadrado, eu vou começar assumindo que o dono está correto. E, então, considerando isso, que a distribuição do dono está correta, qual seria o valor esperado dessa distribuição? O valor esperado do que foi observado. Aqui, nós temos a porcentagem que o dono nos passou, e aqui tem o que nós observamos, o valor de quantas pessoas foram ao longo da semana. Vou adicionar uma nova linha chamada de "Esperado". Vou adicionar uma nova linha aqui. Então, o dono me disse que 10% frequentam às segundas, 10% às terças, 15% às quartas... E, para descobrir o que essas porcentagens significam, na verdade, eu vou ter que calcular o total disto aqui. Então, para calcular isso, vou usar a minha calculadora. Vai me ajudar bastante aqui. Então, eu tenho esta conta: 30 + 14 + 34 + 45 + 57 + 20. Quanto dá isso? 200 pessoas. Então, vou colocar aqui mais uma coluna que vai ser o total. Apenas vou ignorar isto aqui. Então, no total, o que eu observei foi que 200 pessoas foram ao restaurante ao longo da semana. E agora? Qual é o valor esperado para uma segunda-feira sabendo que 10% vão em uma segunda-feira? Ora, 10% de 200 é 20. Então, aqui vai entrar o 20. Depois, na terça-feira, 10%: 10% de 200 é 20. 15% de 200, na quarta-feira, vai me dar 30, é ou não é? Depois 20% na quinta-feira: 20% de 200 dá 40 pessoas. Depois, na sexta-feira: 30% de 200 é 60. E 15% de 200 vai dar igual a 30, que frequentaram no sábado. Então, se essa distribuição do dono estiver correta, esses números que eu calculei são, na verdade, os números que deveriam ser esperados. Então, como eu calculo agora a minha distribuição qui-quadrado, a minha estatística qui-quadrado? Vou escrever aqui: estatística qui-quadrado. Eu vou usar aqui, na verdade, um "x²" em vez da letra grega qui (χ), porque essa distribuição, na verdade, vai ser aproximadamente qui-quadrado, não vai ser exatamente, então, não vou usar a letra grega qui não, eu vou usar a letra "x" mesmo. E agora, como faz para calcular isto aqui? Ora, é muito simples! Isso é igual ao seguinte: vai ser o quadrado da diferença entre o observado e o esperado, e tudo isso dividido pelo esperado. Então, eu vou fazer o seguinte: vou fazer só o primeiro ali colorido. Isso vai ser 30 menos 20, certo? Dividido pelo esperado, que é 20. Então, vai ser isto aqui, e essa diferença vai estar elevada ao quadrado, certo? Então, essencialmente, o que eu estou fazendo aqui é calcular o quadrado da diferença do erro entre o observado e o esperado, e depois dividir esse valor pelo esperado. Só que eu não vou pegar só este primeiro dado aqui não, eu vou pegar a soma de todos, de toda a semana aqui, é ou não é? Vou fazer aqui de amarelo. Então, vai ser: este valor aqui, mais, agora vou usar este aqui, (14 - 20)² dividido por 20, mais, (34 - 30)² sobre o valor esperado, que é 30, mais, vou fazer aqui embaixo, 45 menos 40, tudo isso elevado ao quadrado e dividido pelo valor esperado, que é 40, mais, (57 - 60)² sobre o valor esperado, que é 60, e, finalmente, (20 - 30)² dividido por 30. Relembrando, então, tudo que eu fiz aqui foi pegar o valor observado menos o valor esperado, elevar essa diferença ao quadrado e depois eu vou dividir pelo valor esperado. Aí, estou pegando a soma de todos estes valores aqui, beleza? E tudo isso, então, vai me dar a minha estatística qui-quadrado. Portanto, vamos calcular quanto vai dar isto aqui, certo? Vou tentar fazer de cabeça. Vou fazer aqui embaixo de uma outra cor, de laranja. Vai ser o seguinte: 30 menos 20 dá 10, e 10² dá 100. Então, aqui vai ser 100 sobre 20, é isto aqui. Agora, este aqui: 14 menos 20 dá -6, -6² é 36 positivo, então, aqui vai dar 36 sobre 20, certo? Mais... Eu sei que tudo vai dar positivo. Mesmo que a diferença dê negativa, o número negativo ao quadrado é positivo. Então, vamos lá: 34 menos 30 dá 4, 4² é 16, então, 16 sobre 30, mais, aqui a diferença vai dar 5, e 5² é 25, é ou não é? Então, 25 sobre 40, mais, 57 menos 60, vai dar -3, e -3² dá 9 positivo, então, 9 sobre 60. E, finalmente, a diferença daqui vai dar -10, e -10² dá 100 positivo, tudo isso dividido por 30. Agora, para saber que número é este aqui, eu vou usar novamente a calculadora. Então, vamos lá! O que eu tenho aqui, então, é: 100 dividido por 20 mais 36 dividido por 20 mais 16 sobre 30 mais 25 dividido por 40 mais 9 sobre 60 mais 100 dividido por 30. Quanto dá isso, então? Olha aí: 11,44 aproximadamente. Portanto, eu posso escrever aqui que a minha estatística qui-quadrado será 11,44. Como eu expliquei, a nossa estatística qui-quadrado estou dizendo que é "x²", normalmente a gente escreve a letra grega qui ao quadrado, mas, como esta estatística aqui é aproximadamente qui-quadrado, então, não estou usando a letra grega qui, estou usando o próprio "x", beleza? Portanto, dito isso e assumindo que essa distribuição é aproximadamente qui-quadrado, qual é a probabilidade de eu obter um resultado com, ao menos, esse extremo, 11,44? Outra maneira de você ver isso é perguntar se esse valor é mais extremo que o valor qui-quadrado que está nesse nível de significância de 5%. Vamos pensar sobre essa maneira, pois, se este valor aqui for ainda mais extremo que esse 5%, eu vou, então, rejeitar a hipótese nula. Vamos ver lá na nossa tabela da distribuição qui-quadrado. Bem, na verdade, tenho que calcular primeiro os graus de liberdade, ou seja, quantos graus de liberdade tem esta distribuição aqui? Aqui nós temos uma soma com 6 parcelas, é ou não é? 1, 2, 3, 4, 5, 6. Então, você acaba ficando tentado a dizer que o grau de liberdade aqui é 6, que são 6 graus de liberdade. Só que não, cuidado! Se você tem todas estas informações aqui, se você tiver 5 delas, você consegue obter a sexta, então são 5 graus de liberdade, é ou não é? Ou seja, se você tem uma distribuição com "n" valores, o seu grau de liberdade vai ser igual a "n" menos 1, pois, se você der... Por exemplo, no caso, são 6 valores: se eu der 5, eu consigo descobrir o sexto, sim ou não? Por isso, então, eu pego "n" menos 1. Então, aqui, em vez de pegar 6, eu vou pegar 5, são 5 graus de liberdade, tranquilo? Portanto, eu posso dizer que o nosso nível de significância é 5% e o nosso grau de liberdade, vou colocar aqui "GL", nosso grau de liberdade é igual a 5. Olhando, então, para a nossa distribuição qui-quadrado, o nosso grau de liberdade 5 está bem aqui. O nosso nível de significância, que eu determinei como sendo alfa, é de 5%, está aqui. Beleza? Então, o valor qui-quadrado crítico é este aqui: 11,07. Tendo isso em mente, vamos olhar para este gráfico aqui de baixo. Eu tenho uma distribuição qui-quadrado com 5 graus de liberdade, está aqui, então, vai ser esta distribuição aqui embaixo, que está em roxo, certo? E eu estou procurando um valor crítico que é de 11,07. Na verdade, se eu for desenhar, se eu for localizar esse valor... Eu não estou nem vendo ele! Este gráfico aqui prosseguiria... Ele viria aqui, assim. Estaria para cá, beleza? Então, por aqui, assim, você teria 8. Por aqui, teria 10. Por aqui, teria 12. E o 11 estaria por aqui, assim, pelo meio. Então, o 11,07 estaria por aqui, é ou não é? E a área que eu quero saber, que é de 5%, é esta área aqui, certo? Vai ser essa área sob esta curva. E o nosso valor qui-quadrado crítico, que nós encontramos aqui, você pode ver na tabela, foi de 11,07. Então, vou voltar aqui só para escrever isso. O nosso qui-quadrado crítico deu 11,07. E o resultado que nós obtivemos para a nossa estatística é ainda menos provável que este aqui. Você percebe que está depois de 11,07, é um número maior que ele. Isso quer dizer que a probabilidade de obter este número aqui é ainda menor que esse nosso nível de significância. Então, o que eu vou fazer? Eu vou rejeitar a hipótese nula, já que nós acabamos de deduzir que este valor, 11,44, é maior que esse nosso valor crítico do qui-quadrado, que deu 11,07, beleza? Então, o que nós vamos fazer aqui é rejeitar essa hipótese nula, vamos rejeitar isso aqui, pois esta distribuição não se ajusta adequadamente ao que nós observamos, beleza? Até o próximo vídeo!