If you're seeing this message, it means we're having trouble loading external resources on our website.

Se você está atrás de um filtro da Web, certifique-se que os domínios *.kastatic.org e *.kasandbox.org estão desbloqueados.

Conteúdo principal

Estatística qui-quadrado para testes de hipóteses

Estatística qui-quadrado para testar hipóteses (teste de aderência qui-quadrado).

Quer participar da conversa?

Nenhuma postagem por enquanto.
Você entende inglês? Clique aqui para ver mais debates na versão em inglês do site da Khan Academy.

Transcrição de vídeo

RKA3JV - Olá, meu amigo ou minha amiga! Tudo bem com você? Seja muito bem-vindo ou bem-vinda a mais um vídeo da Khan Academy Brasil. Neste vídeo, vamos trabalhar com exemplos sobre o qui-quadrado. Vamos supor que existe algum tipo de exame padronizado onde cada pergunta no teste tem 4 opções. Escolha "A", escolha "B", escolha "C" e escolha "D". E os elaboradores do teste garantem que ao longo de muitos anos, há uma probabilidade igual da resposta correta para qualquer um dos itens "A", "B", "C" ou "D". Eles afirmam que a probabilidade é essencialmente 25% de chance da resposta correta ser qualquer uma dessas alternativas. Agora, vamos dizer que você tem um palpite de que, talvez o teste tenha uma tendência para uma letra ou outra. Como você pode testar isso? Bem, você poderia começar com a hipótese nula e a hipótese alternativa. Aí, vamos poder realmente fazer um teste de hipóteses. Digamos que a hipótese nula, ou hipótese zero, seja a distribuição igual das escolhas corretas. Ou outra maneira de pensar sobre isso é que o item "A" estaria correto 25% das vezes. "B" estaria correto 25% das vezes, "C" estaria correto 25% das vezes e o item "D" estaria correto 25% das vezes. Agora, qual seria a nossa hipótese alternativa? Bem, a hipótese alternativa é que não seria uma distribuição igual. Agora, como vamos realmente testar isso? Bem, nós já vimos essa novela antes, pelo menos o início dela. Você tem a população de todos os itens potenciais aqui e você pode pegar uma amostra. Vamos dizer que pegamos uma amostra de 100 itens. Portanto, n = 100. E vamos anotar os dados que obtemos quando olhamos aqui para essa amostra. Portanto, esta é a escolha correta. E, então, este seria o número esperado, que você esperaria. E este é o número real. Bem, se isso ainda não fez sentido, não tem problema, nós vamos ver isso aqui agora. Há 4 diferentes escolhas, "A", "B", "C" ou "D" e há uma amostra de 100. Lembre-se, em qualquer teste de hipótese começamos a supor que a hipótese nula, a hipótese zero, é verdadeira. Então, o número esperado onde "A" é uma escolha correta seria 25% deste 100. Então, você esperaria 25 vezes que o item "A" fosse a escolha correta, 25 vezes "B" para ser a escolha correta, 25 vezes "C" para ela ser a escolha correta e 25 vezes "D" para essa ser a escolha correta. Mas, vamos supor que nós vamos encontrar resultados reais diferentes. Quando a gente olhar para estes 100 itens, perceberemos que "A" é a escolha correta 20 vezes, "B" é a escolha correta 20 vezes, "C" é a escolha correta 25 vezes e "D" é a escolha correta 35 vezes. Então, se você olhar apenas para isso aqui, talvez haja uma maior frequência "D". Mas talvez você diga: essa é apenas uma amostra, e apenas por acaso pode ter mais "D" do que outras. Existe alguma probabilidade de obter este resultado mesmo assumindo que a hipótese zero é verdadeira? Bem, este é o objetivo deste teste de hipótese. Sendo assim, é possível dizer qual é a probabilidade de obter um resultado pelo menos neste extremo? Se essa probabilidade está abaixo de algum limite, então tendemos a rejeitar a hipótese zero e aceitar uma alternativa. E estes limites você já viu antes. Vimos estes níveis de significância. Vamos dizer que definimos um nível de significância de 5%, ou seja, 0,05. Então, se a probabilidade de obter este resultado ou algo ainda mais diferente do esperado é menor que o nível de significância, então, rejeitamos a hipótese zero. Mas tudo isso leva a uma questão realmente interessante. Como calculamos uma probabilidade de obter um resultado extremo ou mais extremos? Como podemos medir isso? Para isso, precisamos introduzir uma nova estatística e, para muitos de vocês, uma nova letra grega. E esta é a letra grega maiúscula "qui" (χ), pode parecer um "X" maiúsculo para você, mas é um pouco mais curvo que o "X" tradicional. Claro, você pode pesquisar um pouco mais sobre isso. E esta estatística é chamada de "qui-quadrado" (χ²), que é uma forma de tirar a diferença entre o real e o esperado, e traduzir isso em um número. A distribuição qui-quadrado, eu realmente deveria dizer que são distribuições bem estudadas. E podemos usar isso para descobrir qual é a probabilidade de obter um resultado extremo ou mais extremo. Se isso for menor que o nosso nível de significância, rejeitamos a hipótese zero e sugerimos uma alternativa. Mas como calculamos a estatística qui-quadrado aqui? Bem, ela é razoavelmente intuitiva. O que fazemos é, para cada uma dessas categorias, neste caso, para cada uma dessas escolhas, nós olhamos para a diferença entre o real e o esperado. Então, para a escolha "A" diríamos que 20 é o real menos o esperado. Isso, ao quadrado. Aí, vamos dividir pelo que era esperado. Vamos adicionar com a mesma coisa para a escolha "B". Vamos dizer que o real é 20 e o esperado é 25. Então, teremos 20 - 25 e isso elevado ao quadrado. Depois, isso, sobre o esperado que é 25. Adicionamos novamente e vamos fazer a mesma coisa para a opção "C" 25 - 25. Nós sabemos onde isso vai acabar, não é? Aí, colocamos aqui ao quadrado, sobre o esperado que é 25. Finalmente, adicionamos e fazemos a mesma coisa para a escolha "D". Neste caso, teremos (35 - 25)² e tudo isso sobre 25. Agora, vamos calcular tudo isso. Isso vai ser (-5)². Então, vai ser 25. Isto aqui também vai ser 25, isto aqui vai ser zero e aqui 35 - 25 é 10. E 10² é 100. Agora, temos aqui 25 + 25 + 0 + 100 que é 150, e este 150 está sendo dividido por 25. Isso é igual a quanto? Bem, nossa estatística qui-quadrado aqui nesse exemplo saiu de uma forma muito limpa e bonita. Neste caso, a gente vai encontrar um resultado igual a 6. Mas nem sempre vai ser assim, tudo bem? Ótimo! Agora que calculamos, o que fazemos com isso? O que podemos fazer é olhar para distribuição qui-quadrado, para os graus de liberdade apropriados, e dizer qual é a probabilidade de obter uma estatística qui-quadrado que seja 6 ou maior. E para entender como uma distribuição qui-quadrado se parece, eu vou colocar este gráfico aqui. Aqui nós temos múltiplas distribuições qui-quadrado para valores diferentes de graus de liberdade. E para calcular os graus de liberdade, você olha para o número de categorias, o número de grupos. Neste caso, temos 4 categorias. Aí, você subtrai 1. Isso faz muito sentido, porque se você soubesse quantos "A", "B" e "C" existem, se você soubesse as proporções, até mesmo as proporções assumidas, você sempre pode calcular o quarto. É por isso que é 4 menos 1 graus de liberdade. Então, neste caso, o nosso grau de liberdade vai ser igual a 3. Por aqui, às vezes, pode ver isso descrito como "k". Então, k = 3. Sendo assim, se olharmos esta curva em azul claro, então estaremos olhando para distribuição o qui-quadrado onde o grau de liberdade é 3. Bem, nós queremos descobrir qual a probabilidade de obter uma estatística qui-quadrado que é 6 ou maior que 6, não é? Sendo assim, estaríamos olhando para essa área bem aqui. E você pode descobrir isso usando uma calculadora. Ou, se você estiver fazendo algum tipo de avaliação de estatística, por exemplo, você poderia usar as tabelas que são fornecidas. Uma tabela como essa pode ser bastante útil. Lembre-se, estamos lidando com uma situação onde temos 3 graus de liberdade. Tínhamos 4 categorias. Então, 4 - 1 = 3. E encontramos um valor qui-quadrado. Ou seja, nossa estatística qui-quadrado foi 6. Isto aqui nos diz que a probabilidade de obter 6,25 ou maior para o nosso valor qui-quadrado é 10%. Voltando aqui neste gráfico, o que a gente acabou de perceber? Que a probabilidade de 6,25 ou maior quando temos 3 graus de liberdade é 10%. Bem, isso é 10%. Então, a probabilidade de conseguir um valor qui-quadrado maior ou igual a 6, vai ser de 10%. Na verdade, maior ou igual a 10%. Também podemos ver isso como nosso valor "p". E assim a nossa probabilidade, assumindo a hipótese nula, é maior que 10%. Bem, isso é definitivamente maior do que o nosso nível de significância. E por causa disso, vamos falhar em rejeitar a nossa hipótese nula. Bem, meu amigo ou minha amiga, este é um exemplo em que na amostra nós encontramos mais "D". A probabilidade de conseguir um resultado, pelo menos tão extremo como o que a gente viu, vai ser um pouco maior que 10%. Eu espero que você tenha compreendido tudo direitinho o que a gente conversou aqui. E, mais uma vez, eu quero deixar para você um grande abraço e até a próxima!