Conteúdo principal
Estatística Avançada
Curso: Estatística Avançada > Unidade 12
Lição 1: Testes qui-quadrado para aderência- Estatística qui-quadrado para testes de hipóteses
- Exemplo de teste de aderência qui-quadrado
- Frequência esperada em um teste de aderência
- Condições para um teste de aderência qui-quadrado
- Estatística de teste e valor-p em um teste de aderência
- Conclusões de um teste de aderência
© 2023 Khan AcademyTermos de usoPolítica de privacidadeAviso de cookies
Estatística qui-quadrado para testes de hipóteses
Estatística qui-quadrado para testar hipóteses (teste de aderência qui-quadrado).
Quer participar da conversa?
Nenhuma postagem por enquanto.
Transcrição de vídeo
RKA3JV - Olá, meu amigo ou minha amiga!
Tudo bem com você? Seja muito bem-vindo ou bem-vinda a mais um vídeo da Khan Academy Brasil. Neste vídeo, vamos trabalhar com exemplos
sobre o qui-quadrado. Vamos supor que existe algum
tipo de exame padronizado onde cada pergunta no teste tem 4 opções. Escolha "A", escolha "B",
escolha "C" e escolha "D". E os elaboradores do teste garantem que ao longo de muitos anos, há uma probabilidade igual
da resposta correta para qualquer um dos
itens "A", "B", "C" ou "D". Eles afirmam que a probabilidade é essencialmente 25% de chance da resposta correta ser qualquer
uma dessas alternativas. Agora, vamos dizer que você
tem um palpite de que, talvez o teste tenha uma tendência
para uma letra ou outra. Como você pode testar isso? Bem, você poderia começar
com a hipótese nula e a hipótese alternativa. Aí, vamos poder realmente
fazer um teste de hipóteses. Digamos que a hipótese nula,
ou hipótese zero, seja a distribuição igual das
escolhas corretas. Ou outra maneira de pensar sobre isso é que o item "A" estaria
correto 25% das vezes. "B" estaria correto 25% das vezes, "C" estaria correto 25% das vezes e o item "D" estaria correto
25% das vezes. Agora, qual seria a nossa
hipótese alternativa? Bem, a hipótese alternativa é
que não seria uma distribuição igual. Agora, como vamos realmente testar isso? Bem, nós já vimos essa novela antes, pelo menos o início dela. Você tem a população de todos
os itens potenciais aqui e você pode pegar uma amostra. Vamos dizer que pegamos
uma amostra de 100 itens. Portanto, n = 100. E vamos anotar os dados
que obtemos quando olhamos aqui para essa amostra. Portanto, esta é a escolha correta. E, então, este seria o número esperado, que você esperaria. E este é o número real. Bem, se isso ainda não fez sentido, não tem problema,
nós vamos ver isso aqui agora. Há 4 diferentes escolhas,
"A", "B", "C" ou "D" e há uma amostra de 100. Lembre-se, em qualquer teste de hipótese começamos a supor que a hipótese nula,
a hipótese zero, é verdadeira. Então, o número esperado onde "A"
é uma escolha correta seria 25% deste 100. Então, você esperaria 25 vezes que o item "A" fosse a escolha correta, 25 vezes "B" para ser a escolha correta, 25 vezes "C" para ela ser
a escolha correta e 25 vezes "D" para essa ser
a escolha correta. Mas, vamos supor que nós vamos
encontrar resultados reais diferentes. Quando a gente olhar para estes 100 itens, perceberemos que "A"
é a escolha correta 20 vezes, "B" é a escolha correta 20 vezes, "C" é a escolha correta 25 vezes e "D" é a escolha correta 35 vezes. Então, se você olhar apenas
para isso aqui, talvez haja uma maior frequência "D". Mas talvez você diga:
essa é apenas uma amostra, e apenas por acaso pode ter
mais "D" do que outras. Existe alguma probabilidade
de obter este resultado mesmo assumindo que a
hipótese zero é verdadeira? Bem, este é o objetivo deste
teste de hipótese. Sendo assim, é possível dizer qual é a probabilidade de obter um
resultado pelo menos neste extremo? Se essa probabilidade está
abaixo de algum limite, então tendemos a rejeitar a hipótese zero e aceitar uma alternativa. E estes limites você já viu antes. Vimos estes níveis de significância. Vamos dizer que definimos
um nível de significância de 5%, ou seja, 0,05. Então, se a probabilidade
de obter este resultado ou algo ainda mais diferente do esperado é menor que o nível de significância, então, rejeitamos a hipótese zero. Mas tudo isso leva a uma
questão realmente interessante. Como calculamos uma probabilidade de obter um resultado extremo
ou mais extremos? Como podemos medir isso? Para isso, precisamos introduzir
uma nova estatística e, para muitos de vocês, uma nova letra grega. E esta é a letra grega
maiúscula "qui" (χ), pode parecer um "X" maiúsculo para você, mas é um pouco mais curvo
que o "X" tradicional. Claro, você pode pesquisar
um pouco mais sobre isso. E esta estatística é chamada
de "qui-quadrado" (χ²), que é uma forma de tirar a diferença
entre o real e o esperado, e traduzir isso em um número. A distribuição qui-quadrado, eu realmente deveria dizer que
são distribuições bem estudadas. E podemos usar isso para descobrir qual é a probabilidade de obter
um resultado extremo ou mais extremo. Se isso for menor que o
nosso nível de significância, rejeitamos a hipótese zero e sugerimos uma alternativa. Mas como calculamos a estatística
qui-quadrado aqui? Bem, ela é razoavelmente intuitiva. O que fazemos é,
para cada uma dessas categorias, neste caso, para cada uma dessas escolhas, nós olhamos para a diferença
entre o real e o esperado. Então, para a escolha "A"
diríamos que 20 é o real menos o esperado. Isso, ao quadrado. Aí, vamos dividir pelo que era esperado. Vamos adicionar com a mesma coisa
para a escolha "B". Vamos dizer que o real é 20
e o esperado é 25. Então, teremos 20 - 25 e isso elevado ao quadrado. Depois, isso, sobre o esperado que é 25. Adicionamos novamente e vamos fazer
a mesma coisa para a opção "C" 25 - 25. Nós sabemos onde isso vai acabar, não é? Aí, colocamos aqui ao quadrado, sobre o esperado que é 25. Finalmente, adicionamos e fazemos
a mesma coisa para a escolha "D". Neste caso, teremos (35 - 25)² e tudo isso sobre 25. Agora, vamos calcular tudo isso. Isso vai ser (-5)². Então, vai ser 25. Isto aqui também vai ser 25, isto aqui vai ser zero e aqui 35 - 25 é 10. E 10² é 100. Agora, temos aqui 25 + 25 + 0 + 100 que é 150, e este 150 está sendo dividido por 25. Isso é igual a quanto? Bem, nossa estatística qui-quadrado
aqui nesse exemplo saiu de uma forma muito limpa e bonita. Neste caso, a gente vai encontrar
um resultado igual a 6. Mas nem sempre vai ser assim, tudo bem? Ótimo! Agora que calculamos,
o que fazemos com isso? O que podemos fazer é olhar
para distribuição qui-quadrado, para os graus de liberdade apropriados, e dizer qual é a probabilidade de obter
uma estatística qui-quadrado que seja 6 ou maior. E para entender como uma distribuição
qui-quadrado se parece, eu vou colocar este gráfico aqui. Aqui nós temos múltiplas
distribuições qui-quadrado para valores diferentes
de graus de liberdade. E para calcular os graus de liberdade, você olha para o número de categorias, o número de grupos. Neste caso, temos 4 categorias. Aí, você subtrai 1. Isso faz muito sentido,
porque se você soubesse quantos "A", "B" e "C" existem, se você soubesse as proporções, até mesmo as proporções assumidas, você sempre pode calcular o quarto. É por isso que é 4 menos 1
graus de liberdade. Então, neste caso, o nosso grau de liberdade
vai ser igual a 3. Por aqui, às vezes, pode ver isso
descrito como "k". Então, k = 3. Sendo assim, se olharmos
esta curva em azul claro, então estaremos olhando
para distribuição o qui-quadrado onde o grau de liberdade é 3. Bem, nós queremos descobrir qual a probabilidade de obter
uma estatística qui-quadrado que é 6 ou maior que 6, não é? Sendo assim, estaríamos olhando
para essa área bem aqui. E você pode descobrir isso
usando uma calculadora. Ou, se você estiver fazendo algum tipo
de avaliação de estatística, por exemplo, você poderia usar as tabelas
que são fornecidas. Uma tabela como essa
pode ser bastante útil. Lembre-se, estamos lidando com uma
situação onde temos 3 graus de liberdade. Tínhamos 4 categorias. Então, 4 - 1 = 3. E encontramos um valor qui-quadrado. Ou seja, nossa estatística
qui-quadrado foi 6. Isto aqui nos diz que a probabilidade
de obter 6,25 ou maior para o nosso valor
qui-quadrado é 10%. Voltando aqui neste gráfico, o que a gente acabou de perceber? Que a probabilidade de 6,25 ou maior quando temos 3 graus de liberdade é 10%. Bem, isso é 10%. Então, a probabilidade de conseguir
um valor qui-quadrado maior ou igual a 6,
vai ser de 10%. Na verdade, maior ou igual a 10%. Também podemos ver isso
como nosso valor "p". E assim a nossa probabilidade, assumindo a hipótese nula, é maior que 10%. Bem, isso é definitivamente maior
do que o nosso nível de significância. E por causa disso,
vamos falhar em rejeitar a nossa hipótese nula. Bem, meu amigo ou minha amiga, este é um exemplo em que na amostra
nós encontramos mais "D". A probabilidade de conseguir um resultado, pelo menos tão extremo
como o que a gente viu, vai ser um pouco maior que 10%. Eu espero que você tenha compreendido tudo direitinho o que
a gente conversou aqui. E, mais uma vez, eu quero deixar
para você um grande abraço e até a próxima!