If you're seeing this message, it means we're having trouble loading external resources on our website.

Se você está atrás de um filtro da Web, certifique-se que os domínios *.kastatic.org e *.kasandbox.org estão desbloqueados.

Conteúdo principal

Calcular o valor-p dada uma estatística-z

Exemplo mostrando como usar uma tabela normal padrão para estimar um valor-p.

Quer participar da conversa?

Você entende inglês? Clique aqui para ver mais debates na versão em inglês do site da Khan Academy.

Transcrição de vídeo

RKA3JV - E aí, pessoal! Tudo bem? Nesta aula, nós vamos calcular o valor "p" dada uma estatística "z". E, para isso, temos um exercício aqui. Fabiana leu um artigo que dizia que 26% dos habitantes do seu país conseguem falar mais de um idioma. Ela ficou curiosa para saber se este número era maior na sua cidade e, por causa disso, ela testou a hipótese nula que, neste caso, é que 26% das pessoas em sua cidade sabiam falar mais de um idioma, contra a hipótese alternativa que, neste caso, é que mais do que 26% das pessoas em sua cidade sabem falar mais do que um idioma, onde "p" representa a proporção de pessoas na cidade de Fabiana que conseguem falar mais de um idioma. Ela descobriu que 40 de 120 pessoas da amostra conseguem falar mais de um idioma. Isso significa que nós temos a população aqui e a Fabiana pega uma amostra de 120 pessoas. Ou seja, n = 120. E ela calcula a proporção de pessoas que estão desempregadas nessa amostra que, neste caso, é 40 em 120. E se nós simplificarmos isso, vai ser igual a 1/3, que vai ser aproximadamente 0,33. Com isso, o teste para estes resultados foi de "z" igual a aproximadamente 1,83. E nós falamos deste "z" aqui em aulas passadas. Basicamente, nós queremos saber quantos desvios-padrão estão acima da proporção assumida. Ou seja, quando estamos fazendo um teste de significância assumindo que essa hipótese nula é verdadeira, nós estamos descobrindo qual é a probabilidade de conseguir algo como isso ou mais. Ou seja, o quanto está fugindo da proporção da hipótese nula. E se essa probabilidade estiver abaixo de um limite, que, no caso, é o nível de significância, então, nós rejeitamos essa hipótese nula. Com isso, a hipótese alternativa seria a correta. O "z" é, basicamente, isso. Quantos desvios-padrão estão acima da proporção da hipótese nula. E nós também vimos, em aulas anteriores, que este "z" era calculado como a diferença entre esta proporção e esta aqui. Então, 0,33 - 0,26 e nós dividimos isso pelo desvio-padrão da distribuição amostral das proporções da amostra. Ou seja, nós dividiríamos pela raiz quadrada de p₀, que multiplica 1 - p₀, dividido pelo "n". E, no nosso caso particular aqui, nós vamos ter 0,26 que multiplica 1, menos 0,26 / n. E n = 120. Então, dividido por 120. E se você calcular isto aqui, vai ser aproximadamente 1,83. E assumindo que as condições necessárias foram atendidas, isso significa que a condição aleatória, a condição normal e a condição de independência foram atendidas. Qual é o valor "p" aproximado para o teste de Fabiana? E o valor "p" pode ser calculado como a probabilidade de uma distribuição normal, isso assumindo que a amostra é normal, de "z" ser maior ou igual a 1,83. Para entender isso, vamos utilizar um gráfico aqui. Aqui eu tenho a minha distribuição normal e a média da distribuição está aqui que neste caso é este 0,26. Então, eu vou colocar aqui p₀ = 0,26. Isso porque é a proporção da hipótese nula. E este resultado aqui diz que o desvio-padrão é de 1,83. Ou seja, 1,83 acima da média da distribuição da amostra. Então, este aqui seria o desvio-padrão de 1,83. Então, o que queremos aqui é esta área na curva normal. E para fazer isso, vamos utilizar a nossa tabela "z". Eu coloquei uma aqui ao lado. E observe que nesta curva aqui a área está à esquerda de um certo valor "z". Mas o que nós queremos é o valor à direita de um certo valor "z". Mas, lembre-se, uma distribuição normal é simétrica. Por causa disso, ao invés de dizermos que uma coisa é maior que a média 1,83, nós podemos dizer que esta coisa é 1,83 menor. Portanto, é 1,83 menor do que a média. E para achar isso na tabela, nós podemos desmembrar este -1,83, escrevendo-o como -1,8 - 0,03. E se consultarmos a tabela, deixe-me descer aqui, -1,8 vai estar aqui. E fazemos a ligação com 0,03 achando este valor aqui. Portanto, voltando para o nosso valor "p", podemos dizer que ele é aproximadamente 0,0336. E com isso em mente, a Fabiana pegaria este valor e compararia com o nível de significância, que deve ser definido antes de realizar o teste. E se, por exemplo, este nível de significância fosse de 5%, o nosso valor "p" seria menor. Com isso, ela deveria rejeitar a hipótese nula, validando a hipótese alternativa. Mas se, por exemplo, ela tivesse um nível de significância de 1%, então, este valor seria maior. E, com isso, ela não conseguiria rejeitar a hipótese nula. E eu espero que esta aula tenha lhes ajudado. Até a próxima, pessoal!