If you're seeing this message, it means we're having trouble loading external resources on our website.

Se você está atrás de um filtro da Web, certifique-se que os domínios *.kastatic.org e *.kasandbox.org estão desbloqueados.

Conteúdo principal

Teste de hipóteses para diferença em proporções

Teste de hipóteses para diferença em proporções.

Transcrição de vídeo

o Olá meu amigo minha amiga tudo bem com você seja muito bem-vindo ou bem-vinda a mais um vídeo daquela Academy Brasil e nesse vídeo vamos conversar sobre o teste de hipóteses quando estamos pensando sobre a diferença entre proporções de duas populações diferentes para isso vamos observar aqui esse exemplo é dito que aqui estão os resultados de uma pesquisa recente que envolveu a amostragem de eleitores de 2 distritos vizinhos distrito a e distrito b e as pessoas foram questionadas que eles apoiaram ou não uma nova lei de cada distrito pegamos uma amostra de cem eleitores Assim somos capazes de calcular a proporção da amostra de quem apoiou a lei e aqui temos os dados combinados incluindo a proporção combinada foi perguntado aqui se isso sugere uma diferença significativa entre os dois distritos para responder essa pergunta a melhor coisa a se fazer é realizar um teste de hipótese EA forma de fazer isso é definindo é nula lembre-se de que nossa hipótese nula é aquela que assumiremos que não há diferença sendo assim Vamos considerar como verdadeiro que a proporção de pessoas no distrito a que apoia a nova lei é igual a proporção no distrito B que apoia a lei ou outra forma de pensar sobre isso é que a diferença entre as proporções é igual a zero já Nossa importa se alternativa é que a diferença absoluta entre as proporções não é igual a zero e se estivéssemos fazendo um teste de hipótese Total nós definiremos um nível de significância que gira aumente denotamos aqui com Alpha muitas vezes podemos ter um nível de significância ou cinco porcento aqui eu vou definir o nível de significância de cinco porcento aí depois de fazer isso a gente vai começar a sumir um do que a hipótese nula é verdadeira aí assumiu do que a hipótese nula é verdadeira a gente vai calcular a probabilidade de obter uma diferença entre nossas proporções da mostra que seja igual a esse extremo ou maior se a cidade por menor que o nosso nível de significância então rejeitar emos a hipótese nula sugeriria alternativa bem antes de irmos mais a fundo em nossa referência precisamos de verificar aquele condições para inferência e já vimos isso muitas vezes antes inicialmente temos a nossa condição aleatória onde precisamos estar confortáveis em dizer que as duas amostras aqui são verdadeiramente aleatórios o que de fato é aí também temos a nossa condição normal que para ser atendida é preciso que a gente tenha pelo menos dez sucessos e das falhas em cada uma dessas amostras e aqui observamos que temos pelo menos dez sucessos e pelo menos dez falhas em cada uma dessas amostras então também atendemos essa condição por último temos a condição de independência EA condição de independência atendida quando você está realizando amostras com substituição ou caso não seja com substituição você precisa que cada uma dessas amostras correspondem a um valor menor o centro da população bem acho que podemos assumir que existem pelo menos 10 mil pessoas no distrito a e pelo menos 10 mil pessoas no distrito b e isso permitirá atender a condição de independência agora com isso fora do caminho vamos assumir a hipótese nula e vamos começar pensando sobre amostragem de distribuição da diferença entre as proporções da amostra assumindo claro essa e quase nula Então a primeira coisa que eu quero pensar aqui é qual vai ser o desvio padrão da diferença das distribuições de amostragem bem Vimos um vídeo anterior quando falamos sobre diferenças de proporções que podemos pensar aqui sobre a variância da distribuição de amostras e existe uma anotação aqui para isso portanto a variância vai ser igual a variância da distribuição amostral da proporção da amostra do distrito a mais a variância da distribuição amostral da proporção da mostra do distrito B em geral você pode descobrir a variância da distribuição amostral de uma proporção de amostra com a seguinte fórmula é você sua antes a variância da distribuição amostral da proporção da amostra vai ser igual a nossa verdadeira proporção vezes um menos Nossa verdadeira proporção tudo isso sobre o tamanho da amostra agora em qualquer situação não sabemos as verdadeiras proporções para o distrito ar ou para o distrito B é por isso que estamos fazendo esse teste de hipótese para começar mas podemos tentar Este Mar isso lembre-se estamos assumindo que as verdadeiras proporções são iguais mesmo que a gente não saiba quais elas são e qual será a nossa melhor estimativa dessa verdadeira proporção se presumirmos que o distrito ai o distrito b não tem diferença em termos de números de pessoas que apoia a nova lei bem a melhor estimativa é realmente a morte da combinada a proporção da morte da combinado aqui então para estimar esses valores usamos essa proporção de amostra combinada no lugar de IP aqui aí eu podemos dizer que isso vai ser nossa proporção de amostra combinada vezes um menos Nossa proporção da amostra com e sobre o tamanho da nossa mostra e já que estamos assumindo que não há diferença entre o distrito aí o distrito B isso também se aplica isso aqui bem vamos escrever aqui embaixo então o desvio padrão O desvio padrão da distribuição amostral da diferença das proporções da amostra do distrito aí o do distrito B vai ser aproximadamente igual a lembre-se que não somos capazes de calcular o valor exato mas estamos usando essa proporção combinada como a nossa melhor estimativa Então vamos fazer uma raiz quadrada aqui um grande radical aí nesse radical colocamos 0,55 x 1 - 0,55 que é 0,45 tudo isso sobre sem Mas 0,55 é a mesma coisa novamente vezes 0,45 e lembre-se é isso porque estamos assumindo que a hipótese nula é verdadeira tudo isso sobre o tamanho da mostra que é sem agora podemos pegar a nossa calculadora aqui para realizar o k e assim temos aqui a raiz quadrada de 0,55 x 0,45 / sem agora poderia adicionar tudo isso de novo dentro da raiz mas eu posso simplesmente multiplicar isso aqui por dois aí clicando em igual temos um resultado aproximadamente igual à 0,07 logo isso vai ser aproximadamente igual à 0,07 Agora usando isso nós podemos calcular um z sendo assim podemos pensar sobre qual é a probabilidade de obter um certo valor dizer para esse extremo E aí com esse resultado vamos calcular a probabilidade e comparar com o nosso nível de significância o nosso Z é igual a diferença entre as proporções no caso peixapéu a menos peixapéu B sobre o nosso desvio padrão da distribuição de amostragem da diferença entre as proporções da amostra ou seja Vamos colocar isso aqui sobre 0,07 agora isso aqui vai ser igual a 0,5 ou menos 0,52 e a = 0,06 sobre 0,07 podemos pegar Nossa calculadora que para isso de novo assim vamos pegar aqui o 0,06 e dividir por 0,07 isso é aproximadamente igual a 0,86 Então isso é aproximadamente 0,86 qual é a probabilidade de obter algo tão extrema ou mais extremo bem vamos visualizar isso aqui em um gráfico se essa aqui é a nossa distribuição de amostragem da diferença entre nossas proporções de amostra estamos assumindo a hipótese nula então a média de nossa distribuição amostral vai ser igual a zero acabamos de obter um resultado que é menos que um desvio padrão Acima da Média isso aqui é um desvio padrão e Aqui nós temos dois desvios-padrões Acima da Média aqui temos um desvio padrão abaixo da média e aqui dois desvios-padrões abaixo acabamos de obter um resultado que nos coloca bem aqui aí se fosse perguntado qual a cidade de obter resultados pelo menos nesse extremo deveríamos considerar toda essa área aqui e também toda essa área aqui do outro lado e sabendo que isso é mais que trinta por cento Porque mesmo se você excluir um desvio padrão acima ou abaixo se você diz algo mais extremo do que isso então se você colocar essa área essa área você vai estar olhando para cerca de 31 ou trinta e dois por cento portanto a probabilidade de obter algo pelo menos nesse extremo vai ser de mais de trinta por cento e então definitivamente vai ser maior do que o nosso nível de significância na verdade é completamente razoável obter uma diferença nesse extremo se assumirmos que a hipótese nula é verdadeira em vídeos futuros podemos ir ainda mais fundo onde podemos apenas pesquisar e os em uma tabela Z para calcular essas áreas de mais precisamente para então compará-las com o nosso nível de significância as aqui não chega nem perto nós estamos nem perto de sermos capazes de rejeitar a hipótese nula então para a pergunta isso sugere uma diferença significativa entre os dois distritos não há resposta não bem Eu espero que você tenha compreendido tudo direitinho e mais uma vez eu quero deixar aqui para você um grande abraço e até a próxima