If you're seeing this message, it means we're having trouble loading external resources on our website.

Se você está atrás de um filtro da Web, certifique-se que os domínios *.kastatic.org e *.kasandbox.org estão desbloqueados.

Conteúdo principal

Exemplos de viés em pesquisas

Exemplos de viés em pesquisas.

Quer participar da conversa?

Nenhuma postagem por enquanto.
Você entende inglês? Clique aqui para ver mais debates na versão em inglês do site da Khan Academy.

Transcrição de vídeo

RKA1JV - David tem um podcast e está curioso em saber quantos ouvintes gostam do seu show. Ele decide começar com uma pesquisa online ele pede para seus ouvintes visitarem seu website e participar da pesquisa. A pesquisa mostra que 89% dos 200 respondentes amam o seu show. Questão A: qual a fonte de viés mais preocupante neste cenário? Agora você pode pausar o vídeo e tentar descobrir por você mesmo. Depois, você volta aqui para conferir comigo. Vamos pensar a respeito disso. David tem sua população de ouvintes, aqui está a sua população de ouvintes. Vou presumir que essa população é maior do que 200 pessoas. Ele pensa: acho que preciso de uma amostra, porque não conseguiria ouvir todos os meus ouvintes. Vamos supor que talvez ele tenha 10.000 ouvintes. Não foi dito isso aqui, mas estamos apenas supondo. E ele continua pensando: eu quero saber da porcentagem de ouvintes que gostam do meu show. Para isso, eu preciso ter uma amostra. Mas em vez de pegar uma amostra realmente aleatória, ele pede que eles se voluntariem, ele pede para que seus ouvintes visitem seu site. Esta é uma clássica amostragem de respostas voluntárias. E essa aqui não é uma amostragem aleatória, porque quem decide visitar o site, quem o ouve, quem acompanha as coisas que ele fala, e faz as coisas que ele pede no podcast, isso não é aleatório. Na verdade, ele acabou selecionando as pessoas mais prováveis a fazer isso. Então, vamos representar essas pessoas aqui. Essas pessoas são as que responderam ao questionário. Temos 200 respondentes aqui. São pessoas que já gostam do David e seguem as as coisas que ele pede para fazer. O restante das pessoas que não seguem o David, que não fazem as coisas que ele pede, são essas daqui. E é menos provável que essas pessoas decidam entrar no website apenas para responder a uma pesquisa. Ou, então, você ainda pode ter extremos: pessoas que odeiam o David, mas fazem todo o processo, respondem o questionário porque querem demonstrar seu ódio por ele ou algo do tipo. Nesse caso, podemos assumir que é mais provável que grande parte dessas pessoas aqui, dessas 200 pessoas, sejam respondentes que são fãs do David. São pessoas que gostam dele e, por causa disso, 89% é um valor superestimado. Existem outras formas de viés, como o viés da resposta. As pessoas podem não ser totalmente sinceras em suas respostas. Principalmente, devido ao conteúdo da pergunta ou como é formulada. O exemplo clássico disso seria perguntas do tipo: "Você mentiu para os seus pais semana passada?" "Você já traiu seu parceiro?" "Você fuma? Você usa drogas?" Para perguntas desse tipo, as pessoas podem evitar ser completamente honestas. Talvez não queiram compartilhar esse tipo de informação. Então, nesse caso, você terá um viés de resposta. Mas para o exemplo que estamos discutindo aqui, não é esse o caso. Subcobertura é quando a forma que você está amostrando definitivamente vai fazer você perder em representatividade. Vai fazer com que você perca representatividade de parte da população. A resposta voluntária também pode fazer perdermos em termos de representatividade. Por exemplo, pessoas que não entrariam no website. Mas no caso da subcobertura, essa questão é bem mais explícita. Então, não se trata disso também. Agora vamos para outro caso. Imagine que, em um universo paralelo, David quer saber a mesma coisa, mas vai tentar uma amostragem diferente. David ainda tem um podcast, e ele também está curioso para saber quantos ouvintes gostam do seu show. Mas agora ele decide fazer uma pesquisa com os próximos 100 ouvintes que enviarem e-mails de fã. E não foram todos que responderam, mas 94 de 97 ouvintes pesquisados disseram amar o seu show. Então, novamente, qual é a fonte de viés mais preocupante nesse cenário? Ele pode estar pensando: bem, tem uma amostra bem aqui nas minhas mão, está no meu e-mail, por que não utilizá-la? Isso é bem conveniente. Temos aqui, então, um exemplo clássico de amostragem conveniente. Isso é quase como amostrar as 100 primeiras pessoas que cruzam por uma porta. Neste caso, você poderia até argumentar se isso é aleatório mesmo ou não. Mas, selecionar os próximos 100 ouvintes que mandarem e-mails de fã? Essas pessoas estão inclinadas a ter uma opinião positiva sobre você. Não vai funcionar. Novamente, o resultado que obtemos é superestimado. Não-respostas é quando você pede para que pessoas respondam o questionário e, por alguma razão, uma parte delas não preenche o questionário. Mas não é isso que acontece aqui. Ele mandou 100 questionários e 97 ouvintes responderam, apenas 3 não responderam. Concordo que ainda é uma fonte de viés, mas não é a fonte mais preocupante. Nós estamos procurando pela fonte mais preocupante de viés. Amostragem de respostas voluntárias. Ele não fez como da outra vez, pedindo que pessoas visitassem seu website. Concordo que existe um pouco de resposta voluntária aqui, porque ele enviou e-mails para as pessoas e pediu para que respondessem a um questionário. Então, temos 97 pessoas que responderam ao questionário. Mas, novamente, mesmo que seja uma fonte de viés, essa aqui está longe de ser ainda mais preocupante. Então, a fonte de viés mais preocupante é a de amostragem por conveniência. E ela vai ser superestimada em termos de representatividade da população de ouvintes.