Conteúdo principal
Estatística e probabilidade
Curso: Estatística e probabilidade > Unidade 6
Lição 2: Estudos observacionais e de amostragem- Amostras razoáveis
- Afirmações válidas
- Fazendo inferências a partir de amostras aleatórias
- Como identificar uma amostra e uma população
- Identifique a população e a amostra
- Exemplos de viés em pesquisas
- Exemplo de subcobertura inserindo viés
- Correlação e causalidade
- Como identificar viés em amostras e pesquisas
- Simulação e aleatoriedade: tabelas de algarismos aleatórios
© 2023 Khan AcademyTermos de usoPolítica de privacidadeAviso de cookies
Exemplos de viés em pesquisas
Exemplos de viés em pesquisas.
Quer participar da conversa?
Nenhuma postagem por enquanto.
Transcrição de vídeo
RKA1JV - David tem um podcast
e está curioso em saber quantos ouvintes gostam do seu show. Ele decide começar com uma pesquisa online ele pede para seus ouvintes visitarem seu website
e participar da pesquisa. A pesquisa mostra que 89%
dos 200 respondentes amam o seu show. Questão A: qual a fonte de viés
mais preocupante neste cenário? Agora você pode pausar o vídeo e tentar descobrir por você mesmo. Depois, você volta aqui
para conferir comigo. Vamos pensar a respeito disso. David tem sua população de ouvintes, aqui está a sua população de ouvintes. Vou presumir que essa população
é maior do que 200 pessoas. Ele pensa: acho que preciso de uma amostra, porque não conseguiria
ouvir todos os meus ouvintes. Vamos supor que talvez
ele tenha 10.000 ouvintes. Não foi dito isso aqui, mas estamos apenas supondo. E ele continua pensando: eu quero saber da porcentagem
de ouvintes que gostam do meu show. Para isso, eu preciso ter uma amostra. Mas em vez de pegar uma
amostra realmente aleatória, ele pede que eles se voluntariem, ele pede para que seus
ouvintes visitem seu site. Esta é uma clássica amostragem
de respostas voluntárias. E essa aqui não é uma
amostragem aleatória, porque quem decide visitar o site, quem o ouve, quem acompanha
as coisas que ele fala, e faz as coisas que ele pede no podcast, isso não é aleatório. Na verdade, ele acabou selecionando as pessoas mais prováveis a fazer isso. Então, vamos representar
essas pessoas aqui. Essas pessoas são as que
responderam ao questionário. Temos 200 respondentes aqui. São pessoas que já gostam do David e seguem as as coisas
que ele pede para fazer. O restante das pessoas
que não seguem o David, que não fazem as coisas que ele pede, são essas daqui. E é menos provável que essas
pessoas decidam entrar no website apenas para responder a uma pesquisa. Ou, então, você ainda
pode ter extremos: pessoas que odeiam o David, mas fazem todo o processo, respondem o questionário porque
querem demonstrar seu ódio por ele ou algo do tipo. Nesse caso, podemos assumir que é mais provável que grande
parte dessas pessoas aqui, dessas 200 pessoas, sejam respondentes que são fãs do David. São pessoas que gostam dele e, por causa disso, 89%
é um valor superestimado. Existem outras formas de viés,
como o viés da resposta. As pessoas podem não ser totalmente
sinceras em suas respostas. Principalmente, devido ao conteúdo
da pergunta ou como é formulada. O exemplo clássico disso
seria perguntas do tipo: "Você mentiu para os seus
pais semana passada?" "Você já traiu seu parceiro?" "Você fuma? Você usa drogas?" Para perguntas desse tipo, as pessoas podem evitar
ser completamente honestas. Talvez não queiram compartilhar
esse tipo de informação. Então, nesse caso,
você terá um viés de resposta. Mas para o exemplo que estamos
discutindo aqui, não é esse o caso. Subcobertura é quando a forma
que você está amostrando definitivamente vai fazer você
perder em representatividade. Vai fazer com que você perca
representatividade de parte da população. A resposta voluntária também pode fazer perdermos em termos de representatividade. Por exemplo, pessoas que não
entrariam no website. Mas no caso da subcobertura, essa questão é bem mais explícita. Então, não se trata disso também. Agora vamos para outro caso. Imagine que, em um universo paralelo, David quer saber a mesma coisa, mas vai tentar uma amostragem diferente. David ainda tem um podcast, e ele também está curioso para saber
quantos ouvintes gostam do seu show. Mas agora ele decide fazer uma pesquisa com os próximos 100 ouvintes
que enviarem e-mails de fã. E não foram todos que responderam, mas 94 de 97 ouvintes pesquisados
disseram amar o seu show. Então, novamente, qual é a fonte de viés mais preocupante nesse cenário? Ele pode estar pensando: bem, tem uma amostra
bem aqui nas minhas mão, está no meu e-mail,
por que não utilizá-la? Isso é bem conveniente. Temos aqui, então, um exemplo clássico
de amostragem conveniente. Isso é quase como amostrar as 100 primeiras pessoas
que cruzam por uma porta. Neste caso, você poderia até argumentar se isso é aleatório mesmo ou não. Mas, selecionar os próximos 100 ouvintes
que mandarem e-mails de fã? Essas pessoas estão inclinadas
a ter uma opinião positiva sobre você. Não vai funcionar. Novamente, o resultado que
obtemos é superestimado. Não-respostas é quando você pede
para que pessoas respondam o questionário e, por alguma razão, uma parte
delas não preenche o questionário. Mas não é isso que acontece aqui. Ele mandou 100 questionários
e 97 ouvintes responderam, apenas 3 não responderam. Concordo que ainda é uma fonte de viés, mas não é a fonte mais preocupante. Nós estamos procurando pela
fonte mais preocupante de viés. Amostragem de respostas voluntárias. Ele não fez como da outra vez, pedindo que pessoas
visitassem seu website. Concordo que existe um pouco
de resposta voluntária aqui, porque ele enviou e-mails para as pessoas e pediu para que respondessem
a um questionário. Então, temos 97 pessoas que
responderam ao questionário. Mas, novamente, mesmo que
seja uma fonte de viés, essa aqui está longe de
ser ainda mais preocupante. Então, a fonte de viés mais preocupante
é a de amostragem por conveniência. E ela vai ser superestimada em termos de representatividade
da população de ouvintes.