If you're seeing this message, it means we're having trouble loading external resources on our website.

Se você está atrás de um filtro da Web, certifique-se que os domínios *.kastatic.org e *.kasandbox.org estão desbloqueados.

Conteúdo principal

Técnicas de amostragem aleatória e prevenção ao viés

Técnicas de amostragem aleatória e prevenção ao viés.

Quer participar da conversa?

Você entende inglês? Clique aqui para ver mais debates na versão em inglês do site da Khan Academy.

Transcrição de vídeo

RKA14C Digamos que estamos em uma escola, e essa escola tem uma população. Bem aqui. Queremos fazer uma pesquisa sobre como os alunos se sentem a respeito da qualidade das aulas de matemática. Então, vamos elaborar um questionário. Agora precisamos decidir quem de fato responderá o questionário. Uma opção é perguntar para todo mundo dessa escola, todos os alunos dessa população. Mas vamos supor que essa é uma escola muito grande, com mais de 10 mil alunos. Nós não podemos simplesmente sair por aí perguntando para todo mundo, porque é muita gente. Então, pensamos: por que não fazer uma amostragem para ter uma indicação de como a escola inteira se sente? Então, decidimos fazer uma amostragem. Para evitar vieses e para ter uma amostragem mais fidedigna possível da nossa população, queremos que ela seja aleatória. A nossa amostra pode ser aleatória ou ela pode ser não aleatória. À primeira vista pode parecer simples, mas daqui a pouco você verá que não é tão simples assim conseguir uma amostra aleatória. Um tipo de amostragem aleatória é a amostragem aleatória simples. Um jeito de fazer isso é atribuir um número aleatório para cada estudante. Talvez eles já até tenham um número escolar. Então, eu recorro a um computador para gerar uma lista aleatória de, por exemplo, 100 alunos... Imaginando que nossa amostra seja de 100 alunos. É assim que nós fazemos uma amostragem aleatória simples. Simplesmente vamos até a população e selecionamos aleatoriamente indivíduos para compor nossa amostra. A seleção é aleatória porque utilizamos algum mecanismo de geração de números aleatórios para escolher os alunos. É um método muito bom. Não posso dizer que teremos um viés nessa amostra, mas ainda haverá a probabilidade de que nosso gerador de números aleatórios acabe selecionando um número desproporcional de meninos em relação às meninas. Ou, então, um número desproporcional de calouros em relação aos veteranos, e assim por diante. Então, mesmo que você faça uma amostragem aleatória simples, que é verdadeiramente aleatória, ainda assim ela pode não ser representativa para a população. Para amenizar isso, podemos recorrer a outras técnicas. Uma delas é estratificar a amostra. A ideia aqui é pegar a nossa população e estratificá-la. Vamos pensar que estamos com a mesma população. Vamos supor que estamos preocupados em ter uma mesma proporção de alunos do 1º, 2º, 3º, e 4º ano. Então, em vez de amostrar 100 alunos da população como um todo, nós iremos amostrar 25 alunos para cada um desses extratos. Isso vai nos garantir que ao menos teremos certa representatividade em relação aos anos escolares. Mas mesmo assim ainda poderíamos ser questionados sobre não estarmos fazendo uma boa representação de homens e mulheres. É provável que nesta amostragem de 100 alunos tenhamos uma proporção de 50 para 50. Mas ainda assim há uma chance de que, devido à aleatoriedade, tenhamos feito uma amostragem desproporcional entre homens e mulheres. O que podemos fazer para resolver isso? Bom, podemos utilizar uma técnica de agrupamento. Então, podemos montar grupos, e cada um desses grupos deve ter uma boa proporção de homens e mulheres. Por exemplo, em vez de amostrar indivíduos da população toda, você pode dividir essa população em grupos. Então, vamos dizer que isso são classes. Cada uma dessas classes tem uma distribuição equivalente de homens e mulheres. Ou pelo menos é bem próxima a uma distribuição equivalente. O que faremos é amostrar essas classes. É por isso que chamamos de agrupamento, porque nós iremos amostrar aleatoriamente essas classes. Cada uma terá um balanço exato, ou aproximado, entre homens e mulheres. Por isso sabemos que teremos uma boa representatividade. Nós ainda estamos amostrando, mas fazendo isso dentro dos grupos. Então, iremos amostrar cada indivíduo dentro desses grupos. Iremos selecionar todas as pessoas dentro dessas classes. Então, essas são as formas de se fazer um levantamento aleatório. Você pode fazer uma amostragem aleatória simples, você pode estratificar, ou você pode fazer agrupamentos e aleatoriamente selecionar um deles e amostrar todos os indivíduos do agrupamento. Bom, esses são os exemplos de amostragem aleatória. Então, como são as amostragens não aleatórias? Um caso de amostragem não aleatória é o levantamento voluntário ou amostra voluntária. Um exemplo disso pode acontecer assim: nós falamos para os alunos da escola "Olha aqui tem um link e, se você tiver interesse," "vem aqui, entra no site e preenche este formulário". Isso pode introduzir um viés. Por exemplo, podemos selecionar alunos que tendem a gostar de ensino de matemática da escola, pois eles até se dispõem a preencher o formulário. Ou então estamos a selecionar alunos que têm tempo para participar desse tipo de coisa. Enfim, é uma grande chance de introduzir um viés aqui, porque as pessoas estão se voluntariando para participar da pesquisa. Então, as pessoas podem se sentir mais ou menos à vontade para participar da pesquisa por "n" motivos, e isso pode acabar selecionando uma amostra não representativa. Outro tipo de amostragem não aleatória é a amostragem por conveniência. Ela também pode introduzir um viés. Um exemplo disso seria você decidir amostrar os primeiros alunos que chegarem à escola. Isso pode ser muito conveniente, porque aí você não precisa fazer uma amostragem aleatória, nem uma estratificação e muito menos um agrupamento. Nada disso. Mas veja só por que isso também vai introduzir um viés: porque, talvez, esses 100 primeiros alunos que chegaram à escola são aqueles mais diligentes. Ou então aqueles que sofrem mais pressão dos pais para estudar, para tirar notas boas, e assim por diante. Então, seguir uma amostragem conveniente pode causar viés, pode introduzir um viés. Existem outras formas de você introduzir viés dentro de seu levantamento. Por exemplo, com as palavras que você utiliza no questionário. Por exemplo, imagine que você formule a pergunta do questionário desta forma: "Você se acha sortudo por ter aulas de matemática," "sendo que pouquíssimas pessoas no mundo" "têm acesso a esse tipo de privilégio?". Esse é o tipo de pergunta tendenciosa, que vai estimular a pessoa a concordar que é sortuda. Então, as palavras escolhidas para montar o questionário são muito importantes, pois palavras mal escolhidas podem trazer vieses para pesquisa. Além disso, também temos o viés de resposta. Seria o caso das pessoas não quererem dizer a verdade, ou não se sentirem à vontade para serem sinceras. Às vezes, porque elas acham que vão ser expostas ou sofrer consequências por causa disso. Bom, esse foi um rápido panorama sobre amostragem, e como você pode fazê-la. Discutimos sobre o motivo para fazer amostragens aleatórias e por que elas reduzem a probabilidade de introduzir vieses. Falamos também de algumas técnicas para mitigar problemas de amostragem. Além disso, ainda conhecemos algumas fontes de vieses. Espero que agora que você as conheceu, fique mais fácil evitá-las!