Conteúdo principal
Estatística Avançada
Curso: Estatística Avançada > Unidade 6
Lição 3: Amostragem aleatória e coleção de dadosTécnicas de amostragem aleatória e prevenção ao viés
Técnicas de amostragem aleatória e prevenção ao viés.
Transcrição de vídeo
RKA14C Digamos que estamos
em uma escola, e essa escola tem
uma população. Bem aqui. Queremos fazer uma pesquisa
sobre como os alunos se sentem a respeito da qualidade
das aulas de matemática. Então, vamos elaborar um questionário. Agora precisamos decidir quem
de fato responderá o questionário. Uma opção é perguntar
para todo mundo dessa escola, todos os alunos dessa população. Mas vamos supor que essa é
uma escola muito grande, com mais de 10 mil alunos. Nós não podemos simplesmente sair
por aí perguntando para todo mundo, porque é muita gente. Então, pensamos: por que não
fazer uma amostragem para ter uma indicação de
como a escola inteira se sente? Então, decidimos fazer
uma amostragem. Para evitar vieses e
para ter uma amostragem mais fidedigna possível
da nossa população, queremos que ela seja aleatória. A nossa amostra pode ser aleatória ou ela pode ser não aleatória. À primeira vista
pode parecer simples, mas daqui a pouco você verá
que não é tão simples assim conseguir uma amostra aleatória. Um tipo de amostragem aleatória é a amostragem aleatória simples. Um jeito de fazer isso é atribuir um número aleatório
para cada estudante. Talvez eles já até tenham
um número escolar. Então, eu recorro a um computador para gerar uma lista aleatória
de, por exemplo, 100 alunos... Imaginando que nossa amostra
seja de 100 alunos. É assim que nós fazemos
uma amostragem aleatória simples. Simplesmente vamos até a população e selecionamos aleatoriamente indivíduos para compor nossa amostra. A seleção é aleatória porque
utilizamos algum mecanismo de geração de números aleatórios para escolher os alunos. É um método muito bom. Não posso dizer que teremos
um viés nessa amostra, mas ainda haverá a probabilidade de que nosso gerador
de números aleatórios acabe selecionando
um número desproporcional de meninos em relação às meninas. Ou, então, um número desproporcional de calouros em relação aos veteranos, e assim por diante. Então, mesmo que você faça
uma amostragem aleatória simples, que é verdadeiramente aleatória, ainda assim ela pode não ser
representativa para a população. Para amenizar isso, podemos
recorrer a outras técnicas. Uma delas é estratificar a amostra. A ideia aqui é pegar a nossa população
e estratificá-la. Vamos pensar que estamos
com a mesma população. Vamos supor que estamos preocupados em ter uma mesma proporção
de alunos do 1º, 2º, 3º, e 4º ano. Então, em vez de amostrar 100 alunos
da população como um todo, nós iremos amostrar 25 alunos
para cada um desses extratos. Isso vai nos garantir que ao menos
teremos certa representatividade em relação aos anos escolares. Mas mesmo assim ainda
poderíamos ser questionados sobre não estarmos fazendo uma boa representação
de homens e mulheres. É provável que nesta
amostragem de 100 alunos tenhamos uma proporção
de 50 para 50. Mas ainda assim
há uma chance de que, devido à aleatoriedade, tenhamos feito uma
amostragem desproporcional entre homens e mulheres. O que podemos fazer
para resolver isso? Bom, podemos utilizar
uma técnica de agrupamento. Então, podemos montar grupos, e cada um desses grupos deve ter uma boa proporção
de homens e mulheres. Por exemplo, em vez de amostrar
indivíduos da população toda, você pode dividir
essa população em grupos. Então, vamos dizer
que isso são classes. Cada uma dessas classes tem
uma distribuição equivalente de homens e mulheres. Ou pelo menos é bem próxima
a uma distribuição equivalente. O que faremos é amostrar essas classes. É por isso que chamamos de agrupamento, porque nós iremos amostrar
aleatoriamente essas classes. Cada uma terá um balanço exato, ou aproximado,
entre homens e mulheres. Por isso sabemos que teremos
uma boa representatividade. Nós ainda estamos amostrando, mas fazendo isso dentro dos grupos. Então, iremos amostrar cada indivíduo
dentro desses grupos. Iremos selecionar todas as pessoas
dentro dessas classes. Então, essas são as formas de se fazer
um levantamento aleatório. Você pode fazer uma
amostragem aleatória simples, você pode estratificar, ou você pode fazer agrupamentos e aleatoriamente selecionar um deles e amostrar todos os indivíduos
do agrupamento. Bom, esses são os exemplos
de amostragem aleatória. Então, como são as amostragens
não aleatórias? Um caso de amostragem não aleatória
é o levantamento voluntário ou amostra voluntária. Um exemplo disso
pode acontecer assim: nós falamos para os alunos da escola "Olha aqui tem um link
e, se você tiver interesse," "vem aqui, entra no site e
preenche este formulário". Isso pode introduzir um viés. Por exemplo, podemos selecionar alunos que tendem a gostar de ensino
de matemática da escola, pois eles até se dispõem
a preencher o formulário. Ou então estamos a selecionar alunos que têm tempo para participar
desse tipo de coisa. Enfim, é uma grande chance
de introduzir um viés aqui, porque as pessoas
estão se voluntariando para participar da pesquisa. Então, as pessoas podem
se sentir mais ou menos à vontade para participar da pesquisa
por "n" motivos, e isso pode acabar selecionando
uma amostra não representativa. Outro tipo de amostragem não aleatória
é a amostragem por conveniência. Ela também pode introduzir um viés. Um exemplo disso seria
você decidir amostrar os primeiros alunos
que chegarem à escola. Isso pode ser muito conveniente,
porque aí você não precisa fazer uma amostragem aleatória, nem uma estratificação
e muito menos um agrupamento. Nada disso. Mas veja só por que isso também
vai introduzir um viés: porque, talvez, esses 100 primeiros
alunos que chegaram à escola são aqueles mais diligentes. Ou então aqueles que sofrem
mais pressão dos pais para estudar, para tirar notas boas, e assim por diante. Então, seguir uma amostragem
conveniente pode causar viés, pode introduzir um viés. Existem outras formas de você introduzir
viés dentro de seu levantamento. Por exemplo, com as palavras que
você utiliza no questionário. Por exemplo, imagine que
você formule a pergunta do questionário desta forma: "Você se acha sortudo por
ter aulas de matemática," "sendo que pouquíssimas
pessoas no mundo" "têm acesso a esse tipo de privilégio?". Esse é o tipo de pergunta tendenciosa, que vai estimular a pessoa
a concordar que é sortuda. Então, as palavras escolhidas
para montar o questionário são muito importantes,
pois palavras mal escolhidas podem trazer vieses para pesquisa. Além disso, também temos
o viés de resposta. Seria o caso das pessoas
não quererem dizer a verdade, ou não se sentirem à vontade
para serem sinceras. Às vezes, porque elas acham
que vão ser expostas ou sofrer consequências
por causa disso. Bom, esse foi um rápido panorama
sobre amostragem, e como você pode fazê-la. Discutimos sobre o motivo
para fazer amostragens aleatórias e por que elas reduzem
a probabilidade de introduzir vieses. Falamos também de algumas técnicas
para mitigar problemas de amostragem. Além disso, ainda conhecemos
algumas fontes de vieses. Espero que agora que você as conheceu, fique mais fácil evitá-las!