Conteúdo principal
Estatística Avançada
Curso: Estatística Avançada > Unidade 7
Lição 3: Probabilidade condicional- Probabilidade condicional e independência
- Probabilidade condicional com o Teorema de Bayes
- Probabilidade condicional usando tabelas de contingência
- Cálculo da probabilidade condicional
- Probabilidade condicional e independência
- Exemplo de diagrama de árvore de probabilidade condicional
- Diagramas de árvore e probabilidade condicional
© 2023 Khan AcademyTermos de usoPolítica de privacidadeAviso de cookies
Exemplo de diagrama de árvore de probabilidade condicional
Como usar um diagrama de árvore para resolver uma questão de probabilidade condicional. Se alguém é reprovado em um teste de drogas, qual é a probabilidade de ele realmente estar usando drogas?
Quer participar da conversa?
Nenhuma postagem por enquanto.
Transcrição de vídeo
RKA3JV - Uma empresa faz
um teste de drogas ilegais com os candidatos, em uma determinada etapa
do processo de contratação. O teste específico que eles usam tem uma taxa de falso positivo de 2% e uma taxa de falso negativo de 1%. Suponha que 5%, de todos seus candidatos, estão realmente usando drogas ilegais, e selecionamos aleatoriamente
um candidato. Dado que o teste do candidato
deu positivo, qual é a probabilidade de ele
realmente utilizar drogas ilegais? Bom, primeiro vamos entender o que nós
acabamos de ler aqui. Aqui, está falando sobre uma
taxa de falso positivo de 2%. O que significa isso? Isso significa que em 2% dos casos, onde o teste deveria acusar negativo, porque a pessoa não
utilizou nenhuma droga, na verdade, o teste acaba
acusando positivo. Ou seja, mesmo se uma pessoa que
não utilizou drogas fizer o teste, ainda há 2% de chance de o teste acusar
que essa pessoa utilizou drogas, de dar resultado positivo. Também está falando aqui que
a taxa de falso negativo é de 1%. Isso significa que existe 1% de chances
de alguém, que utilizou drogas, passar no teste como se não
houvesse utilizado nenhuma droga. E aqui, está pedindo para supor que 5% de todos os candidatos realmente
utilizaram drogas. Bom, existem várias formas
de se resolver isso, mas uma das formas mais fáceis
é, simplesmente, pensar em um grande número de candidatos. Então, por exemplo, vamos pensar aqui que existiam 10 mil candidatos. Bom, este número 10 mil,
poderia ser outro número, mil,100 mil, ou algum
outro número grande. Mas eu escolhi 10 mil, porque eu acho que isso
vai facilitar as nossas contas. Então, o primeiro passo é separar estes
10 mil candidatos em dois grupos. O grupo que usa drogas e o grupo
que não usa drogas. Então, aqui nós já sabemos que
5% dessas pessoas utilizam drogas, então, 5% de 10 mil,
que seriam 500 pessoas. Essas 500 pessoas usam drogas. Então, o restante que seria
95% destas pessoas, e 95% de 10 mil são 9.500 pessoas. 9.500 pessoas não usam drogas. Então, essas pessoas que usam drogas
vão fazer o teste, e parte destas pessoas vão ser
acusadas com o resultado positivo e parte destas pessoas terão
o teste acusado como negativo. Então, nós sabemos aqui que
existe uma chance de 1% de dar negativo. Ou seja, pessoas que usam drogas
e o teste acusa como se elas não usassem. E 99% dessas pessoas, ou seja,
o resto, o teste daria certo. São pessoas que usam drogas e o teste
acusa como sendo pessoas que usam drogas. Então, 1% de 500 pessoas são 5 pessoas. O que daria, se dividíssemos 5 por 10 mil, seria equivalente a 0,05% das pessoas que fizeram o teste. E 99% de 500 seria o que restou aqui,
então, seria 495. Se nós dividirmos 495
por 10 mil candidatos, então, poderíamos encontrar a porcentagem
de pessoas nesta condição, que usam drogas e o teste deu positivo,
que seria 4,95%. Agora, vamos fazer a mesma coisa aqui com um grupo de pessoas
que não usam drogas. Nós também podemos separar
em dois grupos de pessoas. Os que deram resultados positivos
e os que deram resultado negativo. Nós sabemos que há uma chance
de 2% de haver um falso positivo. Então, falso positivo seriam
pessoas que não usam drogas, mas o teste acusa como se
elas tivessem usado. Então, 2% destas pessoas
o teste vai acusar como positivo. 2% de 9.500 pessoas vai ser 190 pessoas. Se nós dividirmos 190 pessoas, 190 candidatos por 10 mil candidatos, nós chegaremos na porcentagem de 1,9%. E o restante, então, daria resultado negativo,
que seria 9.310 pessoas. Se dividirmos 9.310 por 10.000
chegaremos à porcentagem de 93,10%. Agora, sim, acho que estamos
prontos para responder à questão. Dado que o teste do
candidato deu positivo, ou seja, o candidato
já está com o teste positivo, qual é a probabilidade dele
realmente utilizar drogas ilegais? Bom, se o teste do candidato
já deu positivo, então nós temos que selecionar,
entre essas pessoas, quais que estão com o teste positivo. Então, temos 495 pessoas aqui e 190 pessoas aqui. Vamos somá-las. Então, temos 495 + 190,
este é o nosso total de pessoas, o nosso espaço amostral. E agora queremos saber
qual a probabilidade de ele realmente utilizar drogas ilegais. Então, da somatória destas pessoas, quantas delas utilizam drogas? 495 pessoas. Então, vamos lá!
495 + 190 isso é igual a 685. E 495 dividido por 685, vamos fazer isso na calculadora,
495 / 685. Isso é igual a 0,72. Então é, aproximadamente, 72%. Então, isso aqui daria,
aproximadamente, 72%. Também podemos fazer este tipo de cálculo utilizando as porcentagens. Então, se somássemos
essa porcentagem aqui, 4,95 + 1,9. E aqui, colocaríamos 4,95, que é a porcentagem de pessoas
que utilizam drogas, que realmente utilizam drogas. Bom, o resultado, a gente vai acabar
chegando no mesmo resultado de 72%. E da mesma forma que calculamos qual era a probabilidade de alguém
que já estava com teste positivo realmente utilizar drogas, também podemos calcular
qual é a chance de alguém que teve resultado positivo,
e de não usar drogas. Então, o espaço amostral seria o mesmo. Seria 495 + 190. Só que em vez de 495 pessoas, agora estamos querendo calcular
a probabilidade de a pessoa não utilizar. Então, seriam estas 190 pessoas. Se fizermos essa conta aqui, veremos que vai dar,
aproximadamente, 28%. Que é o que falta aqui para dar 100%. Agora que chegamos nestes resultados, eu gostaria que você imaginasse
que estamos julgando alguém que realizou o teste
e o teste deu positivo. Você poderia pensar:
Oh! Este teste é muito bom, tem uma taxa baixíssima de 2% de falso positivo. Então, se o teste acusou
que essa pessoa usa drogas, então é porque provavelmente
ela usa drogas. Bom, estamos vendo aqui
pelos nossos cálculos que não é bem por aí, não é mesmo? Essa conclusão pode ser muito precipitada, mesmo se o teste tenha
acusado como positivo. Ou seja, mesmo se o teste acusar
que a pessoa utilizou drogas, ainda existe uma probabilidade de 28% da pessoa não ter utilizado
nenhum tipo de droga ilegal. E a razão para a gente se confundir, para este número aqui ser
muito maior do que este número, este 2%, é que existem muito mais
pessoas que não usam drogas do que pessoas que usam drogas. Então, este 2% aqui acaba incidindo sobre este número de pessoas, que é muito maior. Então, acaba gerando um número
de pessoas muito significativo dentro deste total de candidatos
que foram submetidos ao teste. Então, é isso que eu
queria falar para vocês. Eu vou terminando o vídeo por aqui e gostaria de dizer que eu acho
este assunto fascinante, não só por causa deste exemplo aqui
que tratamos hoje, mas porque este tipo de análise
é muito comum quando se quer saber a efetividade
de um medicamento ou de algum procedimento. Então, por isso é muito importante
saber fazer este tipo de análise.