Conteúdo principal
Estatística Avançada
Curso: Estatística Avançada > Unidade 1
Lição 4: Estatísticas de duas variáveis categóricasDistribuições marginais e condicionais
Distribuições marginais e condicionais de uma tabela de contingência (ou distribuição conjunta).
Quer participar da conversa?
Nenhuma postagem por enquanto.
Transcrição de vídeo
RKA4JL - E aí, pessoal, tudo bem? Para isso, nós dividimos em intervalos de tempo estudados
e também em intervalos de porcentagem. Com isso nós poderíamos pesquisar os alunos
e observar os dados das pontuações no teste. E claro, os dados dos alunos estão nessa tabela aqui, Olhando para esse 20 aqui,
significa que 20 alunos em um total de 200 alunos conseguiram entre 60 e 79% no teste
e estudaram entre 21 e 40 minutos. Tem muitas coisas interessantes
que nós podemos descobrir com essa distribuição de dados, mas o foco dessa aula são somente
dois tipos de distribuições. A primeira distribuição é o que
chamamos de distribuição marginal. Essa distribuição está interessada
somente nessa parte aqui. o que você deve fazer é examinar o total dessas linhas aqui. Então isso aqui vai te dar a
distribuição marginal da porcentagem correta. Olhe: 40 entre 200 alunos
ficaram com a porcentagem entre 80 e 100%, Agora, uma distribuição marginal pode ser representada
como contagem ou porcentagens. Se quiser representá-la por porcentagem, você pega cada um desses dados e divide pelo total, ou seja, se você pegar 40 e dividir por 200,
isso vai dar 20%, se você pegar 60 e dividir por 200,
isso vai dar 30%, se você pegar 70 e dividir por 200,
isso vai dar 35%, se você dividir 20 por 200,
isso vai dar 10%, e, por fim, se você dividir 10 por 200,
isso vai dar 5%. Então, em termos de porcentagem, isso aqui fornece a distribuição marginal da porcentagem correta, ou seja, a porcentagem de questões corretas
que os alunos tiveram. Então, por exemplo, você pode dizer que 10% dos alunos
tiveram entre 20 e 39% de acertos. Você também pode pensar nela
pelo tempo estudado na aula. Se fizer isso, você pegará esse conjunto de dados aqui. Você pode dizer que 14 alunos estudaram
entre zero e 20 minutos, ou seja, você não está mais pensando na
porcentagem de respostas corretas. Por exemplo, 30 alunos estudaram entre 21 e 40 minutos
e você também pode escrever isso como porcentagem. Isso aqui seria 14 dividido por 200, que daria 7% e você faz isso para todos esses dados aqui. Você vai ter 15%,
43% aqui e 35% aqui. Uma outra maneira de obter mais informações através dessa distribuição de dados é realizar a distribuição condicional. Essa é a distribuição de probabilidade
quando um valor determinado é conhecido, ou seja, você já conhece uma informação previamente. Como exemplo, nós podemos calcular a distribuição da porcentagem correta, ou seja, a porcentagem de acertos na prova, no teste, dado que os alunos estudam entre 41 e 60 minutos. Para resolver isso, a primeira coisa que
você tem que fazer é olhar a condição. Então para calcular a distribuição condicional
dos alunos que estudaram entre 41 e 60 minutos, nós devemos dividir em várias categorias. Devemos dividir os intervalos.
Então, de 80 a 100, de 60 a 79, de 40 a 59, de 20 a 39
e de zero a 19. O que nós vamos fazer aqui é calcular a porcentagem dos dados em cada um desses intervalos aqui, ou seja, a porcentagem de questões corretas,
de acertos dos alunos que estudam entre 41 e 60 minutos. No primeiro intervalo nós temos 16 dos 86 alunos,
então escrevemos 16 sobre 86, e se nós fizermos isso na calculadora,
nós temos 16 dividido por 86. Dá esse valor aqui, que eu posso multiplicar por 100 e isso vai ser a mesma coisa que 18,6%. Por exemplo, para 30 seria 30 dividido por 86
e você faria isso para todos os outros valores. Assim você obteria a distribuição condicional. Eu espero que essa aula tenha lhes ajudado.
Até a próxima, pessoal!