Conteúdo principal
Estatística Avançada
Curso: Estatística Avançada > Unidade 5
Lição 5: Como analisar afastamentos da linearidade- Raciocínio para o R²
- R² ou coeficiente de determinação
- Desvio-padrão dos resíduos ou raiz do quadrado médio do desvio (RQMD)
- Como interpretar dados de regressão de computador
- Interpretação da regressão de um cálculo de computador
- Impacto da remoção de outliers em retas de regressão
- Pontos influentes na regressão
- Efeitos de pontos influentes
- Identifique pontos influentes
- Como transformar dados não lineares
- Exemplo de regressão linear usando dados transformados
- Faça uma previsão com dados transformados
© 2023 Khan AcademyTermos de usoPolítica de privacidadeAviso de cookies
Exemplo de regressão linear usando dados transformados
Exemplo resolvido de uma regressão linear usando dados transformados. Adaptada da resposta do formulário b, questão 6, parte d da prova de estatística avançada de 2007.
Quer participar da conversa?
Nenhuma postagem por enquanto.
Transcrição de vídeo
RKA3JV - Olá, meu amigo ou minha amiga!
Tudo bem com você? Seja muito bem-vindo ou bem-vinda a mais um vídeo da Khan Academy Brasil. Neste vídeo, vamos resolver um exemplo sobre regressão linear
e transformação de dados. Um grupo de ambientalistas
de preservação de espécies acredita que as espécies
em risco de extinção podem desaparecer quando
uma região se desenvolve. O grupo possui um orçamento para realizar a compra de uma região que está prestes a começar
a se desenvolver, e, então, transformá-la
em uma reserva natural. O orçamento permite a compra
de uma grande área com 45 km² que abriga 70 espécies
em risco de extinção ou a compra de 5 pequenas
áreas em regiões diferentes, onde cada uma possui
uma área de 3 km² e abriga 16 espécies raras
em risco de extinção. Qual opção você recomendaria
para os ambientalistas? E por quê? Existem alguns dados
interessantes aqui. Parece que são alguns dados
coletados em ilhas diferentes. Temos aqui suas áreas. Este é o número de espécies
em risco em 1990, e aqui o número de espécies
extintas em 2000. Podemos ver também, para cada ilha, a proporção de espécies extintas em relação às espécies
em risco de extinção. Observe que estes dados estão
plotados aqui neste gráfico de dispersão. Agora, tenha muito cuidado
para olhar para isso, porque se você reparar
aqui nos dois eixos, o eixo vertical aqui é
a proporção extinta em 2000, são estes números. Mas, aqui no eixo horizontal,
não temos a área diretamente, nós temos o logaritmo natural da área. E por que isto foi feito desta forma? Observe, quando temos aqui no eixo
horizontal o logaritmo natural da área, parece que temos uma relação linear. Mas sejamos claros, é uma relação linear entre
o logaritmo natural da área e a proporção extinta em 2000. O motivo de fazer este
tipo de transformação é que agora nós podemos aplicar nossas
ferramentas de regressão linear e pensar sobre qual seria
a proporção extinta nos 45 km² versus as 5 ilhas de 3 km. Então, pause este vídeo, e veja se você consegue descobrir
isso por conta própria. E aí, fez? A questão nos forneceu dados de regressão para uma linha que se ajusta
a estes dados. Agora, vamos trabalhar nisso aqui juntos. Eu vou tirar esta tabela aqui para que a gente tenha um espaço
em branco para trabalhar. Além disso, tudo isto
já está traçado bem aqui. E aqui já temos os nossos dados
de regressão também. Nós temos uma linha de regressão, com uma inclinação que possui
uma interceptação em "y". A interceptação em "y"
é este valor aqui 0,28996. Vamos encontrá-lo aqui. Temos 0,2, aí temos 2, 4, 6, 8, mais ou menos aqui. 0,28996 é quase 29. Então, aqui temos a interceptação com "y" e a inclinação é negativa
e aproximadamente 0,05. Provavelmente, vamos ter algo
que se pareça com isto. Esta é a nossa linha de regressão. Uma outra forma de pensar aqui sobre esta linha de regressão
é a seguinte: Nós vamos ter aqui a nossa proporção que obviamente é a proporção
de espécies extintas. E isto aqui vai ser igual
à nossa interceptação em "y" 0,28996 - 0,05323. Aqui precisamos tomar cuidado, porque você deve estar tentado
a multiplicar isto aqui com a área. Mas, não. O eixo horizontal aqui
é o log natural da área. Então, multiplicamos isto aqui
com o logaritmo natural da área. Agora, nós podemos usar esta
equação para ambos os cenários e pensar sobre qual vai ser
a proporção de extinção que esperaríamos obter
em qualquer situação. Então, quantas espécies
reais serão extintas? O que tenha menos
espécies sendo extintas, talvez seja o melhor. Mas talvez a que podemos
preservar mais espécies vai ser a melhor. De qualquer forma, vamos
ver aqui os dois cenários. No primeiro cenário temos
esta ilha de 45 km². Então, temos apenas uma ilha. Vamos colocar isto aqui vezes 1. Qual vai ser a proporção de
extinção que esperamos? Com base nesta regressão, vai ser 0,28996 - 0,05323 vezes o log natural de 45. Como queremos saber
o número real de extinção, então, o número de espécies
extintas é igual à proporção, vezes quanto? Vamos ver. Os 45 km² contém
70 espécies em risco. Então, isto aqui é a proporção
vezes 70 espécies. Podemos pegar nossa calculadora
aqui para descobrir isto. E aí, podemos digitar isto
aqui rapidamente. Com base em nossa regressão linear, a proporção de extinção na ilha de 45 km² é igual a 0,0873. Ou seja, é quase 9%. Se a gente quiser descobrir
o número real de espécies que esperamos que sejam extintas, nós apenas multiplicamos isso com o número de espécies naquela Ilha. Então, temos isto vezes 70, que é, aproximadamente, 6,11. Então, vamos escrever isto aqui. Isto vai ser, aproximadamente,
igual a 6,11. Sendo assim, podemos dizer que haveria, aproximadamente, 6 espécies extintas. E, aproximadamente, 64 espécies salvas. Agora, vamos pensar sobre o outro cenário. Vamos pensar sobre o cenário onde
temos 5 pequenas reservas naturais que aqui a gente está chamando
de ilha, mas a ideia é a mesma. Então, vai ser 3 km² vezes 5 ilhas. Vamos fazer a mesma coisa. A nossa proporção de extinção
vai ser igual a 0,28996 que é apenas a interceptação com o "y"
aqui na nossa linha de regressão. Menos 0,05323. O sinal negativo é porque temos
uma inclinação negativa, tudo bem? Aí, multiplicamos isto com, não é a área, mas sim
o logaritmo natural da área. E, neste caso, a área é 3 km². Agora, vamos calcular o nosso
número real aqui de extinção. Vamos fazer igual ao
que fizemos antes. Então, nós temos isto aqui
sendo igual à proporção, vezes, como temos 5 pequenas
reservas naturais, cada uma com uma área de 3 km² e cada uma contendo 16 espécies em risco. Temos 5 vezes 16. Afinal, cada ilha tem
16 espécies e há 5 ilhas. Logo, isto vai ser 5 vezes 16
que é 80. Então, colocamos aqui vezes 80. Vamos descobrir quanto é isso. Pegue a calculadora novamente. Eu vou fazer bem rápido, mas você pode fazer isto com calma. Aqui temos a proporção,
que é muito maior. Aí, multiplicamos isto
com o número de espécies. Neste caso, é 80. Aí, descobrimos o número de espécies
que esperamos que sejam extintas. Temos aqui, aproximadamente, 18,52. Isto é , aproximadamente, 18,52. Outra maneira de pensar sobre isso é que vamos ter aproximadamente
19 espécies extintas. E aí, se tivermos 19 extintas, quantas vamos salvar? Vamos salvar 61 espécies. 61 salvas. Mesmo que a gente colocasse
aqui 18,5 e aqui 61,5, em qualquer medida, o 45 km², ou seja, a ilha grande,
é bem melhor. Você vai ter menos espécies sendo extintas e mais espécies sendo salvas. Então, qual opção você
recomendaria e por quê? Eu recomendaria a ilha grande,
porque você vai salvar, você esperaria salvar mais espécies. E você também esperaria que
menos espécies seriam extintas. Tudo isto a gente fez aqui com base
nesta regressão linear. Enfim, meu amigo ou minha amiga, eu espero que você tenha compreendido tudo direitinho
o que conversamos aqui. E, mais uma vez, eu quero deixar
para você um grande abraço e até a próxima!