If you're seeing this message, it means we're having trouble loading external resources on our website.

Se você está atrás de um filtro da Web, certifique-se que os domínios *.kastatic.org e *.kasandbox.org estão desbloqueados.

Conteúdo principal

Exemplo de regressão linear usando dados transformados

Exemplo resolvido de uma regressão linear usando dados transformados. Adaptada da resposta do formulário b, questão 6, parte d da prova de estatística avançada de 2007.

Quer participar da conversa?

Nenhuma postagem por enquanto.
Você entende inglês? Clique aqui para ver mais debates na versão em inglês do site da Khan Academy.

Transcrição de vídeo

RKA3JV - Olá, meu amigo ou minha amiga! Tudo bem com você? Seja muito bem-vindo ou bem-vinda a mais um vídeo da Khan Academy Brasil. Neste vídeo, vamos resolver um exemplo sobre regressão linear e transformação de dados. Um grupo de ambientalistas de preservação de espécies acredita que as espécies em risco de extinção podem desaparecer quando uma região se desenvolve. O grupo possui um orçamento para realizar a compra de uma região que está prestes a começar a se desenvolver, e, então, transformá-la em uma reserva natural. O orçamento permite a compra de uma grande área com 45 km² que abriga 70 espécies em risco de extinção ou a compra de 5 pequenas áreas em regiões diferentes, onde cada uma possui uma área de 3 km² e abriga 16 espécies raras em risco de extinção. Qual opção você recomendaria para os ambientalistas? E por quê? Existem alguns dados interessantes aqui. Parece que são alguns dados coletados em ilhas diferentes. Temos aqui suas áreas. Este é o número de espécies em risco em 1990, e aqui o número de espécies extintas em 2000. Podemos ver também, para cada ilha, a proporção de espécies extintas em relação às espécies em risco de extinção. Observe que estes dados estão plotados aqui neste gráfico de dispersão. Agora, tenha muito cuidado para olhar para isso, porque se você reparar aqui nos dois eixos, o eixo vertical aqui é a proporção extinta em 2000, são estes números. Mas, aqui no eixo horizontal, não temos a área diretamente, nós temos o logaritmo natural da área. E por que isto foi feito desta forma? Observe, quando temos aqui no eixo horizontal o logaritmo natural da área, parece que temos uma relação linear. Mas sejamos claros, é uma relação linear entre o logaritmo natural da área e a proporção extinta em 2000. O motivo de fazer este tipo de transformação é que agora nós podemos aplicar nossas ferramentas de regressão linear e pensar sobre qual seria a proporção extinta nos 45 km² versus as 5 ilhas de 3 km. Então, pause este vídeo, e veja se você consegue descobrir isso por conta própria. E aí, fez? A questão nos forneceu dados de regressão para uma linha que se ajusta a estes dados. Agora, vamos trabalhar nisso aqui juntos. Eu vou tirar esta tabela aqui para que a gente tenha um espaço em branco para trabalhar. Além disso, tudo isto já está traçado bem aqui. E aqui já temos os nossos dados de regressão também. Nós temos uma linha de regressão, com uma inclinação que possui uma interceptação em "y". A interceptação em "y" é este valor aqui 0,28996. Vamos encontrá-lo aqui. Temos 0,2, aí temos 2, 4, 6, 8, mais ou menos aqui. 0,28996 é quase 29. Então, aqui temos a interceptação com "y" e a inclinação é negativa e aproximadamente 0,05. Provavelmente, vamos ter algo que se pareça com isto. Esta é a nossa linha de regressão. Uma outra forma de pensar aqui sobre esta linha de regressão é a seguinte: Nós vamos ter aqui a nossa proporção que obviamente é a proporção de espécies extintas. E isto aqui vai ser igual à nossa interceptação em "y" 0,28996 - 0,05323. Aqui precisamos tomar cuidado, porque você deve estar tentado a multiplicar isto aqui com a área. Mas, não. O eixo horizontal aqui é o log natural da área. Então, multiplicamos isto aqui com o logaritmo natural da área. Agora, nós podemos usar esta equação para ambos os cenários e pensar sobre qual vai ser a proporção de extinção que esperaríamos obter em qualquer situação. Então, quantas espécies reais serão extintas? O que tenha menos espécies sendo extintas, talvez seja o melhor. Mas talvez a que podemos preservar mais espécies vai ser a melhor. De qualquer forma, vamos ver aqui os dois cenários. No primeiro cenário temos esta ilha de 45 km². Então, temos apenas uma ilha. Vamos colocar isto aqui vezes 1. Qual vai ser a proporção de extinção que esperamos? Com base nesta regressão, vai ser 0,28996 - 0,05323 vezes o log natural de 45. Como queremos saber o número real de extinção, então, o número de espécies extintas é igual à proporção, vezes quanto? Vamos ver. Os 45 km² contém 70 espécies em risco. Então, isto aqui é a proporção vezes 70 espécies. Podemos pegar nossa calculadora aqui para descobrir isto. E aí, podemos digitar isto aqui rapidamente. Com base em nossa regressão linear, a proporção de extinção na ilha de 45 km² é igual a 0,0873. Ou seja, é quase 9%. Se a gente quiser descobrir o número real de espécies que esperamos que sejam extintas, nós apenas multiplicamos isso com o número de espécies naquela Ilha. Então, temos isto vezes 70, que é, aproximadamente, 6,11. Então, vamos escrever isto aqui. Isto vai ser, aproximadamente, igual a 6,11. Sendo assim, podemos dizer que haveria, aproximadamente, 6 espécies extintas. E, aproximadamente, 64 espécies salvas. Agora, vamos pensar sobre o outro cenário. Vamos pensar sobre o cenário onde temos 5 pequenas reservas naturais que aqui a gente está chamando de ilha, mas a ideia é a mesma. Então, vai ser 3 km² vezes 5 ilhas. Vamos fazer a mesma coisa. A nossa proporção de extinção vai ser igual a 0,28996 que é apenas a interceptação com o "y" aqui na nossa linha de regressão. Menos 0,05323. O sinal negativo é porque temos uma inclinação negativa, tudo bem? Aí, multiplicamos isto com, não é a área, mas sim o logaritmo natural da área. E, neste caso, a área é 3 km². Agora, vamos calcular o nosso número real aqui de extinção. Vamos fazer igual ao que fizemos antes. Então, nós temos isto aqui sendo igual à proporção, vezes, como temos 5 pequenas reservas naturais, cada uma com uma área de 3 km² e cada uma contendo 16 espécies em risco. Temos 5 vezes 16. Afinal, cada ilha tem 16 espécies e há 5 ilhas. Logo, isto vai ser 5 vezes 16 que é 80. Então, colocamos aqui vezes 80. Vamos descobrir quanto é isso. Pegue a calculadora novamente. Eu vou fazer bem rápido, mas você pode fazer isto com calma. Aqui temos a proporção, que é muito maior. Aí, multiplicamos isto com o número de espécies. Neste caso, é 80. Aí, descobrimos o número de espécies que esperamos que sejam extintas. Temos aqui, aproximadamente, 18,52. Isto é , aproximadamente, 18,52. Outra maneira de pensar sobre isso é que vamos ter aproximadamente 19 espécies extintas. E aí, se tivermos 19 extintas, quantas vamos salvar? Vamos salvar 61 espécies. 61 salvas. Mesmo que a gente colocasse aqui 18,5 e aqui 61,5, em qualquer medida, o 45 km², ou seja, a ilha grande, é bem melhor. Você vai ter menos espécies sendo extintas e mais espécies sendo salvas. Então, qual opção você recomendaria e por quê? Eu recomendaria a ilha grande, porque você vai salvar, você esperaria salvar mais espécies. E você também esperaria que menos espécies seriam extintas. Tudo isto a gente fez aqui com base nesta regressão linear. Enfim, meu amigo ou minha amiga, eu espero que você tenha compreendido tudo direitinho o que conversamos aqui. E, mais uma vez, eu quero deixar para você um grande abraço e até a próxima!