If you're seeing this message, it means we're having trouble loading external resources on our website.

Se você está atrás de um filtro da Web, certifique-se que os domínios *.kastatic.org e *.kasandbox.org estão desbloqueados.

Conteúdo principal

Construindo uma árvore filogenética

A lógica por trás das árvores filogenéticas. Como construir uma árvore utilizando dados sobre as características que estão presentes ou ausentes em um grupo de organismos.

Pontos Principais:

  • Árvores filogenéticas representam hipóteses sobre as relações evolutivas em um grupo de organismos.
  • Uma árvore filogenética pode ser construída usando-se características morfológicas (formato do corpo), bioquímicas, comportamentais ou moleculares de espécies ou outros grupos.
  • Ao construir uma árvore, nós organizamos as espécies em grupos aninhados com base em características derivadas (características diferentes daquelas do grupo ancestral) compartilhadas.
  • As sequências de genes ou proteínas podem ser comparadas entre espécies e usadas para construir árvores filogenéticas. Espécies estreitamente relacionadas geralmente têm poucas diferenças nas sequências, enquanto espécies menos relacionadas tendem a ter mais diferenças.

Introdução

Nós somos todos aparentados - e eu não quero dizer apenas nós, seres humanos, apesar disso ser a mais absoluta verdade! Em vez disso, todos os seres vivos na Terra podem traçar sua ascendência de volta a um ancestral comum. Qualquer grupo menor de espécies pode também traçar sua ancestralidade até um ancestral comum, em geral um muito mais recente.
Dado que não podemos voltar no tempo e ver como as espécies evoluíram, como podemos descobrir como elas se relacionam umas com as outras? Neste artigo, veremos os métodos básicos e a lógica usada para construir árvores filogenéticas, ou árvores que representam a história evolutiva e as relações de um grupo de organismos.

Visão geral de árvores filogenéticas

Em uma árvore filogenética, as espécies de interesse são mostradas nas pontas dos ramos da árvore. Os ramos propriamente ditos conectam-se de uma maneira que representa a história evolutiva das espécies - que é, como pensamos que elas evoluíram de um ancestral comum através de uma série de eventos de divergência (separação em dois). Em cada ponto de ramificação fica o ancestral comum mais recente compartilhado por todas as espécies descendentes daquele ponto de ramificação. As linhas de uma árvore representam longas séries de ancestrais que se estendem de uma espécie para a próxima.
Imagem modificada de Taxonomy and phylogeny: Figure 2, by Robert Bear et al., CC BY 4.0
Para uma explicação mais detalhada, veja o artigo sobre árvores filogenéticas.
Mesmo depois de se sentir confortável lendo uma árvore filogenética, você pode ter uma questão persistente: Como você constrói uma coisa dessas? Neste artigo, nós examinaremos como as árvores filogenéticas são construídas.

A ideia por trás da construção de árvores.

Como construímos uma árvore filogenética? O princípio subjacente é a ideia de Darwin de "descendência com modificação". Basicamente, ao olhar o padrão de modificações (características novas) em organismos atuais, podemos descobrir - ou, ao menos, fazer hipóteses sobre - seu caminho de descendência a partir de um ancestral comum
Como um exemplo, vamos considerar a árvore filogenética abaixo (que mostra a história evolutiva de um grupo fictício de espécies parecidas com camundongos). Vemos três novas características surgindo em diferentes pontos ao longo da história evolutiva do grupo: uma cauda felpuda, orelhas grandes e bigodes. Cada nova característica é compartilhada por todas as espécies descendentes do ancestral no qual aquela característica surgiu (mostrado pelas marcas de checagem), mas ausentes nas espécies que se separaram antes da característica aparecer.
Quando estamos construindo árvores filogenéticas, características que surgem durante a evolução de um grupo e são diferentes das características do ancestral do grupo, são chamadas características derivadas. Em nosso exemplo, uma cauda felpuda, orelhas grandes e bigodes são características derivadas, enquanto uma cauda fina, orelhas pequenas e ausência de bigodes são características ancestrais. Um ponto importante é que uma característica derivada pode aparecer tanto pela perda, como pela aquisição de um traço. Por exemplo, se houvesse uma outra modificação na linhagem E que resultasse em perda da cauda, a ausência de cauda seria considerada uma característica derivada.
Características derivadas compartilhadas entre as espécies ou outros grupos em um conjunto de dados são fundamentais para nos ajudar a construir árvores. Como mostrado acima, características derivadas compartilhadas tendem a formar padrões aninhados que fornecem informação sobre quando os eventos de ramificação ocorreram na evolução das espécies.
Quando estamos construindo uma árvore filogenética a partir de um conjunto de dados, nosso objetivo é usar características derivadas compartilhadas nas espécies atuais para inferir o padrão de ramificação de sua história evolutiva. O problema, contudo, é que não podemos assistir nossas espécies de interesse evoluindo e verificar como as novas características apareceram em cada linhagem.
Ao invés disso, temos que trabalhar no sentido inverso. Isto é, nós temos que analisar nossas espécies de interesse - tais como A, B, C, D e E - e descobrir quais características são ancestrais e quais são derivadas. Então, podemos usar as características derivadas compartilhadas para organizar as espécies em grupos aninhados como aqueles mostrados acima. A árvore feita desta maneira é uma hipótese acerca da história evolutiva das espécies - tipicamente, uma história com o padrão de ramificação mais simples possível que possa explicar suas características.

Exemplo: Construção de uma árvore filogenética

Se fôssemos biológos construindo uma árvore filogenética como parte de nossa pesquisa, teríamos de escolher que conjunto de organismos agruparíamos em uma árvore. Também teríamos que escolher em quais características desses organismos basearíamos nossa árvore (a partir de um conjunto de suas muitas diferentes características físicas, comportamentais, e bioquímicas.)
Se, ao contrário, estivessemos construindo uma árvore filogenética para uma aula (o que é mais plausível para os leitores deste artigo), é provável que nos fosse dado um conjunto de características, geralmente na forma de uma tabela, que precisaríamos converter em uma árvore. Por exemplo, esta tabela mostra a presença (+) ou ausência (0) de várias características:
CaracterísticaLampreiaAntílopeÁguia americanaJacaréRobalo
Pulmões0+++0
Mandíbulas0++++
Penas00+00
Moela00++0
Pelos0+000
Tabela modificada de Taxonomy and phylogeny: Figure 4, by Robert Bear et al., CC BY 4.0
A seguir, nós precisamos saber que forma de cada característica é ancestral e qual é derivada. Por exemplo, a presença de pulmões é uma característica ancestral ou derivada? Lembre-se, uma característica ancestral é aquela que pensamos que estava presente no ancestral comum das espécies de interesse. Uma característica derivada é uma forma que achamos ter se originado em algum ponto de uma linhagem descendente daquele ancestral.
Sem a habilidade de olhar o passado (o que seria bem conveniente mas, infelizmente, impossível), como nós sabemos que características são ancestrais e quais são derivadas?
  • No contexto de uma lição de casa ou de um teste, a questão que você está resolvendo pode lhe dizer que características são derivadas e quais são ancestrais.
  • Se você está fazendo sua própria pesquisa, você pode ter conhecimento que permita a você identificar características ancestrais e derivadas (p.e., com base em fósseis).
  • Você pode receber informação sobre um grupo externo, uma espécie que é mais remotamente relacionada às espécies de interesse do que elas são entre si.
Se temos um grupo externo, ele pode servir como um substituto da espécie ancestral. Isto é, podemos assumir que suas características representem a forma ancestral de cada característica.
No caso, em nosso exemplo (dados repetidos abaixo para facilitar), a lampreia, um peixe sem mandíbulas e sem esqueleto verdadeiro, é nosso grupo externo. Como mostrado na tabela, a lampreia não apresenta as características listadas: não tem pulmões, mandíbulas, penas, moela, ou pelos. Com base nestas informações, assumiremos que a ausências destas características é ancestral e que a presença de cada uma delas é uma característica derivada.
CaracterísticaLampreiaAntílopeÁguia americanaJacaréRobalo
Pulmões0+++0
Mandíbulas0++++
Penas00+00
Moela00++0
Pelo0+000
Tabela modificada de Taxonomy and phylogeny: Figure 4, by Robert Bear et al., CC BY 4.0
Agora, podemos começar a construir nossa árvore agrupando organismos de acordo com suas características derivadas compartilhadas. Um bom ponto de partida é procurar a característica derivada que é compartilhada pelo maior número de organismos. Neste caso, é a presença de mandíbulas: todos os organismos, exceto o grupo externo (lampreia), têm mandíbulas. Dessa forma, podemos começar nossa árvore desenhando a separação da linhagem da lampreia do resto das espécies e podemos colocar o aparecimento de mandíbulas no ramo que suporta as espécies não lampreia.
Imagem baseada em Taxonomy and phylogeny: Figure 6, by Robert Bear et al., CC BY 4.0
A seguir, procuramos a característica derivada compartilhada pelo segundo maior grupo de organismos. Seria a presença de pulmões, compartilhada pelo antílope, a águia americana e o jacaré, mas não pelo robalo. Com base neste padrão, podemos traçar a separação da linhagem do robalo e podemos colocar o aparecimento de pulmões na linhagem que conduz ao antílope, à águia americana e ao jacaré.
Imagem baseada em Taxonomy and phylogeny: Figure 6, by Robert Bear et al., CC BY 4.0
Seguindo o mesmo padrão, agora procuramos pela característica derivada compartilhada pelo terceiro maior número de organismos. Esta seria a moela, que é compartilhada pelo jacaré e pela águia americana (e está ausente no antílope). Com base nestes dados, podemos traçar a separação do ramo do antílope da linhagem do jacaré e da águia americana e colocar o aparecimento de moela na última.
Imagem baseada em Taxonomy and phylogeny: Figure 6, by Robert Bear et al., CC BY 4.0
O que fazer com as características remanescentes, pelo e penas? Estas características são derivadas, mas não são compartilhadas, uma vez que são encontradas apenas em uma única espécie cada uma. Características derivadas que não são compartilhadas não nos auxiliam a construir a árvore, mas nós ainda podemos colocá-las na árvore em sua localização mais provável. Para as penas, este ponto é na linhagem que leva à águia americana (após a divergência do jacaré). Para o pelo, o ponto é a linhagem do antílope, após sua divergência do jacaré e da águia americana
Imagem baseada em Taxonomy and phylogeny: Figure 6, by Robert Bear et al., CC BY 4.0

Economia e riscos na construção da árvore.

Quando estávamos construindo a árvore acima, usamos uma abordagem chamada parcimônia. Parcimônia essencialmente significa que escolhemos a explicação mais simples para nossas observações. No contexto de construir uma árvore, isto signica que escolhemos a árvore que requer a ocorrência do menor número de eventos genéticos independentes (aparecimentos ou desaparecimentos de características).
Por exemplo, nós poderíamos ter também explicado o padrão de características que vimos usando a seguinte árvore:
Imagem baseada em Taxonomy and phylogeny: Figure 6, by Robert Bear et al., CC BY 4.0
Esta série de eventos também fornece uma explicação evolutiva para as características que vemos nas cinco espécies. Contudo, é menos econômica porque requer que ocorram mais modificações independentes nas características. Em razão da posição em que colocamos o robalo, nós temos que levantar a hipótese de que as mandíbulas surgiram de forma independente em duas ocasiões separadas (uma vez na linhagem do robalo, e uma vez na linhagem que leva aos antílopes, águias e jacarés). Isto dá à árvore um total de 6 marcas de checagem ou eventos de mudança de característica, versus 5 na árvore mais econômica acima.
Neste exemplo, parece bastante óbvio que há uma árvore melhor e pode parecer desnecessário contar as marcas de checagem. Contudo, quando pesquisadores fazem filogenias como parte de seu trabalho, eles geralmente usam um grande número de características e os padrões destas características raramente concordam 100% uns com os outros. Ao contrário, há alguns conflitos, onde uma árvore seria mais compatível com o padrão de uma característica, enquanto uma outra árvore ficaria melhor com o padrão de uma outra característica. Nestes casos, o pesquisador pode usar o princípio da economia para escolher a árvore (hipótese) que melhor se adapta aos dados.
Talvez você esteja pensando: Por que estas árvores todas não concordam umas com as outras, independente das características usadas para construí-las? Afinal, a evolução de um grupo de espécies aconteceu de uma determinada maneira no passado. O problema é que, quando construímos uma árvore, nós estamos reconstruindo essa história evolutiva a partir de dados incompletos e alguma vezes imperfeitos. Por exemplo:
  • Nem sempre somos capazes de diferenciar características que refletem ancestralidade compartilhada (características homólogas) de características que são similares mas surgiram de forma independente (características analógas surgidas por evolução convergente).
  • Características podem ser adquiridas ou perdidas múltiplas vezes ao longo da história evolutiva de uma espécie. Uma espécie pode ter uma característica derivada, mas então perdê-la (reverter à forma ancestral) ao longo do curso da evolução.
Biólogos geralmente usam muitas características diferentes para construir árvores filogenéticas por causa de fontes de erro como estas. Até mesmo quando todas as características são cuidadosamente escolhidas e analisadas, ainda é possível que algumas delas levem a conclusões erradas (uma vez que não temos a informação completa sobre os eventos que aconteceram no passado).

A utilização de dados moleculares para construir árvores.

Uma ferramenta que revolucionou e continua a revolucionar a análise filogenética, é o sequenciamento do DNA. Com esta técnica, ao invés de usar características físicas ou comportamentais de organismos para construir as árvores, podemos comparar as sequências de seus genes ou proteínas ortólogos (evolutivamente relacionados).
O princípio básico de tal comparação é similar àquele que analisamos acima: há uma forma ancestral da sequência de DNA ou proteína e podem ter ocorrido mudanças nestas sequências ao longo do tempo evolutivo. Contudo, um gene ou uma proteína não correspondem apenas a uma única característica que existe em dois estados.
Ao invés disso, cada nucleotídeo de um gene ou aminoácido de uma proteína pode ser visto como uma característica separada, que pode mudar para múltiplos estados (p.ex., A, T, C ou G para um nucleotídeo) via mutação. Assim, um gene com 300 nucleotídeos poderia representar 300 características diferentes existindo em 4 estados! A quantidade de informação que obtemos de comparações de sequências - e portanto, a resolução que podemos esperar conseguir em uma árvore filogenética - é muito mais alta do que quando usamos características físicas.
Para analisar dados de sequências e identificar a árvore filogenética mais provável, os biólogos tipicamente usam programas de computador e algoritmos estatísticos. Em geral, no entanto, quando nós comparamos as sequências de um gene ou proteína entre espécies:
  • Um grande número de diferenças corresponde a espécies menos relacionadas.
  • Um número menor de diferenças corresponde a espécies mais relacionadas.
Por exemplo, suponha que comparemos a cadeia beta da hemoglobina (a proteína transportadora de oxigênio no sangue) entre seres humanos e uma variedade de outras espécies. Se nós comparamos as versões dessa proteína em seres humanos e gorilas, nós encontraremos uma diferença de somente 1 aminoácido. Se nós, ao contrário, comparamos as proteínas de seres humanos e cachorros, nós encontraremos 15 diferenças. Com seres humanos e galinhas, são mais de 45 aminoácidos de diferença e com seres humanos e lampreias (um peixe sem mandíbulas), nós vemos 127 diferenças1. Estes números refletem que, entre as espécies consideradas, seres humanos são mais relacionados aos gorilas e menos relacionados às lampreias.
Você pode ver Sal trabalhando com um exemplo envolvendo árvores filogenéticas e dados de sequenciamento neste AP biology free response question video.

Quer participar da conversa?

Você entende inglês? Clique aqui para ver mais debates na versão em inglês do site da Khan Academy.