If you're seeing this message, it means we're having trouble loading external resources on our website.

Se você está atrás de um filtro da Web, certifique-se que os domínios *.kastatic.org e *.kasandbox.org estão desbloqueados.

Conteúdo principal

Sequenciamento de DNA

Como a sequência de bases de nucleotídeos (As, Ts, Cs, and Gs) de um pedaço de DNA é determinada.

Pontos Principais:

  • Sequenciamento de DNA é o processo de determinação da sequência de nucleotídeos (As, Ts, Cs, e Gs) em um pedaço de DNA.
  • No método Sanger de sequenciamento, o DNA alvo é copiado muitas vezes, produzindo fragmentos de comprimentos diferentes. Nucleotídeos “terminadores de cadeia” fluorescentes marcam os finais dos fragmentos e permitem que a sequência seja determinada.
    • As técnicas de Sequenciamento de Última Geração são novas abordagens feitas em grande escala que aumentam a velocidade e diminuem os custos do sequenciamento.

O que é sequenciamento?

Você deve ter ouvido falar que genomas estão sendo sequenciados. Por exemplo, o genoma humano foi concluído em 2003, depois de vários anos de esforços internacionais. Mas o que significa sequenciar um genoma ou mesmo pequenos fragmentos de DNA?
Sequenciamento de DNA é o processo de determinação da sequência de bases nucleotídicas (As, Ts, Cs, e Gs) em um pedaço de DNA. Hoje em dia, com os materiais e equipamentos corretos, sequenciar um pequeno fragmento de DNA é relativamente simples.
Sequenciar um genoma inteiro (todo o DNA de um organismo) permanece uma tarefa complexa. Isso requer quebrar o DNA do genoma em pequenos fragmentos, sequenciar esses pedaços e montar as sequências em uma única e longa sequência "consenso". Entretanto, graças a novos métodos que tem sido desenvolvidos nas duas últimas décadas, o sequenciamento genômico é agora muito mais rápido e mais barato do que era durante o Projeto Genoma Humano1.
Neste artigo, nós veremos os métodos usados para sequenciamento de DNA. Focaremos no método já bem estabelecido, método Sanger de sequenciamento, mas também discutiremos os novos métodos ("nova geração") que tem reduzido custos e acelerado a velocidade de sequenciamentos em larga escala.

Sequenciamento de Sanger: o método de terminação da cadeia

Regiões de DNA com até 900 pares de base de comprimento são rotineiramente sequenciados pelo chamado método Sanger de sequenciamento ou método de terminação da cadeia. O método Sanger foi desenvolvido pelo bioquímico britânico Fred Sanger e seus colaboradores, em 1977.
No Projeto Genoma Humano, o método Sanger foi usado para determinar as sequencias de muitos fragmentos relativamente pequenos de DNA humano. (Esses fragmentos não tinham necessariamente 900 pb ou menos, mas os pesquisadores conseguiam "caminhar" ao longo de cada fragmento usando diversas rodadas de sequenciamento por Sanger.) Os fragmentos foram alinhados com base nas porções de sobreposição compondo sequencias de regiões mais longas de DNA e, eventualmente, os cromossomos inteiros.
Embora os genomas sejam agora tipicamente sequenciados usando outros métodos mais rápidos e baratos, o método Sanger ainda é amplamente usado para o sequenciamento de fragmentos individuais de DNA, como fragmentos usados na Clonagem de DNA ou gerados pela Reação em Cadeia da Polimerase (PCR).

Ingredientes para o sequenciamento de Sanger

O método Sanger envolve a produção de muitas cópias de uma região alvo de DNA. Os ingredientes são similares àqueles usados para replicação de DNA em um organismo, ou para a reação em cadeia da polimerase (PCR), os quais fazem cópias de DNA in vitro. Eles incluem:
  • Uma enzima DNA polimerase
  • Um primer, que é um pequeno fragmento de DNA de fita simples que se liga ao DNA molde e atua como um "iniciador" para a polimerase
  • Os quatro nucleotídeos do DNA (dATP, dTTP, dCTP, dGTP)
  • O DNA molde a ser sequenciado
Entretanto, uma reação de sequenciamento de Sanger contém um ingrediente único:
  • Versões Dideoxi, ou terminadores de cadeia, para os quatro nucleotídeos (ddATP, ddTTP, ddCTP, ddGTP), cada uma marcada com um corante de uma cor diferente
Imagens de duas estruturas químicas de um nucleotídeo. Ambas as imagens têm uma molécula em forma de anel de 5 carbonos com uma base ligada ao primeiro carbono e um grupo fosfato ligado ao quinto carbono. A imagem superior tem dois hidrogênios ligados ao carbono número 3 e está identificada como Didesoxinucleotídeo, ddNTP. A imagem inferior tem um hidrogênio e um OH ligados ao carbono número 3 e está identificada como Desoxinucleotídeo, dNTP.
_Créditos da Imagem: "Sequenciamento de genoma: Figura 1," by OpenStax College, Biology (CC BY 4.0)._
Dideoxinucleotídeos são similares aos nucleotídeos comuns, ou deoxinucleotídeos, mas com uma diferença chave: falta um grupo hidroxila na posição 3' do carbono do anel de sacarose. Em um nucleotídeo comum, o grupo 3' hidroxila atua como um "gancho", permitindo que um novo nucleotídeo seja adicionado à cadeia existente.
Uma vez que um dideoxinucleotídeo é adicionado à cadeia, não há hidroxila disponível e nenhum outro nucleotídeo pode ser adicionado. A cadeia termina com o dideoxinucleotídeo, o qual é marcado com um cor particular de corante dependendo da base (A, T, C or G) que carrega.

Método Sanger de sequenciamento

A amostra de DNA a ser sequenciada é combinada em um tubo com primer, DNA polimerase e nucleotídeos de DNA (dATP, dTTP, dGTP, and dCTP). Os quatro nucleotídeos terminadores de cadeia marcados com corantes são adicionados também, mas em concentração muito menor que a dos nucleotídeos comuns.
A mistura é primeiro aquecida para a denaturação do DNA molde (separar as fitas), então resfriadas para que os primers possam se ligar ao molde de fita simples. Uma vez que o primer se ligou, a temperatura é aumentada novamente, permitindo que a DNA polimerase sintetize um novo DNA a partir do primer. A DNA polimerase continuará a adicionar nucleotídeos à cadeia até que aconteça a adição de um dideoxinucleotídeo ao invés de um normal. Nesse ponto, os nucleotídeos não podem mais ser adicionados, e portanto a fita terminará em um dideoxinucleotídeo.
Este processo é repetido em um número de ciclos. Quando o ciclo se completa, é praticamente garantido que um dideóxinucleotídeo terá se incorporado em todas as posições do DNA alvo em pelo menos uma reação. Ou seja, o tubo irá conter fragmentos de diferentes comprimentos, terminando em cada uma das posições de nucleotídeos no DNA original. (veja a figura abaixo). As extremidades dos fragmentos serão rotuladas com corantes que indicam o nucleotídeo final.
Um diagrama com imagens que mostram o método Sanger de sequenciamento de DNA. No topo do diagrama há uma reta verde horizontal com 17 pequenas retas verticais que se estendem ao longo da reta horizontal. O lado esquerdo da reta está identificado como 3 linha, o lado direito da reta está identificado como 5 linha, e a reta está identificada como molde. Acima da reta verde, há uma reta horizontal cinza com 9 pequenas retas verticais que se estendem ao longo dela; o lado esquerdo da reta cinza está identificado como 5 linha, o lado direito está identificado como 3 linha, e a reta está identificada como primer. Uma seta aponta do primer para uma série de retas horizontais que estão aumentando de comprimento. A seta está unida a uma seta de uma legenda que diz dNTPs. Os símbolos da legenda são ddTTP é um círculo vermelho, ddCTP é um círculo azul, ddATP é um círculo verde e ddGTP é um círculo roxo. No ponto em que a seta da legenda se junta à seta do primer, a seta está identificada como extensão do primer e terminação da cadeia. Na ponta da seta há 9 retas paralelas, cada uma aumentando em comprimento em relação à anterior. Cada reta começa com o primer cinza que depois está unido a um segmento de reta vermelho que tem uma reta vertical conectada e que termina com um círculo colorido. A primeira reta tem um segmento de reta vertical e um círculo roxo. A segunda reta tem 2 segmentos de reta verticais vermelhos e um círculo roxo. Cada reta horizontal continua aumentando por um segmento de reta vertical que é adicionado à extremidade 3 linha do segmento, e na extremidade de cada segmento de reta horizontal há um círculo vermelho, azul, verde ou roxo. Todas as 9 retas horizontais estão dentro de um colchete que tem uma seta apontando para uma estrutura em forma de tubo que possui bandas coloridas diferentes no tubo e que tem a identificação eletroforese capilar em gel. O tubo tem uma seta apontando para uma caixa identificada como laser que mostra uma linha de laser passando pelo tubo e conectada a uma caixa identificada como detector. O detector está conectado a um computador. No computador, há uma seta apontando para uma caixa que tem uma imagem de linhas roxas, vermelhas, verdes e azuis em um gráfico e a caixa está identificada como cromatograma. Abaixo da caixa, há uma sequência identificada que diz G, G, T, C, A, T, A, G, C. Os Gs estão na cor roxa, os Ts estão na cor vermelha, os Cs estão na cor azul e os As estão na cor verde.
Imagem modificada de "Sanger sequencing," by Estevezj (CC BY-SA 3.0). The modified image is licensed under a (CC BY-SA 3.0) license.
Depois que a reação é executada, os fragmentos são levados através de um longo e fino tubo contanto uma matriz de gel em um processo chamado de eletroforese capilar em gel. Pequenos fragmentos movem-se rapidamente através dos poros do gel, enquanto longos fragmentos movem-se mais devagar. Assim que cada fragmento cruza a "linha de chegada" no final do tubo, ele é iluminado por um laser, permitindo que o corante anexado seja detectado.
O menor fragmento (que termina apenas um nucleotídeo após o primer) atravessa a linha de chegada primeiro, seguido do próximo menor fragmento (terminando dois nucleotídeos após o primer), e assim por diante. Portanto, a partir das cores dos corantes registradas uma após a outra no detector, a sequência do pedaço original de DNA pode ser construída com um nucleotídeo por vez. Os dados registrados pelo detector consistem em uma série de picos em intensidade de fluorescência, como mostrado no cromatograma acima. A sequência de DNA é lida a partir dos picos no cromatograma.

Usos e limitações

O método Sanger de sequenciamento promove sequências de alta qualidade para trechos relativamente longos (por volta de 900 pares de base). É tipicamente usado para sequenciar peças individuais de DNA, como plasmídeos bacterianos ou DNA copiado em PCR.
Entretanto, o método Sanger de sequenciamento é caro e ineficiente para projetos de larga escala, como o sequenciamento de um genoma inteiro ou metagenoma (o "genoma coletivo" de uma comunidade microbiana). Para tarefas como essa, novas técnicas de sequenciamento de larga escala são mais rápidas e menos caras.

Sequenciamento da nova geração

O nome pode soar Star Trek, mas é realmente como é chamado! O mais recente conjunto de tecnologias de sequenciamento de DNA é coletivamente chamado de sequenciamento da nova geração.
Existe uma variedade de técnicas de sequenciamento de nova geração que usam diferentes tecnologias. No entanto, a maioria tem algumas características em comum que as distinguem do sequenciamento Sanger:
  • Alto paralelismo: muitas reações de sequenciamento ocorrem ao mesmo tempo
  • Microescala: reações são pequenas e muitas podem ser realizadas de uma vez em um chip
  • Rapidez: pelas reações serem feitas em paralelo, resultados são obtidos muito mais rápido
  • Baixo custo: sequenciar um genoma é mais barato do que com o sequenciamento Sanger
  • Menor comprimento: leituras tipicamente variam entre 50 -700 nucleotídeos de comprimento
Conceitualmente, o sequenciamento de nova geração é algo como conduzir um grande número de pequenas reações Sanger de sequenciamento em paralelo. Graças a essa paralelização e pequena escala, grandes quantidades de DNA podem ser sequenciadas de forma muito mais rápida e barata com métodos de próxima geração do que com sequenciamento Sanger. Por exemplo, em 2001, o custo de sequenciar o genoma humano era quase $100 milhões de dólares. Em 2015, era apenas $12452!
Por que um sequenciamento rápido e barato importa? A habilidade de sequenciar genomas rotineiramente abre novas possibilidades para pesquisa em biologia e aplicações biomédicas. Por exemplo, sequenciamento de baixo custo é um passo em direção à medicina personalizada – isso é, tratamento médico adaptado às necessidades de um indivíduo, baseado nas variante gênicas no seu genoma.

Quer participar da conversa?

Nenhuma postagem por enquanto.
Você entende inglês? Clique aqui para ver mais debates na versão em inglês do site da Khan Academy.