Como a sequência de bases de nucleotídeos (As, Ts, Cs, and Gs) de um pedaço de DNA é determinada.

Pontos Principais:

  • Sequenciamento de DNA é o processo de determinação da sequência de nucleotídeos (As, Ts, Cs, e Gs) em um pedaço de DNA.
  • No método Sanger de sequenciamento, o DNA alvo é copiado muitas vezes, produzindo fragmentos de comprimentos diferentes. Nucleotídeos “terminadores de cadeia” fluorescentes marcam os finais dos fragmentos e permitem que a sequência seja determinada.
    • As técnicas de Sequenciamento de Última Geração são novas abordagens feitas em grande escala que aumentam a velocidade e diminuem os custos do sequenciamento.

O que é sequenciamento?

Você deve ter ouvido falar que genomas estão sendo sequenciados. Por exemplo, o genoma humano foi concluído em 2003, depois de vários anos de esforços internacionais. Mas o que significa sequenciar um genoma ou mesmo pequenos fragmentos de DNA?
Sequenciamento de DNA é o processo de determinação da sequência de bases nucleotídicas (As, Ts, Cs, e Gs) em um pedaço de DNA. Hoje em dia, com os materiais e equipamentos corretos, sequenciar um pequeno fragmento de DNA é relativamente simples.
Sequenciar um genoma inteiro (todo o DNA de um organismo) permanece uma tarefa complexa. Isso requer quebrar o DNA do genoma em pequenos fragmentos, sequenciar esses pedaços e montar as sequências em uma única e longa sequência "consenso". Entretanto, graças a novos métodos que tem sido desenvolvidos nas duas últimas décadas, o sequenciamento genômico é agora muito mais rápido e mais barato do que era durante o Projeto Genoma Humano1^1.
Neste artigo, nós veremos os métodos usados para sequenciamento de DNA. Focaremos no método já bem estabelecido, método Sanger de sequenciamento, mas também discutiremos os novos métodos ("nova geração") que tem reduzido custos e acelerado a velocidade de sequenciamentos em larga escala.

Sequenciamento de Sanger: o método de terminação da cadeia

Regiões de DNA com até 900900 pares de base de comprimento são rotineiramente sequenciados pelo chamado método Sanger de sequenciamento ou método de terminação da cadeia. O método Sanger foi desenvolvido pelo bioquímico britânico Fred Sanger e seus colaboradores, em 1977.
No Projeto Genoma Humano, o método Sanger foi usado para determinar as sequencias de muitos fragmentos relativamente pequenos de DNA humano. (Esses fragmentos não tinham necessariamente 900900 pb ou menos, mas os pesquisadores conseguiam "caminhar" ao longo de cada fragmento usando diversas rodadas de sequenciamento por Sanger.) Os fragmentos foram alinhados com base nas porções de sobreposição compondo sequencias de regiões mais longas de DNA e, eventualmente, os cromossomos inteiros.
Embora os genomas sejam agora tipicamente sequenciados usando outros métodos mais rápidos e baratos, o método Sanger ainda é amplamente usado para o sequenciamento de fragmentos individuais de DNA, como fragmentos usados na Clonagem de DNA ou gerados pela Reação em Cadeia da Polimerase (PCR).

Ingredientes para o sequenciamento de Sanger

O método Sanger envolve a produção de muitas cópias de uma região alvo de DNA. Os ingredientes são similares àqueles usados para replicação de DNA em um organismo, ou para a reação em cadeia da polimerase (PCR), os quais fazem cópias de DNA in vitro. Eles incluem:
  • Uma enzima DNA polimerase
  • Um primer, que é um pequeno fragmento de DNA de fita simples que se liga ao DNA molde e atua como um "iniciador" para a polimerase
  • Os quatro nucleotídeos do DNA (dATP, dTTP, dCTP, dGTP)
  • O DNA molde a ser sequenciado
Entretanto, uma reação de sequenciamento de Sanger contém um ingrediente único:
  • Versões Dideoxi, ou terminadores de cadeia, para os quatro nucleotídeos (ddATP, ddTTP, ddCTP, ddGTP), cada uma marcada com um corante de uma cor diferente
Dideoxinucleotídeos são similares aos nucleotídeos comuns, ou deoxinucleotídeos, mas com uma diferença chave: falta um grupo hidroxila na posição 3' do carbono do anel de sacarose. Em um nucleotídeo comum, o grupo 3' hidroxila atua como um "gancho", permitindo que um novo nucleotídeo seja adicionado à cadeia existente.
Uma vez que um dideoxinucleotídeo é adicionado à cadeia, não há hidroxila disponível e nenhum outro nucleotídeo pode ser adicionado. A cadeia termina com o dideoxinucleotídeo, o qual é marcado com um cor particular de corante dependendo da base (A, T, C or G) que carrega.

Método Sanger de sequenciamento

A amostra de DNA a ser sequenciada é combinada em um tubo com primer, DNA polimerase e nucleotídeos de DNA (dATP, dTTP, dGTP, and dCTP). Os quatro nucleotídeos terminadores de cadeia marcados com corantes são adicionados também, mas em concentração muito menor que a dos nucleotídeos comuns.
A mistura é primeiro aquecida para a denaturação do DNA molde (separar as fitas), então resfriadas para que os primers possam se ligar ao molde de fita simples. Uma vez que o primer se ligou, a temperatura é aumentada novamente, permitindo que a DNA polimerase sintetize um novo DNA a partir do primer. A DNA polimerase continuará a adicionar nucleotídeos à cadeia até que aconteça a adição de um dideoxinucleotídeo ao invés de um normal. Nesse ponto, os nucleotídeos não podem mais ser adicionados, e portanto a fita terminará em um dideoxinucleotídeo.
Este processo é repetido em um número de ciclos. Quando o ciclo se completa, é praticamente garantido que um dideóxinucleotídeo terá se incorporado em todas as posições do DNA alvo em pelo menos uma reação. Ou seja, o tubo irá conter fragmentos de diferentes comprimentos, terminando em cada uma das posições de nucleotídeos no DNA original. (veja a figura abaixo). As extremidades dos fragmentos serão rotuladas com corantes que indicam o nucleotídeo final.
Depois que a reação é executada, os fragmentos são levados através de um longo e fino tubo contanto uma matriz de gel em um processo chamado de electroforese capilar em gel. Pequenos fragmentos movem-se rapidamente através dos poros do gel, enquanto longos fragmentos movem-se mais devagar. Assim que cada fragmento cruza a "linha de chegada" no final do tubo, ele é iluminado por um laser, permitindo que o corante anexado seja detectado.
O menor fragmento (que termina apenas um nucleotídeo após o primer) atravessa a linha de chegada primeiro, seguido do próximo menor fragmento (terminando dois nucleotídeos após o primer), e assim por diante. Portanto, a partir das cores dos corantes registradas uma após a outra no detector, a sequência do pedaço original de DNA pode ser construída com um nucleotídeo por vez. Os dados registrados pelo detector consistem em uma série de picos em intensidade de fluorescência, como mostrado no cromatograma acima. A sequência de DNA é lida a partir dos picos no cromatograma.

Usos e limitações

O método Sanger de sequenciamento promove sequências de alta qualidade para trechos relativamente longos (por volta de 900900 pares de base). É tipicamente usado para sequenciar peças individuais de DNA, como plasmídeos bacterianos ou DNA copiado em PCR.
Entretanto, o método Sanger de sequenciamento é caro e ineficiente para projetos de larga escala, como o sequenciamento de um genoma inteiro ou metagenoma (o "genoma coletivo" de uma comunidade microbiana). Para tarefas como essa, novas técnicas de sequenciamento de larga escala são mais rápidas e menos caras.

Sequenciamento da nova geração

O nome pode soar Star Trek, mas é realmente como é chamado! O mais recente conjunto de tecnologias de sequenciamento de DNA é coletivamente chamado de sequenciamento da nova geração.
Existe uma variedade de técnicas de sequenciamento de nova geração que usam diferentes tecnologias. No entanto, a maioria tem algumas características em comum que as distinguem do sequenciamento Sanger:
  • Alto paralelismo: muitas reações de sequenciamento ocorrem ao mesmo tempo
  • Microescala: reações são pequenas e muitas podem ser realizadas de uma vez em um chip
  • Rapidez: pelas reações serem feitas em paralelo, resultados são obtidos muito mais rápido
  • Baixo custo: sequenciar um genoma é mais barato do que com o sequenciamento Sanger
  • Menor comprimento: leituras tipicamente variam entre 5050 700700 nucleotídeos de comprimento
Conceitualmente, o sequenciamento de nova geração é algo como conduzir um grande número de pequenas reações Sanger de sequenciamento em paralelo. Graças a essa paralelização e pequena escala, grandes quantidades de DNA podem ser sequenciadas de forma muito mais rápida e barata com métodos de próxima geração do que com sequenciamento Sanger. Por exemplo, em 2001, o custo de sequenciar o genoma humano era quase $100\$100 milheso˜\text{milhões} de dólares. Em 2015, era apenas $1245\$12452^2!
Por que um sequenciamento rápido e barato importa? A habilidade de sequenciar genomas rotineiramente abre novas possibilidades para pesquisa em biologia e aplicações biomédicas. Por exemplo, sequenciamento de baixo custo é um passo em direção à medicina personalizada – isso é, tratamento médico adaptado às necessidades de um indivíduo, baseado nas variante gênicas no seu genoma.
Carregando