Como os genes no DNS podem dar instruções para proteínas. O dogma central da biologia molecular: DNA → RNA → proteína.

Resumo: a expressão gênica

DNA é o material genético de todos os organismos da Terra. Quando o DNA é transmitido dos pais para os filhos, ele pode determinar algumas das características das crianças (tais como cor dos olhos ou dos cabelos). Mas como a sequência de uma molécula de DNA afeta características humanas e dos outros organismos? Por exemplo, como a sequência dos nucleotídeos (As, Ts, Cs e Gs) no DNA das plantas de ervilhas de Mendel determina a cor de suas flores?

Genes especificam produtos funcionais (como proteínas)

Uma molécula de DNA não se reduz a uma cadeia longa e repetitiva de nucleotídeos.Ao invés disto,ela é dividida em unidades funcionais chamadas genes. Cada gene fornece instruções para um produto funcional, ou seja, uma molécula necessária para realizar um trabalho na célula. Em muitos casos, o produto funcional de um gene é uma proteína. Por exemplo, o gene da cor das flores de Mendel fornece instruções para fazer uma proteína que ajuda na produção de moléculas coloridas (pigmentos) nas pétalas das flores.
Diagrama mostrando como um gene pode ditar um fenótipo (característica observável) de um organismo. O gene da cor da flor que Mendel estudou consiste de um trecho de DNA encontrado em um cromossomo. O DNA tem uma sequência particular; parte dela, mostrada nesse diagrama. é a 5'-GTAAATCG-3' (cadeia superior), pareada com a sequência complementar 3'-CATTTAGC-5' (cadeia inferior). O DNA do gene determina a produção de uma proteína que ajuda a produzir pigmentos. Quando a proteína está presente e funcional, os pigmentos são produzidos e as flores da planta têm cor púrpura.
Imagem baseada em dados experimentais relatados por Hellens et al.1^1 e em figura semelhante, em Reece et al.2^2.
Os produtos funcionais dos genes mais conhecidos são proteínas, ou, mais especificamente, polipeptídeos. Polipeptídeo é apenas outra palavra para cadeia de aminoácidos. Embora muitas proteínas consistam de um único polipeptídeo, algumas são formadas por múltiplos polipeptídeos. Os genes que especificam polipeptídeos são chamados de genes codificadores de proteínas.
Nem todos os genes determinam polipeptídeos. Alguns fornecem instrução para construção de moléculas funcionais de RNA, tais como os RNAs transportadores e RNAs ribossomais que desempenham papéis na tradução.
Como mencionado acima, o DNA de um organismo pode ser dividido em unidades funcionais chamadas genes. Cada gene consiste de uma sequência de DNA e esta sequência fornece instruções para fabricar um produto que a célula precisa. Alguns produtos são polipeptídeos, enquanto outros são RNAs funcionais.
Exemplos de diferentes produtos funcionais que os genes podem especificar.
Neste exemplo, há um trecho de DNA que contém três diferentes genes:
  • O gene 1 codifica um mRNA, que é então traduzido para formar um polipeptídeo (proteína ou subunidade de proteína).
  • O gene 2 codifica um RNA regulador. Este RNA não é traduzido em polipeptídeo, mas realiza um trabalho na célula (regula a expressão de outros genes).
  • O gene 3 codifica um RNA de transferência (tRNA). Este RNA também não é traduzido em polipeptídeo. Em vez disso, dobra-se na forma de um complexo trevo e desempenhará um papel fundamental na síntese de proteínas.
_Imagem modificada de "Dogma central da bioquímica molecular com enzimas," por Daniel Horspool (CC BY-SA 3.0). A imagem modificada é licenciada por uma licença CC BY-SA 3.0._
A ideia de que os genes codificam polipeptídeos surgiu muitos anos atrás (tendo suas raízes em experimentos de Beadle and Tatum nos anos 1940).
A ideia de que os genes comumente codificam RNAs funcionais é mais recente. Certos tipos de RNAs funcionais (como os RNAs transportadores e ribossomais) são conhecidos há anos. Entretanto, os cientistas descobriram apenas recentemente muitos outros genes que codificam RNAs reguladores, RNAs não codificadores de proteínas que mudam a expressão de outros genes. Como estes RNAs funcionam é uma área ativa de pesquisa.

Como a sequência do DNA de um gene especifica uma determinada proteína?

Muitos genes fornecem instruções para a produção de polipeptídeos. Como exatamente o DNA direciona a construção de um polipeptídeo? Esse processo envolve dois passos principais: a transcrição e a tradução.
  • Na transcrição, a sequência de DNA de um gene é copiada para fazer uma molécula de RNA. Essa etapa é chamada de transcrição pois envolve reescrever, ou transcrever, a sequência de DNA num "alfabeto" similar de RNA. Nos eucariontes, a molécula de RNA deve passar por um processamento para se tornar um RNA mensageiro (RNAm) maduro.
  • Na tradução, a sequência de RNAm é decodificada para determinar a sequência de aminoácidos de um polipeptídeo. O nome tradução significa que a sequência do RNAm precisa ser traduzida numa "linguagem" de aminoácidos completamente diferente .
Esquema simplificado do dogma central, mostrando as sequências das moléculas envolvidas.
As duas fitas de DNA têm as seguintes sequências:
5'-ATGATCTCGTAA-3' 3'-TACTAGAGCATT-5'
A trancrição de uma das fitas de DNA produz um RNAm cuja sequência é quase igual a da outra fita de DNA. Mas, devido às diferenças bioquímicas entre DNA e RNA, os Ts do DNA são substituídos pelos Us no RNAm. A sequência de RNAm é:
5'-AUGAUCUCGUAA-5'
A tradução envolve a leitura dos nucleotídeos do RNAm em grupos de três, cada qual especifica um aminoácido (ou fornece um sinal de parada indicando que a tradução terminou).
3'-AUG AUC UCG UAA-5'
AUG \rightarrow Metionina AUC \rightarrow Isoleucina UCG \rightarrow Serina UAA \rightarrow "Pare"
Sequência de polipeptídeo: (N-terminal) Metionina-Isoleucina-Serina (C-terminal)
Assim, durante a expressão de um gene codificante de proteína, a informação flui do DNA \rightarrow RNA \rightarrow proteína. Esse fluxo direcional de informação é conhecido como o dogma central da biologia molecular. Genes não codificantes de proteína (genes que especificam RNAs funcionais) ainda são transcritos para produzir um RNA, mas esse RNA não é traduzido em um polipeptídeo. Tanto para um quanto para outro tipo de gene, o processo de ir de um DNA para um produto funcional é conhecido como expressão gênica.
Você pode se perguntar porque a expressão de um gene tem uma etapa de transcrição. Porque uma sequência de DNA não se traduz diretamente na sequência de aminoácidos de um polipeptídeo?
Esta é uma ótima pergunta à qual não podemos dar uma resposta definitiva. Até certo ponto, isso é simplesmente a forma como o sistema de expressão gênica evoluiu e estamos especulando quando questionamos o "porquê" da transcrição. Se encontrássemos vida em outro planeta, ela poderia possivelmente expressar seus genes através de um processo diferente, que não envolvesse transcrição.
Nos organismos conhecidos, entretanto, a transcrição é uma parte essencial da expressão gênica. Mesmo se as células tivessem de alguma forma uma maneira de ler a sequência de DNA e a usassem para produzir uma proteína (o que elas não têm), há razões pelas quais a transcrição ainda seria uma etapa necessária::
  • Uma razão simples relaciona-se à localização. Em uma célula eucariótica, o DNA está fechado no núcleo, enquanto os ribossomos - máquinas moleculares usadas para fazer proteínas - estão no citoplasma. Assim, é preciso usar um "mensageiro" que transporte a informação do DNA para fora do núcleo para os ribossomos. Os RNAs mensageiros desempenham este papel.
  • A transcrição também fornece um ponto de controle importante no qual as células regulam quanto de um polipeptídeo é produzido. Embora outras etapas da expressão gênica possam também ser reguladas, o controle da transcrição é a forma mais comum da regulação gênica. Se a etapa da transcrição fosse de alguma maneira removida, as células perderiam muito de seu controle sobre quais polipeptídeos seriam produzidos e quando.

Transcrição

Na transcrição, uma fita de DNA que compõe um gene, chamada de fita não codificante, age como molde para a síntese de uma fita correspondente (complementar) de RNA por uma enzima chamada RNA polimerase. Essa fita de RNA é o transcrito primário.
As duas fitas de DNA têm as seguintes sequências:
5'-ATGATCTCGTAA-3' 3'-TACTAGAGCATT-5'
O DNA se abre para formar um bolha, e a fita inferior serve de molde para a síntese de uma fita complementar de RNA. Essa fita é chamada de fita molde. A transcrição da fita molde produz um RNAm quase igual a outra fita (fita codificante) do DNA em sequência. Contudo, devido a diferenças bioquímicas entre DNA e RNA, os Ts do DNA são substituídos por Us no RNAm. A sequência do RNAm é:
5'-AUGAUCUCGUAA-5'
O transcrito primário carrega a mesma sequência de informação que a fita de DNA não transcrita, algumas vezes chamada de fita codificante. Contudo, o transcrito primário e a fita codificante de DNA não são idênticos, graças a algumas diferenças bioquímicas entre DNA e RNA. Uma diferença importante é que as moléculas de RNA não incluem a base timina (T). Ao invés disso, elas têm uma base similar uracila (U). Como a timina, a uracila pareia com adenina.
Identidade dos açúcares. O açúcar em um nucleotídeo de RNA é a ribose, enquanto que o açúcar no DNA é a desoxirrbose. Eles são muito similares, mas a ribose tem um grupo hidroxil (OH-\text{OH}) ausente na desoxirribose.
Nucleotídeo de DNA: não possui um grupo hidroxila no carbono 2' do açúcar (ou seja, o açúcar é a desoxirribose). Possui uma base timina que tem um grupo metila ligado a seu anel.
Nucleotídeo de RNA: possui um grupo hidroxila no carbono 2' do açúcar (ou seja, o açúcar é a ribose). Possui uma base uracila que é uma estrutura muito semelhante à timina, mas não tem um grupo metila ligado ao anel.
Imagem baseada em imagem similar de CyberBridge3 CyberBridge ^ 3.
Número de fitas. A transcrição produz uma molécula de RNA de fita simples, enquanto a molécula de DNA inicial era de fita dupla.
Embora transcritos de RNA não sejam feitos de duas fitas separadas, o RNA pode algumas vezes dobrar-se sobre si mesmo para formar regiões de fita dupla e estruturas 3D complexas. Veremos exemplos de dobramento de RNA quando olharmos para o RNA transportador (RNAt) e tradução proteica. Ademais, alguns vírus têm genoma feito de RNA de fita dupla.
Veja o artigo sobre ácidos nucleicos para mais informações sobre DNA e RNA.

Transcrição e processamento de RNA: Eucariontes vs. bactérias

Nas bactérias, o transcrito primário de RNA pode servir diretamente como um RNA mensageiro, ou RNAm. RNAs mensageiros recebem esse nome pois agem como mensageiros entre o DNA e ribossomos. Ribossomos são estruturas de RNA e proteína dentro do hialoplasma, onde proteínas são realmente fabricadas.
Nos eucariontes (como os humanos), um transcrito primário tem de passar por umas etapas a mais de processamento para se tornar um RNAM maduro. Durante o processamento, caps são adicionadas às terminações do RNA, e alguns de seus pedaços podem ser cuidadosamente removidos em um processo chamado splicing. Essas etapas não acontecem em bactérias.
Célula eucariótica: A transcrição acontece no núcleo. O transcrito primário também passa por etapas de processamento no núcleo de modo a se tornar um RNAm maduro. O transcrito é então exportado para o hialoplasma, onde ele pode se associar a um ribossomo e dirigir a síntese de um polipeptídeo no processo de tradução.
Bactérias: A transcrição acontece no hialoplasma. Por causa disso, o RNAm não precisa viajar a lugar algum antes que possa ser traduzido por um ribossomo. Na verdade, um ribossomo pode começar a traduzir um RNAm antes mesmo que ele tenha sido totalmente transcrito (enquanto a transcrição ainda está ocorrendo).
A localização da transcrição também é diferente entre procariontes e eucariontes. A transcrição eucariótica acontece no núcleo, onde o DNA é guardado, enquanto a síntese de proteína ocorre no hialoplasma. Por causa disso, um RNAm eucariótico deve ser exportado do núcleo antes que ele possa ser traduzido em um polipeptídeo. Células procarióticas, por outro lado, não têm um núcleo, então elas executam tanto a transcrição quanto a tradução no hialoplasma.

Tradução

Apósa transcrição (e, nos eucariontes, após o processamento), uma molécula de RNAm está pronta para dirigir a síntese proteica. O processo de se usar informação contida em um RNAm para construir um polipeptídeo é chamado de tradução.

O código genético

Durante a tradução, a sequência de nucleotídeos de um RNAm é traduzida na sequência de aminoácidos de um polipeptídeo. Especificamente, os nucleotídeos do RNAm são lidos em tripletos (grupos de três) chamados códons. Há 6161 códons que especificam aminoácidos. Um códon é o códon de "início" que indica onde começar a tradução. O códon de início especifica o aminoácido metionina, assim a maioria dos polipeptídeos iniciam com este aminoácido. Três outros códons de “parada” sinalizam o final de um polipeptídeo. Essas relações entre códons e aminoácidos são chamadas de código genético.
Tabela de código genético. Cada sequência de três letras de nucleotídeos do RNAm corresponde a um aminácido específico ou um códon de parada. UGA, UAA e UAG são códons de parada. AUG é o códon da metionina e também é o códon de início.
_Crédito da imagem: "O código genético," por OpenStax College, Biology (CC BY 3.0)._
A sequência de RNAm é:
5'-AUGAUCUCGUAA-5'
A tradução envolve a leitura dos nucleotídeos do RNAm em grupos de três, cada qual especifica um aminoácido (ou fornece um sinal de parada indicando que a tradução terminou).
3'-AUG AUC UCG UAA-5'
AUG \rightarrow Metionina AUC \rightarrow Isoleucina UCG \rightarrow Serina UAA \rightarrow "Pare"
Sequência de polipeptídeo: (N-terminal) Metionina-Isoleucina-Serina (C-terminal)

Etapas da tradução

A Tradução ocorre dentro de estruturas conhecidas como ribossomos. Ribossomos são máquinas moleculares cujo trabalho é contruir polipeptídeos. Uma vez que o ribossomo se prende a um RNAm e encontra o códon de início, ele irá se mover rapidamente ao longo do RNAm, um códon de cada vez. Conforme for, ele irá gradualmente construindo uma cadeia de aminoácidos que espelha exatamente a sequência de códons no RNAm.
Como o ribossomo "sabe" qual aminoácido adicionar para cada códon? Na verdade, esse pareamento não é feito pelo próprio ribossomo. Ao invés disso, ele depende de um grupo especializado de moléculas de RNA chamadas RNAs transportadores (RNAt). Cada RNAt tem três nucleotídeos expostos em uma extremidade, que podem reconhecer (parear bases com) apenas um ou poucos códons específicos. Na outra extremidade, o RNAt carrega um aminoácido - especificamente o aminoácido que corresponde àqueles códons.
Tradução ocorrendo num ribossomo. O RNAm é ligado ao ribossomo onde pode interagir com a molécula de RNAt.
Nesta imagem, o RNAm tem a sequência de:
3'-...AUG UAC AUC UCG GAU...-5'
Um RNAt ligado ao terceiro códon (5'-AUC-3') tem uma sequência complementar de 3'-UAG-5'. Ele carrega uma cadeia de polipeptídeos consistindo de metionina e isoleucina, que estão ligadas ao RNAt pela isoleucina. A direita deste RNAt, outro RNAt está se ligando ao próximo códon (5'-UGC-3'). Este RNAt também tem um uma sequência complementar de nucleotídeos (3'-AGC-5') e carrega o aminoácido serina, que é o aminoácido especificado pelo códon do RNAm. A serina levada por este RNAt será adicionada à cadeia de polipeptídeo que está crescendo.
Outros RNAts carregando outros aminoácidos estão flutuando no entorno. Um carrega Glu (ácido glutâmico) e tem uma sequência de nucleotídeos em seu final que lê 3'-CUU-5'. O outro carrega Asp (ácido aspártico) e tem uma sequência de nucleotídeos em seu final, que lê 3'-CUA-5'.
Há muitos RNA transportadores flutuando pela célula, mas somente um RNAt que combina com (pareia as bases com) o códon que está sendo lido no momento pode se ligar e entregar sua carga de aminoácido. Uma vez que o RNAt está confortavelmente ligado ao seu códon correspondente no ribossomo, seu aminoácido será adicionado ao final da cadeia polipeptídica.
  1. O tRNA correspondente se liga ao códon exposto no encaixe mais à direita do ribossomo.
  2. A cadeia de aminoácidos é transferida do RNAt no meio do encaixe do ribossomo para o aminoácido do RNAt na extrema direita do encaixe. Isto tem o efeito de adicionar o aminoácido no final da cadeia de aminoácido.
  3. O ribossomo desloca-se sobre um códon. O RNAt anteriormente no encaixe do meio, move-se para o encaixe mais à esquerda e sai do ribossomo.O RNAt que estava no encaixe da direita move-se para o encaixe do meio e continua preso à cadeia de aminoácido. Um novo códon fica exposto no encaixe mais à direita permitindo sua união com um novo RNAt .
Esse processo se repete várias vezes, com o ribossomo se movendo ao longo do RNAm um códon de cada vez. Uma cadeia de aminoácidos é construída um por um, com uma sequência de aminoácidos que corresponde à sequência de códons encontrados no RNAm. A tradução termina quando o ribossomo chega a um códon de parada e solta o polipeptídeo.

O que acontece em seguida?

Uma vez que o polipeptídeo está terminado, ele pode ser processado ou modificado, combinado com outros polipeptídeos ou enviado a um destino específico dentro ou fora da célula. Em última instância, ele irá realizar um trabalho específico de que a célula ou o organismo necessita - talvez como uma molécula sinalizadora, elemento estrutural ou enzima!

Resumo:

  • O DNA é dividido em unidades funcionais chamadas genes, que podem especificar polipeptídeos (proteínas e subunidades de proteínas) ou RNAs funcionais (como RNAt e RNAr).
  • Informação de um gene é usada para construir um produto funcional em um processo chamado expressão gênica.
  • Um gene que codifica um polipeptídeo é expresso em duas etapas. Nesse processo, a informação flui do DNA \rightarrow RNA \rightarrow proteína, uma relação direcional conhecida como dogma central da biologia molecular.
    • Transcrição: Uma fita do DNA do gene é copiada para RNA. Nos eucariontes, o transcrito de RNA deve passar por etapas adicionais de processamento para se tornar um RNA mensageiro (RNAm) maduro.
    • Tradução: A sequência de nucleotídeos do RNAm é decodificada para especificar a sequência de aminoácidos de um polipeptídeo. Este processo ocorre dentro de um ribossomo e requer moléculas adaptadoras chamadas de RNAt.
  • Durante a tradução, os nucleotídeos do RNAm são lidos em grupos de três, chamados códons. Cada códon especifica um aminoácido em particular ou um sinal de parada. Esse conjunto de relações é conhecido como o código genético.
Este artigo está autorizado sob licença CC BY-NC-SA 4.0.

Referências:

  1. Hellens, R. P., Moreau, C., Lin-Wang, K., Schwinn, K. E., Thomson, S. J., Fiers, M. W. E. J., . . . Noel Ellis, T. H. (2010, October 11). Identification of Mendel's white flower character. PLOS ONE. http://dx.doi.org/10.1371/journal.pone.0013230.
  2. Reece, J. B., Urry, L. A., Cain, M. L., Wasserman, S. A., Minorsky, P. V., and Jackson, R. B. (2011). Figura 14.4. Alleles, alternative versions of a gene. Em Campbell biology (10th ed., p. 271). San Francisco, CA: Pearson.
  3. CyberBridge. (2007). RNA structure. Em Structure of DNA. Disponível em http://cyberbridge.mcb.harvard.edu/dna_3.html.

Referências:

Hellens, R. P., Moreau, C., Lin-Wang, K., Schwinn, K. E., Thomson, S. J., Fiers, M. W. E. J., . . . Noel Ellis, T. H. (2010, October 11). Identification of Mendel's white flower character. PLOS ONE. http://dx.doi.org/10.1371/journal.pone.0013230.
OpenStax College, Biology. (2015, December 29). The genetic code. Em OpenStax CNX. Disponível em http://cnx.org/contents/GFy_h8cu@9.87:QEibhJMi@8/The-Genetic-Code.
Purves, W. K., Sadava, D. E., Orians, G. H., and Heller, H.C. (2004). DNA, RNA, and the flow of information. Em Life: the science of biology (7th ed., pp. 236-237). Sunderland, MA: Sinauer Associates.
Reece, J. B., Urry, L. A., Cain, M. L., Wasserman, S. A., Minorsky, P. V., and Jackson, R. B. (2011). Genes specify proteins via transcription and translatioin. Em Campbell biology (10th ed., pp. 334-340). San Francisco, CA: Pearson.

Agradecimentos:

Agradecimentos a Willy McAllister pelos relevantes comentários sobre este artigo.
Carregando