If you're seeing this message, it means we're having trouble loading external resources on our website.

Se você está atrás de um filtro da Web, certifique-se que os domínios *.kastatic.org e *.kasandbox.org estão desbloqueados.

Conteúdo principal

O código genético

Como a informação contida em uma cadeia de mRNA é decodificada para formar um polipeptídeo? Aprenda como grupos de três nucleotídeos, chamados códons, especificam os aminoácidos (bem como os sinais de início e fim de tradução).

Introdução

Alguma vez você escreveu uma mensagem secreta para algum de seus amigos? Se escreveu, você deve ter usado algum tipo de código para manter a mensagem escondida. Por exemplo, você pode ter trocado letras das palavras por números e símbolos, seguindo um conjunto particular de regras. Para que seu amigo pudesse compreender a mensagem, ele também teria que conhecer o código e aplicar o mesmo conjunto de regras, porém ao contrário, para compreender o que você escreveu.
Como se vê, a decodificação de mensagens também uma etapa fundamental na expressão genética, processo no qual a informação do gene é usada para construir uma proteína (ou outro produto funcional). Como são passadas as instruções para construir uma proteína codificada no DNA e como elas são decifradas pelas células? Neste artigo, vamos dar uma olhada de perto no código genético, o qual permite que sequências de nucleotídeos de DNA e de RNA sejam traduzidas nos aminoácidos que elas representam.

Visão geral: expressão genética e o código genético

Os genes que fornecem instruções para proteínas são expressos num processo de duas etapas.
  • Na transcrição, a sequência de DNA de um gene é "reescrita" utilizando nucleotídeos de RNA. Nos eucariontes, o RNA deve passar por etapas adicionais de processamento para se tornar um RNA mensageiro, ou RNAm.
  • Na tradução, a sequência de nucleotídeos no RNAm é "traduzida" numa sequência de aminoácidos de um polipeptídeo (proteína ou sub unidade de proteína).
As células decodificam os RNAms pela leitura de seus nucleotídeos em grupos de três, chamados códons. Cada códon especifica um determinado aminoácido ou, em alguns casos, fornece o sinal de "pare" que termina a tradução. Além disso, o códon AUG desempenha um papel especial, servindo de códon de partida, no qual a tradução começa. O conjunto completo de correspondências entre códons e aminoácidos (ou sinais de pare) é conhecido como código genético.
A sequência de RNAm é:
5'-AUGAUCUCGUAA-5'
A tradução envolve a leitura dos nucleotídeos do RNAm em grupos de três, cada qual especifica um aminoácido (ou fornece um sinal de parada indicando que a tradução terminou).
3'-AUG AUC UCG UAA-5'
AUG Metionina AUC Isoleucina UCG Serina UAA "Pare"
Sequência de polipeptídeo: (N-terminal) Metionina-Isoleucina-Serina (C-terminal)
No resto deste artigo, examinaremos mais detalhadamente o código genético. Primeiro, veremos como ele foi descoberto. Depois, vamos olhar mais profundamente para as suas propriedades, vendo como ele pode ser usado para prever o polipeptídeo codificado pelo RNAm.

Quebradores de códigos: Como o código genético foi descoberto

Para decifrar o código genético, pesquisadores precisaram descobrir como as sequências de nucleotídeos em uma molécula de DNA ou de RNA poderiam codificar a sequência de aminoácidos em um polipeptídeo.
Por que isso era um problema complicado? Num dos códigos potenciais mais simples possível, cada nucleotídeo numa molécula de DNA ou de RNA poderia corresponder a um aminoácido num polipeptídeo. Contudo, esse código poderia não funcionar, porque há 20 aminoácidos comumente encontrados em proteínas e só 4 bases de nucleotídeos no DNA ou RNA. Assim, pesquisadores sabiam que o código deveria envolver algo mais complexo do que uma correspondência linear de nucleotídeos e aminoácidos.

A hipótese do tripleto

Em meados da década de 1950, o físico George Gamow estendeu esta linha de pensamento para deduzir que o código genético era composto provavelmente de tripletos de nucleotídeos. Isto é, ele propôs que um grupo de 3 nucleotídeos sucessivos em um gene poderia codificar um aminoácido em um polipeptídeo.
O raciocínio de Gamow era que até mesmo um código de dubletos (2 nucleotídeos por aminoácido) não funcionaria, pois permitiria apenas 16 grupos ordenados de nucleotídeos (42), muito poucos para os 20 padrões de aminoácidos utilizados para construir proteínas. Um código baseado em nucleotídeos tripletos, no entanto, parecia promissor: forneceria 64 sequências únicas de nucleotídeos (43), mais do que o suficiente para cobrir os 20 aminoácidos.

Nirenberg, Khorana, e a identificação dos códons

A hipótese do tripleto de Gamow parecia lógica e foi amplamente aceita. No entanto, não foi provada experimentalmente, e os pesquisadores ainda não sabiam quais tripletos de nucleotídeos correspondiam a quais aminoácidos.
O desvendar do código genético começou em 1961, com o trabalho do bioquímico americano Marshall Nirenberg. Pela primeira vez, Nirenberg e seus colegas foram capazes de identificar tripletos específicos de nucleotídeos que correspondiam a aminoácidos particulares. Seu sucesso dependia de duas inovações experimentais:
  • Uma maneira de fazer moléculas de RNAm artificiais com sequências específicas e conhecidas.
  • Um sistema para traduzir os RNAsm em polipeptídeos fora de uma célula (um sistema "livre de células"). O sistema de Nirenberg consistia em citoplasma originado da ruptura de células de E. coli, que contém todos os materiais necessários para a tradução
Primeiro, Nirenberg sintetizou uma molécula de RNAm que consistia apenas do nucleotídeo uracila (chamado de poli-U). Ao adicionar o RNAm poli-U no sistema livre de células, ele descobriu que os polipeptídeos formados eram exclusivamente o aminoácido fenilalanina. Como o único tripleto do RNAm poli-U é UUU, Nirenberg concluiu que o UUU poderia codificar para fenilalanina. Utilizando essa mesma abordagem, ele foi capaz de mostrar que o RNAm poli-C era traduzido em polipeptídeos formados exclusivamente pelo aminoácido prolina, sugerindo que o tripleto CCC poderia codificar a prolina.
Outros pesquisadores, como o bioquímico Har Gobind Khorana, na Universidade de Wisconsin, estenderam o experimento de Nirenberg sintetizando RNAms artificiais com sequências mais complexas. Por exemplo, em um experimento, Khorana gerou um RNAm poli-UC (UCUCUCUCUC…) e o adicionou a um sistema livre de célula similar ao de Nirenberg. O RNAm poli-UC foi traduzido em polipeptídeos com um padrão alternado de aminoácidos serina e leucina. Esses outros resultados inequivocamente confirmaram que o código genético era baseado em tripletos, ou códons. Hoje, sabemos que a serina é codificada pelo códon UCU, enquanto a leucina é codificada por CUC.
Em 1965, utilizando o sistema livre de células e outras técnicas, Nirenberg, Khorana e seus colegas decifraram todo o código genético. Isto é, eles identificaram o aminoácido ou sinal de "parada" correspondente a cada um dos 64 códons de nucleotídeos. Por suas contribuições, Nirenberg e Khorana (juntamente com outro pesquisador de código genético, Robert Holley) receberam o prêmio Nobel em 1968.
_Esquerda: Imagem modificada de "Marshall Nirenberg and Heinrich Matthaei," por N. MacVicar (public domain). Direita: "Har Gobind Khorana" (public domain)._

Propriedades do código genético

Como vimos acima, o código genético é baseado em tripletos de nucleotídeos chamados códons, que especificam aminoácidos individuais em um polipeptídeo (ou sinais de "pare" em sua extremidade). Os códons de RNAm são "lidos" um por um dentro de estruturas de proteínas e RNA chamadas ribossomos, começando no terminal 5 do gene e avançando em direção ao terminal 3. Vamos olhar mais atentamente para o código genético no contexto da tradução.

Tipos de códons (iniciação, finalização e "normal")

Tabela de código genético. Cada sequência de três letras de nucleotídeos do RNAm corresponde a um aminácido específico ou um códon de parada. UGA, UAA e UAG são códons de parada. AUG é o códon da metionina e também é o códon de início.
_Crédito da imagem: "O código genético," por OpenStax College, Biology (CC BY 3.0)._
A tradução sempre começa em um códon de iniciação que contém a sequência AUG e codifica o aminoácido metionina (Met) na maioria dos organismos. Assim, todo polipeptídeo normalmente começa com metionina, apesar de a metionina inicial poder ser cortada em etapas de processamento posteriores. O códon AUG pode também aparecer mais tarde em um RNAm, caso em que ele apenas especifica o aminoácido metionina.
Como a tradução começa no códon de iniciação, os códons seguintes do RNAm serão lidos um a um, na direção de 5 para 3. Assim que cada códon é lido, o aminoácido correspondente é adicionado ao C-terminal do polipeptídeo. A maioria dos códons no código genético especificam aminoácidos e são lidos durante essa fase de tradução.
A tradução continua até que um códon de finalização é alcançado. Há também três códons de finalização no código genético, UAA, UAG e UGA. Ao contrário de códons de iniciação, códons de finalização não correspondem a um aminoácido. Em vez disso, eles agem como sinais de "parada", indicando que o polipeptídeo está completo e fazendo com que seja liberado do ribossomo. Mais nucleotídeos podem aparecer após o códon de finalização no RNAm, mas não será traduzido como parte do polipeptídeo.

Pauta de leitura

O códon de iniciação é vital porque determina onde a tradução vai começar no RNAm. Mais importante, a posição do códon de iniciação determina o sistema de leitura, isto é, como a sequência de RNAm é dividida em grupos de três nucleotídeos dentro do ribossomo. Como mostra o diagrama abaixo, a mesma sequência de nucleotídeos pode codificar polipeptídeos completamente diferentes dependendo do sistema de leitura utilizado. O códon de iniciação determina que sistema de leitura é escolhido e assim assegura que o polipeptídeo correto é produzido.
Para verificar qual é o sistema de leitura, pode ser útil fazer analogias usando palavras e letras. A seguinte mensagem faz sentido porque a lemos no sistema correto (dividindo-o corretamente em grupos de três letras): EVA VIU UMA UVA OCA. Se mudarmos o sistema de leitura agrupando as letras em três, mas iniciando uma posição depois, teremos: VAV IUU MAU VAO CA, que não tem sentido. A mudança de sistema resulta em uma mensagem que não tem mais sentido.
Um ponto importante a se notar é que os nucleotídeos em um gene não estão fisicamente organizados em grupos de três. Em vez disso, o que constitui um códon é simplesmente uma questão de em que ponto o ribossomo inicia a leitura e qual sequência de nucleotídeos vem após o códon inicial. As mutações que inserem ou removem um único nucleotídeo podem alterar o sistema de leitura, causando a produção de uma proteína sem nexo, como a sentença sem sentido do exemplo anterior.

Um aminoácido, muitos códons

Como já foi mencionado, o código genético é composto por 64 códons únicos. Mas se existem apenas 20 aminoácidos, o que fazem os outros 44 códons? Como vimos, alguns são códons de parada, mas a maior parte não. Na realidade, o código genético é um código redundante, o que significa que alguns aminoácidos são codificados por mais do que um códon. Por exemplo, a prolina é representada por quatro códons diferentes (CCU, CCC, CCA e CCG). Se algum desses códons aparecer no RNAm, uma prolina será adicionada à cadeia polipeptídica.
A maioria dos aminoácidos no código genético são codificados por pelo menos dois códons. De fato, metionina e triptofano são os únicos aminoácidos codificados por um único códon, Mas o mais importante é que o inverso não é verdadeiro: cada códon especifica apenas um aminoácido ou um sinal de parada. Assim, não há ambiguidade (incerteza) no código genético. Um códon específico num RNAm será sempre previsivelmente traduzido num aminoácido específico ou num sinal de parada.

O código genético é (aproximadamente) universal

Com algumas poucas exceções, todos os organismos vivos da Terra usam o mesmo código genético. Isso quer dizer que os códons que especificam os 20 aminoácidos em suas células são os mesmos usados pelas bactérias que habitam as fontes hidrotermais do fundo do Oceano Pacífico. Mesmo nos organismos que não utilizam o código "padrão", as diferenças são relativamente pequenas, tais como uma mudança no aminoácido codificado por um códon específico.
Um código genético compartilhado por diversos organismos fornece evidências importantes da origem comum da vida na Terra. Ou seja, muitas espécies que atualmente vivem na Terra provavelmente evoluíram a partir de um organismo ancestral no qual o código genético já estava presente. Como o código é essencial para as funções celulares, ele tenderia a permanecer inalterado nas espécie ao longo das gerações, porque os indivíduos com alterações significativas podem ser incapazes de sobreviver. Esse tipo de processo evolutivo pode explicar a notável semelhança do código genético dos organismos atuais.

Quer participar da conversa?

  • Avatar duskpin ultimate style do usuário Matheus Klinsmann de Sousa Donato
    Excelente artigo!
    Leitura rápida, fluida e agradável.
    Obrigado, Khan! ♥
    (1 voto)
    Avatar Default Khan Academy avatar do usuário
  • Avatar leaf green style do usuário Josué
    Exemplo de um código:
    01000011 01101111 01101101 01101111 00100000 01110011 01100101 00100000 01110110 11000011 10101010 00101100 00100000 01100001 00100000 01100100 01100101 01100011 01101111 01100100 01101001 01100110 01101001 01100011 01100001 11000011 10100111 11000011 10100011 01101111 00100000 01100100 01100101 00100000 01101101 01100101 01101110 01110011 01100001 01100111 01100101 01101110 01110011 00100000 01110100 01100001 01101101 01100010 11000011 10101001 01101101 00100000 01110101 01101101 01100001 00100000 01100101 01110100 01100001 01110000 01100001 00100000 01100110 01110101 01101110 01100100 01100001 01101101 01100101 01101110 01110100 01100001 01101100 00100000 01101110 01100001 00100000 01100101 01111000 01110000 01110010 01100101 01110011 01110011 11000011 10100011 01101111 00100000 01100111 01100101 01101110 11000011 10101001 01110100 01101001 01100011 01100001
    (0 votos)
    Avatar Default Khan Academy avatar do usuário
Você entende inglês? Clique aqui para ver mais debates na versão em inglês do site da Khan Academy.