Código genético

O código genético é o conjunto de regras que permite traduzir as informações contidas no genoma das células vivas para a síntese de proteínas . Em sentido amplo, estabelece a correspondência entre o genótipo e o fenótipo de um organismo . Este código baseia-se, em particular, na correspondência entre, por um lado, tripletos de nucleotídeos , denominados códons , no RNA mensageiro e, por outro lado, os aminoácidos proteinogênicos incorporados às proteínas sintetizadas durante a fase de tradução do RNA mensageiro. por ribossomos .

Com algumas exceções, cada códon corresponde a um único aminoácido proteinogênico. Uma vez que a informação genética é codificada exatamente da mesma maneira nos genes da vasta maioria das diferentes espécies vivas , esse código genético específico é geralmente referido como o código genético padrão, ou canônico, ou mesmo simplesmente como "O" código genético; no entanto, há um certo número de variantes desse código genético, mas que geralmente são limitadas a alguns códons. Essas variantes existem, por exemplo, dentro das próprias células humanas, entre seu citosol e suas mitocôndrias .

A correspondência entre códons de RNA mensageiro e aminoácidos proteinogênicos é geralmente apresentada na forma de tabelas associando cada um dos 64 códons, ou tripletos de quatro bases nucleicas possíveis ( 4 3 = 64 ), com um dos 22 aminoácidos proteinogênicos.

Por extensão, e de forma inadequada, o público em geral às vezes chama de "código genético" o que é de fato o genótipo de uma célula, ou seja, todos os seus genes .

principais características

Durante a expressão de proteínas do genoma , segmentos de DNA genômico são transcritos em RNA mensageiro . Este RNA mensageiro (ou mRNA) contém regiões não codificantes, que não são traduzidas em proteínas, e uma ou mais regiões codificantes, que são traduzidas pelos ribossomos para produzir uma ou mais proteínas . O MRNA é formado pela sequência de quatro tipos de bases nucléicas , A , C , G e U , que constituem as " letras " com as quais o código genético é escrito. Este último é composto por " palavras " de 3 letras (nucleotídeos) chamadas códons . Nas regiões de codificação do RNA mensageiro, cada códon é traduzido em um dos 22 aminoácidos proteinogênicos na proteína a ser sintetizada.

O número de palavras de três letras retiradas de um alfabeto de quatro letras sendo 4 3 , o código genético compreende 64 códons diferentes, codificando diretamente 20 aminoácidos chamados "padrão", bem como o sinal de fim de tradução, sendo este último codificado por um dos 3 códons de parada ou códons de terminação. Dois raros aminoácidos, selenocisteína e pirrolisina , são inseridos no nível de certos códons de parada, a recodificação dos quais em códons de aminoácidos ocorre na presença de estruturas particulares do tipo haste-alça ou grampo de cabelo, induzidas por sequências de inserção específicas no mensageiro RNA.

Frame da leitura

Um códon é definido pelo primeiro nucleotídeo a partir do qual a tradução começa. Assim, a cadeia GGGAAACCC pode ser lida de acordo com os códons GGG · AAA · CCC, GGA · AAC e GAA · ACC dependendo se a leitura do códon é iniciada a partir do primeiro, segundo ou terceiro nucleotídeo, respectivamente. Qualquer sequência de nucleotídeos pode então ser lida de acordo com três quadros de leitura distintos, que resultam em traduções em aminoácidos completamente diferentes: em nosso exemplo, teríamos respectivamente os aminoácidos Gly - Lys - Pro , Gly - Asn e Glu - Thr .

Nos genes, o quadro de leitura geralmente começa com um códon AUG que codifica a metionina , ou N- formilmetionina em bactérias e nas mitocôndrias e cloroplastos de eucarióticos .

Códons de iniciação, terminação

A tradução genética pelo ribossomo começa com um códon inicial , às vezes chamado de códon inicial. Ao contrário dos códons de parada , o códon de início sozinho não é suficiente para iniciar a tradução. O sítio de ligação ao ribossomo ( RBS ) em procariotos e os fatores de iniciação em procariotos e eucariotos são essenciais para o início da tradução. O códon de iniciação mais comum é o AUG, correspondendo à metionina ou, em bactérias , à N- formilmetionina . GUG e UUG, que correspondem respectivamente à valina e à leucina no código genético padrão, também podem ser códons de iniciação em certos organismos, sendo neste caso interpretados como códons para metionina ou N- formilmetionina .

Os três códons de parada do UAG, UGA e UAA, receberam nomes durante sua descoberta, respectivamente âmbar , opala e ocre . Eles também são chamados de códons de parada ou códons de terminação. Eles fazem com que o ribossomo pare e a liberação da cadeia polipeptídica recém-formada pela ausência de RNA de transferência com anticódons adequados (não há aminoácido correspondente aos tripletos UAG, UGA e UAA), o que causa a ligação de um fator de terminação .

Efeito de mutações

Após a replicação do DNA , podem ocorrer erros de transcrição durante a polimerização da segunda fita de DNA pela DNA polimerase . Esses erros, chamados de mutações , podem ter consequências no fenótipo de um ser vivo , principalmente se ocorrerem nas regiões codificadoras de um gene . A taxa de erro é geralmente muito baixa, na ordem de um erro de replicação em dez centenas de milhões de bases replicadas por meio da função de revisão e revisão ( revisão ) de DNA polimerases.

Missense mutações e sem sentido mutações são exemplos de mutações pontuais , que podem causar doenças genéticas tais como anemia falciforme e talassemia, respectivamente . Mutações missense que têm um impacto fisiológico significativo são aquelas que levam à mudança da natureza físico-química - por exemplo, o impedimento estérico , a natureza hidrofílica ou hidrofóbica , a carga elétrica , a natureza ácida ou básica - de um resíduo de aminoácido importante para a função da proteína modificada. Mutações sem sentido levam à introdução prematura de um códon de parada na sequência da proteína a ser transcrita, que é assim truncada e, portanto, a função fisiológica nos tecidos é geralmente alterada.

As mutações que afetam a transcrição por indels - inserções e deleções - de um número de nucleotídeos que não é múltiplo de 3 correspondem a um deslocamento do quadro de leitura . Tais mutações geralmente resultam em um polipeptídeo que é totalmente diferente do original, tanto na sequência dos resíduos de aminoácidos traduzidos quanto no comprimento da cadeia polipeptídica produzida, uma vez que a posição dos códons de parada é geralmente alterada durante tal mutação. É provável que essas mutações tornem as proteínas resultantes inoperantes, tornando-as muito raras em sequências de codificação de proteínas, pois costumam ser incompatíveis com a sobrevivência do organismo afetado. Quando ocorrem, podem causar doenças genéticas graves, como a doença de Tay-Sachs .

Embora a grande maioria das mutações que afetam a sequência da proteína sejam deletérias ou inconseqüentes, algumas podem ter efeitos benéficos. Algumas dessas mutações podem, por exemplo, permitir que os organismos nos quais ocorrem resistam às condições de estresse ambiental melhor do que a forma selvagem, ou se multipliquem mais rapidamente. Essas mutações são então favorecidas pela seleção natural . Os vírus de RNA têm uma alta taxa de mutação, o que é uma vantagem para eles, permitindo que evoluam continuamente e evitem o sistema imunológico de seu hospedeiro . Em grandes populações de organismos que se reproduzem assexuadamente, por exemplo em E. coli , várias mutações benéficas podem ocorrer ao mesmo tempo; esse fenômeno é denominado interferência clonal e se manifesta na competição entre essas diferentes mutações, muitas vezes levando à generalização de uma delas em detrimento das outras.

Degeneração do código genético

O fato de que os 64 códons codificam apenas 22 aminoácidos proteinogênicos , mais os códons de terminação, leva a muitas redundâncias. Isso faz com que um aminoácido padrão seja codificado em média por três códons distintos - até seis códons diferentes. Estamos falando de códons sinônimos. Dos 20 aminoácidos padrão, apenas metionina e triptofano são codificados por apenas um códon, enquanto asparagina , aspartato , cisteína , glutamato , glutamina , histidina , lisina , fenilalanina e a tirosina são codificados por dois códons distintos, a isoleucina e a terminação da tradução são codificados por três códons distintos, a treonina , a prolina , a alanina , uma glicina e valina são codificados por quatro códons diferentes, e arginina , leucina e serina são codificados por seis códons. Portanto, há frequentemente vários RNAs de transferência associados ao mesmo aminoácido, capazes de se ligar aos diferentes tripletos degenerados de nucleotídeos no RNA. Falamos então de isoacceptores de tRNA, porque eles aceitam o mesmo aminoácido.

O uso por um dado organismo dos diferentes códons sinônimos para um aminoácido não é aleatório. Geralmente observamos o que é chamado de viés de uso de código . A célula em geral expressa preferências bastante marcadas na escolha de códons sinônimos, então, por exemplo, o códon AUA que codifica a isoleucina é amplamente evitado em humanos como em Escherichia coli , em comparação com os outros dois códons sinônimos AUU e AUC. Essa preferência pelo uso de códons varia muito dependendo do organismo e depende, dentro de um mesmo genoma , da fração considerada ( nuclear , mitocondrial , cloroplástica ). Por outro lado, é bastante geral para todos os genes carregados pela mesma fração do genoma.

Se o código genético é degenerado, entretanto, não é ambíguo: cada códon normalmente especifica apenas um aminoácido e um. Cada aminoácido padrão é codificado em média por três códons diferentes, de modo que, estatisticamente, uma mutação em três não leva a nenhuma modificação da proteína traduzida: tal mutação é então considerada silenciosa. Uma consequência prática desta degeneração é que uma mutação no terceiro nucleotídeo de um códon geralmente causa apenas uma mutação silenciosa ou a substituição de um resíduo por outro tendo as mesmas propriedades hidrofílicas ou hidrofóbicas , ácidas ou básicas , e também impedimento estérico .

Prevalência de códon

Seria de se esperar que as frequências de códons sinônimas para um determinado aminoácido fossem equivalentes, mas, ao contrário, estudos encontraram uma prevalência de códons (em inglês: codon bias) que tende a afetar a estrutura final das proteínas. Essa prevalência também experimentaria uma certa variabilidade entre as linhas.

Tabela de códon de RNA mensageiro

A biossíntese de proteínas é baseada no código genético . O DNA é transcrito em RNA mensageiro (RNA m ). Isso é traduzido por ribossomos que montam os aminoácidos presentes no RNA de transferência (RNA t ). O RNA t contém um " anti-códon ", complementar a um códon, e carrega o códon de aminoácido correspondente. A esterificação específica do aminoácido correspondente a um dado tRNA é realizada por aminoacil-tRNA sintetases , uma família de enzimas cada uma específica para um dado aminoácido. Durante a tradução, o ribossomo RNA leito m códon por códon, conecta um códon RNA m com o anti-códon de um RNA t e adiciona o aminoácido transportado por este último à proteína que está sendo sintetizada.

A tabela a seguir fornece o significado padrão de cada códon de três nucleobases do RNA mensageiro . As principais codificações alternativas são indicadas após uma barra :

Tabela de códons de RNA

1 r de base	2 nd base de								3 rd base de
1 r de base	você		VS		NO		G		3 rd base de
você	UUU	F Phe	UCU	S Ser	UAU	Y Tyr	UGU	C Cys	você
	UUC	F Phe	UCC	S Ser	UAC	Y Tyr	UGC	C Cys	VS
	UUA	L Leu	UCA	S Ser	UAA	Pare de ocre	UGA	Parar opala /U seg /W Trp	NO
	UUG	L Leu / iniciação	UCG	S Ser	UAG	Pare âmbar /O Pyl	UGG	W Trp	G
VS	CUU	L Leu	CCU	P Pró	CAU	H Seu	CGU	R Arg	você
	CUC	L Leu	CCC	P Pró	CAC	H Seu	CGC	R Arg	VS
	AUC	L Leu	CCA	P Pró	CAA	Q Gln	CGA	R Arg	NO
	CUG	L Leu / iniciação	CCG	P Pró	CAG	Q Gln	CGG	R Arg	G
NO	AUU	I Ilha	ACU	T Thr	AAU	N Asn	AGU	S Ser	você
	AUC	I Ilha	ACC	T Thr	AAC	N Asn	AGC	S Ser	VS
	AUA	I Ilha	PARA ISSO	T Thr	AAA	K Lírios	AGM	R Arg	NO
	AGO	M Conhecida e iniciação	ACG	T Thr	AAG	K Lírios	AGG	R Arg	G
G	GUU	V Val	GCU	A Para o	GAU	D Asp	GGU	G Gly	você
	GUC	V Val	GCC	A Para o	GAC	D Asp	GGC	G Gly	VS
	GUA	V Val	GCA	A Para o	GAA	E Cola	GGA	G Gly	NO
	GUG	V Val	GCG	A Para o	MORDAÇA	E Cola	GGG	G Gly	G

Uma forma compacta de representar as mesmas informações usa os símbolos de aminoácidos de uma letra:

Acide aminé : FFLLSSSSYY**CC*WLLLLPPPPHHQQRRRRIIIMTTTTNNKKSSRRVVVVAAAADDEEGGGG Initiation : ···M···············M···············M···························· 1re base : UUUUUUUUUUUUUUUUCCCCCCCCCCCCCCCCAAAAAAAAAAAAAAAAGGGGGGGGGGGGGGGG 2e base : UUUUCCCCAAAAGGGGUUUUCCCCAAAAGGGGUUUUCCCCAAAAGGGGUUUUCCCCAAAAGGGG 3e base : UCAGUCAGUCAGUCAGUCAGUCAGUCAGUCAGUCAGUCAGUCAGUCAGUCAGUCAGUCAGUCAG Mesa reversa

Como cada aminoácido de uma proteína é codificado por um ou mais códons, às vezes é útil consultar a tabela a seguir; as principais codificações alternativas são indicadas em pequenos caracteres entre parênteses.

Aminoácido			Códons	Compactado
Alanina	NO	Para o	GCU, GCC, GCA, GCG.	GCN
Arginina	R	Arg	CGU, CGC, CGA, CGG; AGA, AGG.	CGN, MGR
Asparagina	NÃO	Asn	AAU, AAC.	AAY
Ácido aspártico	D	Asp	GAU, GAC.	GAY
Cisteína	VS	Cys	UGU, UGC.	UGY
Glutamina	Q	Gln	CAA, CAG.	PORQUE
Ácido glutâmico	E	Cola	GAA, GAG.	GAR
Glicínia	G	Gly	GGU, GGC, GGA, GGG.	GGN
Histidina	H	Seu	CAU, CAC.	CAY
Isoleucina	eu	Ilha	AUU, AUC, AUA.	AUH
Leucina	eu	Leu	UUA, UUG; CUU, CUC, CUA, CUG.	YUR, CUN
Lisina	K	Lírios	AAA, AAG.	AAR
Metionina	M	Conheceu	AGO
Fenilalanina	F	Phe	UUU, UUC.	UUY
Proline	P	Pró	CCU, CCC, CCA, CCG.	CCN
Pirrolisina	O	Pyl	UAG, antes do elemento PYLIS .
Selenocisteína	você	Seco	UGA, com sequência SECIS .
Serine	S	Ser	UCU, UCC, UCA, UCG; AGU, AGC.	UCN, AGY
Treonina	T	Thr	ACU, ACC, ACA, ACG.	ACN
Triptofano	C	Trp	UGG. (UGA)
Tirosina	Y	Tyr	UAU, UAC.	UAY
Valine	V	Val	GUU, GUC, GUA, GUG.	ARMA DE FOGO
Iniciação			AGO (UUG, CUG)
Terminação	*		UAG, UAA; UGA.	UAR, URA

A região de codificação de um mRNA termina com um códon de parada . Existem três códons de parada (UAG, UAA e UGA) que desencadeiam a parada da tradução pelo ribossomo e a liberação da proteína completa.

Variantes do código genético

A existência de variantes do código genético foi demonstrada em 1979 com o código genético das mitocôndrias humanas e, mais geralmente, das mitocôndrias de vertebrados :

Acide aminé : FFLLSSSSYY**CCWWLLLLPPPPHHQQRRRRIIMMTTTTNNKKSS**VVVVAAAADDEEGGGG Initiation : ································MMMM···············M············ 1re base : UUUUUUUUUUUUUUUUCCCCCCCCCCCCCCCCAAAAAAAAAAAAAAAAGGGGGGGGGGGGGGGG 2e base : UUUUCCCCAAAAGGGGUUUUCCCCAAAAGGGGUUUUCCCCAAAAGGGGUUUUCCCCAAAAGGGG 3e base : UCAGUCAGUCAGUCAGUCAGUCAGUCAGUCAGUCAGUCAGUCAGUCAGUCAGUCAGUCAGUCAG

Muitas outras variantes do código genético foram observadas desde então, incluindo várias variantes mitocondriais e variantes leves, como a tradução do códon UGA por triptofano em vez de um códon de parada em Mycoplasma e tradução do códon CUG por serina . Do que leucina em certos leveduras como Candida albicans . A tabela abaixo resume algumas variantes importantes do código genético:

Códons de RNA mensageiro	UGA	CUU	CUC	AUC	CUG	GUG	CGA	CGC	AUU	AUC	AUA	AGM	AGG
Código genético padrão	Prazo	Leu	Leu	Leu	Leu	Val	Arg	Arg	Ilha	Ilha	Ilha	Arg	Arg
Mitocôndria de vertebrados	Trp								Iniciar	Iniciar	Iniciar	Prazo	Prazo
Mitocôndria de ascídias	Trp								Iniciar	Iniciar	Iniciar	Gly	Gly
Mitocôndria de fermento	Trp	Thr	Thr	Thr	Thr		Abdômen	Abdômen			Iniciar
Mitocôndria de invertebrados	Trp								Iniciar	Iniciar	Iniciar	Ser	Ser
Bactérias , arquéias e plastídios de plantas						Iniciar			Iniciar	Iniciar	Iniciar

Na medida em que os vírus se reproduzem usando os recursos metabólicos - e, portanto, o código genético - de seus hospedeiros , uma variação no código genético pode afetar as proteínas sintetizadas e, portanto, sua capacidade de reprodução; certos vírus, como os do gênero Totivirus (en) , adaptaram-se assim às variações do código genético de seu hospedeiro. Em bactérias e arquéias , GUG e UUG são códons de iniciação comuns, mas em alguns casos raros, algumas proteínas usam códons de iniciação que não são normalmente aqueles dessas espécies.

Certas proteínas usam aminoácidos não padronizados codificados por códons de parada na presença de sequências particulares no RNA mensageiro . Assim, o códon de parada UGA pode ser recodificado em selenocisteína na presença de um elemento SECIS , enquanto o códon de parada UAG pode ser recodificado em pirrolisina na presença de um elemento PYLIS . Ao contrário da selenocisteína, a pirrolisina está ligada ao seu RNA de transferência por uma aminoacil-tRNA sintetase dedicada. Esses dois aminoácidos não padrão podem estar presentes no mesmo organismo, mas usam diferentes modos de expressão. Uma archaea como Acetohalobium arabaticum é capaz, dependendo das condições de seu ambiente, de estender seu código genético de 20 para 21 aminoácidos incluindo a pirrolisina.

Todas estas diferenças continuam marginal, apesar de tudo, e os códigos genéticos de todos os organismos permanecem essencialmente muito semelhante: eles são baseados em cods adjacentes de três nucleótidos do ARN mensageiro, sempre lido na mesma direcção por ribossomas que montam proteínas de ' proteinogênicos aminoácidos em uma sequência determinada combinando o anticódon do tRNA com os códons do mRNA.

Teorias relacionadas com a origem e evolução do código genético

Não há menos que 1,5 × 10 84 possibilidades para codificar 21 pedaços de informação (os 20 aminoácidos padrão + o final da tradução) por 64 códons , um número que corresponde ao número de combinações possíveis que permitem associar 64 códons a 21 elementos de informação de modo que qualquer códon e qualquer elemento de informação estejam associados a pelo menos uma combinação. Apesar desse número astronomicamente grande, todos os códigos genéticos de todas as formas de vida conhecidas são quase idênticos, sendo limitados a um pequeno número de pequenas variações. As razões para tal homogeneidade universalmente observada permanecem fundamentalmente desconhecidas, embora várias hipóteses tenham sido formuladas para explicar essa situação. Eles são essencialmente de quatro tipos:

Os aminoácidos e o RNA apresentariam afinidade química mútua com a origem de certas propriedades do código genético. Em particular, experimentos com aptâmeros mostraram que certos aminoácidos têm uma afinidade química específica para os tripletos de bases nucleicas que os codificam. Outros experimentos mostraram que, de oito aminoácidos estudados, seis têm associações RNA-aminoácidos. Finalmente, os RNAs de transferência parecem ter surgido antes de suas aminoacil-tRNA sintetases associadas .

O código genético atual teria sido mais simples no passado, com a incorporação gradual de novos aminoácidos, presentes, por exemplo, como metabólitos nas células . Assim, alguns estudos tentaram determinar, por extrapolação estatística, os aminoácidos presentes no último ancestral comum universal , enquanto outros estudos, muito mais controversos, propuseram mecanismos que explicam como o código genético poderia ter incorporado gradualmente um número crescente de diferentes aminoácidos. ácidos.

A seleção natural teria levado a reter um código genético que minimiza os efeitos das mutações genéticas . Também é possível que códons mais longos (por exemplo, quádruplos de nucleotídeos e não tripletos como hoje) tenham existido no passado, o que teria exibido um nível mais alto de redundâncias e, portanto, teria sido menos sujeito a erros. Do que tripletos. Essa propriedade teria possibilitado preservar uma decodificação fiel antes que as células tivessem o complexo maquinário de tradução genética que são os ribossomos .

A representação do processo de decodificação da informação genética em aminoácidos por meio da teoria da informação leva a modelos de fluxo de informação sujeitos a erros. O ruído inerente a esse fluxo de dados representa um problema fundamental para os seres vivos, obrigando os sistemas biológicos a arcar com as consequências enquanto decodificam a informação genética de maneira confiável e eficiente. Análises semelhantes à otimização de taxa de distorção na compressão de dados com perdas sugerem que o código genético resulta da otimização entre três princípios antagônicos: a necessidade de uma gama suficientemente diversificada de aminoácidos, a necessidade de limitar o impacto dos erros e a vantagem de reduzir o custo do processo em termos de utilização dos recursos celulares.

Além disso, a distribuição dos códons atribuídos aos aminoácidos não é aleatória. Isso é visto pelo agrupamento de aminoácidos em códons adjacentes. Além disso, os aminoácidos que compartilham uma via metabólica de biossíntese comum também tendem a ter a mesma primeira base de ácido nucleico em seus códons, enquanto aqueles cuja cadeia lateral tem propriedades físico-químicas semelhantes tendem a também ter códons semelhantes, cujo efeito é limitar as consequências de mutações pontuais e erros de tradução . Finalmente, uma teoria explicando a origem do código genético também deve refletir as seguintes observações:

a ausência de um códon para os D- aminoácidos ;
o fato de que apenas a terceira base de códons é diferente entre códons sinônimos;
a presença de conjuntos de códons secundários para certos aminoácidos;
limitar a 20 aminoácidos padrão em vez de um número próximo a 64;
a relação entre as características dos códons de parada e as dos códons de aminoácidos.

Notas e referências

(em) Anton A. Turanov Alexey V. Lobanov Dmitry E. Fomenko, Hilary G. Morrison, Mitchell L. Sogin, Lawrence A. Klobutcher, Dolph L. Hatfield Vadim N. Gladyshev e , " Suporta código genético alvejado Inserção de Dois Amino Acids by One Codon ” , Science , vol. 323, n o 5911, 9 de janeiro de 2009, p. 259-261 ( PMID 19131629 , PMCID 3088105 , DOI 10.1126 / science.1164748 , ler online )
(in) Christian Touriol Stephanie Terminals, Sophie Bonnal, Sylvie Audigier Herve Prats, Anne-Catherine Prats e Stephan Vagner , " Geração de diversidade de isoformas de proteínas por iniciação alternativa de tradução em códons não-AUG " , Biology of the Cell , flight. 95, Sem ossos 3-4, Maio de 2003, p. 169-178 ( PMID 12867081 , DOI 10.1016 / S0248-4900 (03) 00033-9 , ler online )
Esses nomes de cores associados a substâncias minerais foram atribuídos por Richard Epstein e Charles Steinberg, descobridores do codon-stop UAG, em referência a seu colega Harris Bernstein, cujo sobrenome significa precisamente âmbar em alemão: ( fr ) Bob Edgar , “ The Genome of Bacteriophage T4: An Archeological Dig ” , Genetics , vol. 168, n o 2Outubro de 2002, p. 575-582 ( PMID 15514035 , PMCID 1448817 , leia online )
(em) Mario R. Capecchi , " Polypeptide Chain Termination in vitro Isolation of a Factor Release " , Proceedings of the National Academy of Sciences dos Estados Unidos da América , vol. 58, n o 3, Setembro de 1967, p. 1144-1151 ( PMID 5233840 , PMCID 335760 , DOI 10.1073 / pnas.58.3.1144 , JSTOR 58091 , bibcode 1967PNAS ... 58.1144C , lido online )
(in) Eva Freisinger, P Arthur Grollman, Holly Miller e Caroline Kisker , " Lesion (in) tolerance Reveals insights into DNA replication fidelity " , The EMBO Journal , Vol. 23, n o 7, 7 de abril de 2004, p. 1411-1680 ( PMID 15057282 , PMCID 391067 , DOI 10.1038 / sj.emboj.7600158 , leia online )
(em) JC Chang e YW Kan , " beta 0 thalassemia, a nonsense mutation in man " , Proceedings of the National Academy of Sciences dos Estados Unidos da América , vol. 76, n o 6, Junho de 1979, p. 2886-2889 ( PMID 88735 , PMCID 383714 , DOI 10.1073 / pnas.76.6.2886 , ler online )
(em) Séverine Boillée Christine Vande Velde e Don W. Cleveland , " ALS: A Disease of Motor Neurons and their Neighbours Nonneuronal " , Neuron , vol. 52, n o 1, 6 de outubro de 2006, p. 39-59 ( PMID 17015226 , DOI 10.1016 / j.neuron.2006.09.018 , leia online )
(em) James F. Crow , " Quanto sabemos sobre as taxas de mutação humana espontânea? » , Environmental and Molecular Mutagenesis , vol. 21, n o 2 1993, p. 122-129 ( PMID 8444142 , DOI 10.1002 / em.2850210205 , ler online )
(em) " Prevalence of positive selection Between Nearly neutral amino acid reposições em Drosophila " , Proceedings of the National Academy of Sciences of the United States of America , vol. 104, n o 16, abril de 2007, p. 6504-6510 ( PMID 17409186 , PMCID 1871816 , DOI 10.1073 / pnas.0701572104 , Bibcode 2007PNAS..104.6504S , ler online )
(em) John W. Drake e John J. Holland , " Mutation rates RNA virus Between " , Proceedings of the National Academy of Sciences of the United States of America , vol. 96, n o 24, 23 de novembro de 1999, p. 13910-13913 ( PMID 10570172 , PMCID 24164 , DOI 10.1073 / pnas.96.24.13910 , ler online )
(em) J. Holland, K. Spindler F. Horodyski, E. Grabau, S. e S. Nichol Vandepol , " Rapid Evolution of RNA genomes " , Science , vol. 215, n o 4540, 26 de março de 1982, p. 1577-1585 ( PMID 7041255 , DOI 10.1126 / science.7041255 , Bibcode 1982Sci ... 215.1577H , ler online )
(em) J. Arjan GM Visser e Daniel E. Rozen , " Clonal Interference and the Periodic Selection of New Beneficial Mutations in Escherichia coli " , Genetics , vol. 172, n o 4, Abril de 2006, p. 2093-2100 ( PMID 16489229 , PMCID 1456385 , DOI 10.1534 / genetics.105.052373 , ler online )
"A evidência para seleção estabilizadora é o uso de códons em rearranjos cromossômicos de Drosophila pseudoobscura " (en)
" Análise abrangente e comparação sobre o padrão de uso de códons de Mycobacterium tuberculosis que codifica o genoma inteiro de diferentes áreas " (en)
(en) Andrzej (Anjay) Elzanowski e Jim Ostell, " The Genetic Codes " , no National Center for Biotechnology Information (NCBI) , 30 de abril de 2013(acessado em 5 de agosto de 2015 )
(in) Comitê de Nomenclatura da União Internacional de Bioquímica (NC-IUB), " Nomenclature for Incompletely Specified Bases in Nucleic Acid Sequences " no IUBMB , 1984(acessado em 8 de abril de 2015 )
(em) TH Jukes e S. Osawa , " The genetic code in mitochondria and chloroplasts " , Experientia , Vol. 46, n os 11-12 Dezembro de 1990, p. 1117-1126 ( PMID 2253709 , DOI 10.1007 / BF01936921 , leia online )
(em) David A. Fitzpatrick, Mary E. Logue, Jason E. Stajich e Geraldine Butler , " Uma filogenia fúngica baseada são 42 genomas completos derivados de superárvore e análise de genes combinados " , BMC Evolutionary Biology , vol. 6, Novembro de 2006, p. 99 ( PMID 17121679 , PMCID 1679813 , DOI 10.1186 / 1471-2148-6-99 , ler online )
(em) Manuel AS Santos e Mick F. Tuite , " O códon CUG é decodificado in vivo não tem serina e leucina em Candida albicans " , Nucleic Acids Research , Vol. 23, n o 9, 11 de maio de 1995, p. 1481-1486 ( PMID 7784200 , PMCID 306886 , DOI 10.1093 / nar / 23.9.1481 , leia online )
(in) Geraldine Butler, Matthew D. Rasmussen, Michael F. Lin, Manuel AS Santos Sharadha Sakthikumar, Carol A. Munro, Esther Rheinbay Manfred Grabherr Anja Forche, Jennifer L. Reedy, Ino Agrafioti, Martha B. Arnaud, Steven Bates , Alistair JP Brown, Sascha Brunke, Maria C. Costanzo, David A. Fitzpatrick, Piet WJ de Groot, David Harris, Lois L. Hoyer, Bernhard Hube, Frans M. Klis, Chinnappa Kodira, Nicola Lennard, Mary E. Logue, Ronny Martin, Aaron M. Neiman, Elissavet Nikolaou, Michael A. Quail, Janet Quinn, Maria C. Santos, Florian F. Schmitzberger, Gavin Sherlock, Prachi Shah, Kevin AT Silverstein, Marek S. Skrzypek, David Soll, Rodney Staggs, Ian Stansfield, Michael PH Stumpf, Peter E. Sudbery, Thyagarajan Srikantha, Qiandong Zeng, Judith Berman, Matthew Berriman, Joseph Heitman, Neil AR Gow, Michael C. Lorenz, Bruce W. Birren, Manolis Kellis e Christina A. Cuomo , “ Evolução da patogenicidade e reprodução sexual em oito genomas de Candida ” , Nature , vol. 459, n o 7247, 4 de junho de 2009, p. 657-662 ( PMID 19465905 , PMCID 2834264 , DOI 10.1038 / nature08064 , leia online )
(em) Derek J. Taylor, Matthew J. Ballinger, Shaun Bowman e Mr Jeremy A. Bruenn , " Virus-host co-evolution under a modificado nuclear genetic code " , peerj , vol. 1, 5 de março de 2013, e50 ( PMID 23638388 , PMCID 3628385 , DOI 10.7717 / peerj.50 , ler online )
(em) Joseph A. Krzycki , " The genetic encoding of live pyrrolysine " , Current Opinion in Microbiology , Vol. 8, n o 6, dezembro de 2005, p. 706-712 ( PMID 16256420 , DOI 10.1016 / j.mib.2005.10.009 , leia online )
(em) Yan Zhang, Pavel V. Baranov, John F. Atkins e Vadim N. Gladyshev , " pyrrolysine and Selenocysteine Use Dissimilar Decoding Strategies " , Journal of Biological Chemistry , vol. 280, n o 21, 27 de maio de 2005, p. 20740-20751 ( PMID 15788401 , DOI 10.1074 / jbc.M501458200 , ler online )
(em) Laura Prat, Ilka U. Heinemann, Hans R. Aerni, Jesse Rinehart, Patrick O'Donoghue e Dieter Söll , " Expansão dependente da fonte de carbono do código genético em bactérias " , Proceedings of the National Academy of Sciences of os Estados Unidos da América , vol. 109, n o 51, 18 de dezembro de 2012, p. 21070–21075 ( PMID 23185002 , PMCID 3529041 , DOI 10.1073 / pnas.1218613110 , leia online )
(em) M. Yarus, Life from an RNA World: The Ancestor Within , Cambridge, EUA, Harvard University Press, 2010, 198 p. ( ISBN 978-0-674-05075-4 e 0-674-05075-4 , ler online ) , p. 163
(em) Robin D. Knight, Stephen J. Freeland e Laura F. Landweber , " Seleção, história e química: os três lados do código genético " , Trends in Biochemical Sciences , vol. 24, n o 6, Junho de 1999, p. 241-247 ( PMID 10366854 , DOI 10.1016 / S0968-0004 (99) 01392-4 , ler online )
(em) Robin D. Knight e Laura F. Landweber , " Rima ou Razão: interações RNA-arginina e o código genético " , Chemistry & Biology , vol. 5, n o 9, Setembro de 1998, R215-R220 ( PMID 9751648 , DOI 10.1016 / S1074-5521 (98) 90001-1 , leia online )
(em) M. Yarus, Life from an RNA World: The Ancestor Within , Cambridge, EUA, Harvard University Press, 2010, 198 p. ( ISBN 978-0-674-05075-4 e 0-674-05075-4 , ler online ) , p. 170
(em) Michael Yarus Jeremy Joseph Widmann e Rob Knight , " RNA-Amino Acid Binding: A Stereochemical Era for the Genetic Code " , Journal of Molecular Evolution , vol. 69, n o 5, novembro de 2009, p. 406-429 ( PMID 19795157 , DOI 10.1007 / s00239-009-9270-1 , leia online )
(em) Lluís Ribas de Pouplana, Robert J. Turner, Brian A. Steer e Paul Schimmel , " Genetic code origins: tRNAs old than their synthetases? ” , Proceedings of the National Academy of Sciences dos Estados Unidos da América , vol. 95, n o 19, 15 de setembro de 1998, p. 11295-11300 ( PMID 9736730 , PMCID 21636 , DOI 10.1073 / pnas.95.19.11295 , leia online )
(in) Dawn J. Brooks, R. Jacques Fresco, Arthur Lesk e Mona Singh , " Evolution of Amino Acid Frequencies in Proteins Over Deep Time: Inferred Order of Introduction of Amino Acids in the Genetic Code " , Biologia Molecular e Evolução , vol. 19, n o 10, Outubro de 2002, p. 1645-1655 ( PMID 12270892 , DOI 10.1093 / oxfordjournals.molbev.a003988 , leia online )
(em) Ramin Amirnovin , " Uma Análise da Teoria Metabólica da Origem do Código Genético " , Journal of Molecular Evolution , vol. 44, n o 5, Maio de 1997, p. 473-476 ( PMID 9115171 , DOI 10.1007 / PL00006170 , leia online )
(em) Lands A. Ronneberg Laura Landweber F. e Stephen J. Freeland , " Testing a biosynthetic theory of the genetic code: Fact or artifact? ” , Proceedings of the National Academy of Sciences dos Estados Unidos da América , vol. 97, n o 25, 5 de dezembro de 2000, p. 13690-13695 ( PMID 11087835 , PMCID 17637 , DOI 10.1073 / pnas.250403097 , ler online )
(in) Stephen J. Freeland, Tao Wu e Nick Keulmann , " The Case for um erro Minimizando Padrão código genético " , Origens da Vida e Evolução da Biosfera , vol. 33, n osso 4-5, Outubro de 2003, p. 457-477 ( PMID 14604186 , DOI 10.1023 / A: 1025771327614 , leia online )
(em) Pavel V. Baranov, Maxim Venom e Gregory Provan , " Codon Size Reduction as the Origin of the Triplet Genetic Code " , PLoS One , vol. 4, n o 5, 27 de maio de 2009, e5708 ( PMID 19479032 , PMCID 2682656 , DOI 10.1371 / journal.pone.0005708 , ler online )
(em) Tsvi Tlusty , " Um modelo para o surgimento do código genético como uma transição em um canal de informação ruidoso " , Journal of Theoretical Biology , vol. 249, n o 2 21 de novembro de 2007, p. 331-342 ( PMID 17826800 , DOI 10.1016 / j.jtbi.2007.07.029 , leia online )
(in) Tsvi Tlusty , " Rate-Distortion Scenario For The Emergence and Evolution of Molecular Noisy codes " , Physical Reviews Letters , vol. 100, n o 4, Fevereiro de 2008, p. 048101 ( PMID 18352335 , DOI https://dx.doi.org/10.1103/PhysRevLett.100.048101 , leia online )
(em) Tsvi Tlusty , " Uma origem colorida para o código genético: teoria da informação, mecânica estatística e o surgimento de códigos moleculares " , Physics of Life Reviews , vol. 7, n o 3, setembro de 2010, p. 362-376 ( PMID 20558115 , DOI 10.1016 / j.plrev.2010.06.002 , Bibcode 2010PhLRv ... 7..362T , ler online )
(em) Guy Sella e David H. Ardell , " The Coevolution of Genes and Genetic Codes: Crick's Frozen Accident Revisited " , Journal of Molecular Evolution , vol. 63, n o 3, Setembro de 2006, p. 297-313 ( PMID 16838217 , DOI 10.1007 / s00239-004-0176-7 , ler online )
(in) Stephen J. Freeland e Laurence D. Hurst , " O código genético é One in a Million " , Journal of Molecular Evolution , vol. 47, n o 3, Setembro de 1998, p. 238-248 ( PMID 9732450 , DOI 10.1007 / PL00006381 , leia online )
(em) FJR Taylor e D. Coates , " The code dans le codons " , Biosystems , vol. 22, n o 3, 1989, p. 177-187 ( PMID 2650752 , DOI 10.1016 / 0303-2647 (89) 90059-2 , ler online )
(em) Massimo Di Giulio , " The extension atteint pela minimização das distâncias de polaridade durante a evolução do código genético " , Journal of Molecular Evolution , vol. 29, n o 4, Outubro de 1989, p. 288-293 ( PMID 2514270 , DOI 10.1007 / BF02103616 , ler online )
(em) JT Wong , " Papel de minimização de distâncias químicas entre aminoácidos na evolução do código genético " , Proceedings of the National Academy of Sciences dos Estados Unidos da América , vol. 77, n o 2 Fevereiro de 1980, p. 1083-1086 ( PMID 6928661 , PMCID 348428 , DOI 10.1073 / pnas.77.2.1083 , Bibcode 1980PNAS ... 77.1083W , ler online )
(in) Albert deriva , " A Model of Proto Anti-Codon RNA Enzymes Requiring the -Amino Acid Homochirality " , Journal of Molecular Evolution , vol. 73, n osso 1-2, agosto de 2011, p. 10-22 ( PMID 21779963 , PMCID 3223571 , DOI 10.1007 / s00239-011-9453-4 , ler online )

Veja também

Link externo

os 23 códigos genéticos no site do National Center for Biotechnology Information