O ácido desoxirribonucléico , ou DNA , é uma macromolécula biológica presente em quase todas as células e em muitos vírus . O DNA contém toda a informação genética, denominada genoma , permitindo o desenvolvimento, funcionamento e reprodução dos seres vivos . É um ácido nucléico , como o ácido ribonucléico (RNA). Os ácidos nucléicos são, junto com os peptídeos e carboidratos , uma das três principais famílias de biopolímeros essenciais para todas as formas de vida conhecidas.
As moléculas de DNA nas células vivas são compostas de duas fitas antiparalelas enroladas uma na outra para formar uma dupla hélice . Diz-se que o DNA é de fita dupla ou fita dupla. Cada uma dessas fitas é um polímero denominado polinucleotídeo . Cada monômero que o constitui é um nucleotídeo , que é formado por uma base nucléica , ou base nitrogenada - adenina (A), citosina (C), guanina (G) ou timina (T) - ligada a um ose - aqui, a desoxirribose - ela própria ligada a um grupo fosfato . Os nucleotídeos polimerizados são unidos entre si por ligações covalentes entre a desoxirribose de um nucleotídeo e o grupo fosfato do próximo nucleotídeo, formando assim uma cadeia onde oses e fosfatos se alternam, com bases nucleicas cada uma ligada a um ose. A ordem em que os nucleotídeos se sucedem ao longo de uma fita de DNA constitui a sequência dessa fita. É essa sequência que carrega informações genéticas. Este é estruturado em genes , que são expressos por meio da transcrição em RNA . Esses RNAs podem ser não codificantes - o RNA de transferência e o RNA ribossômico em particular - ou então codificadores: nesse caso , são RNAs mensageiros , que são traduzidos em proteínas pelos ribossomos . A sucessão de bases nucléicas no DNA determina a sucessão de aminoácidos que constituem as proteínas resultantes desses genes. A correspondência entre as bases nucléicas e os aminoácidos é o código genético . Todos os genes de um organismo constituem seu genoma .
As bases de ácido nucléico de uma fita de DNA podem interagir com as bases de outra fita de DNA por meio de ligações de hidrogênio , que determinam as regras de pareamento entre pares de bases : par de adenina e timina por meio de duas ligações de hidrogênio, enquanto guanina e par de citosinas por meio de três ligações de hidrogênio. Normalmente, a adenina e a citosina não formam pares, assim como a guanina e a timina. Quando as sequências das duas fitas são complementares, essas fitas podem emparelhar formando uma estrutura helicoidal de fita dupla característica chamada de dupla hélice de DNA. Esta dupla hélice é adequada para o armazenamento de informações genéticas: a cadeia ose-fosfato é resistente a reações de clivagem ; além disso, a informação é duplicada nas duas vertentes da dupla hélice, o que permite reparar uma vertente danificada da outra vertente que permaneceu intacta; finalmente, essa informação pode ser copiada por meio de um mecanismo chamado replicação de DNA, no qual uma dupla hélice de DNA é fielmente copiada em outra dupla hélice que carrega a mesma informação. Isso é particularmente o que acontece durante a divisão celular : cada molécula de DNA da célula-mãe é replicada em duas moléculas de DNA, cada uma das duas células-filhas recebendo, assim, um conjunto completo de moléculas de DNA, cada jogo sendo idêntico ao outro.
Nas células, o DNA é organizado em estruturas chamadas cromossomos . Esses cromossomos atuam para tornar o DNA mais compacto com a ajuda de proteínas , especialmente as histonas , que junto com os ácidos nucléicos formam uma substância chamada cromatina . Os cromossomos também participam da regulação da expressão gênica , determinando quais partes do DNA devem ser transcritas em RNA . Nos eucariotos ( animais , plantas , fungos e protistas ), o DNA está essencialmente contido no núcleo das células, com uma fração do DNA também presente nas mitocôndrias e, nas plantas , nos cloroplastos . Em procariotos ( bactérias e arquéias ), o DNA está contido no citoplasma . Em vírus que contêm DNA, ele é armazenado no capsídeo . Qualquer que seja o organismo considerado, o DNA é transmitido durante a reprodução : ele desempenha o papel de suporte da hereditariedade . A modificação da sequência das bases de um gene pode levar a uma mutação genética , que pode, conforme os casos, ser benéfica, sem consequências ou prejudicial ao organismo, mesmo incompatível com sua sobrevivência. Por exemplo, a modificação de uma única base de um único gene - o da β-globina , uma subunidade protéica da hemoglobina A - do genótipo humano é responsável pela anemia falciforme , uma doença genética entre as mais difundidas no mundo.
O DNA é um polímero longo formado pela repetição de monômeros chamados nucleotídeos . O primeiro DNA foi identificado e isolado em 1869 do núcleo de células brancas do sangue pelo suíço Friedrich Miescher . Sua estrutura em dupla hélice foi demonstrada em 1953 pelo britânico Francis Crick e pelo americano James Watson a partir de dados experimentais obtidos pelos britânicos Rosalind Franklin e Maurice Wilkins . Esta estrutura, comum a todas as espécies , consiste em duas cadeias polinucleotídicas helicoidais enroladas em torno de um eixo comum, com um passo de cerca de 3,4 nm para um diâmetro de cerca de 2,0 nm . Outro estudo medindo os parâmetros geométricos do DNA em solução dá um diâmetro de 2,2 a 2,6 nm com um comprimento por nucleotídeo de 0,33 nm . Embora cada nucleotídeo seja muito pequeno, as moléculas de DNA podem conter milhões deles e atingir tamanhos significativos. Por exemplo, o cromossomo humano 1 , que é o maior dos cromossomos humanos , contém aproximadamente 220 milhões de pares de bases com um comprimento linear de mais de 7 cm .
Em células vivas , o DNA geralmente não existe na forma de fita simples ( fita simples ), mas sim na forma de fita dupla ( fita dupla) com uma configuração de dupla hélice. Os monômeros que constituem cada fita de DNA incluem um segmento da cadeia de desoxirribose - fosfato e uma base nucléica ligada à desoxirribose. A molécula resultante da ligação de uma base nucleica a um ose é chamada de nucleosídeo ; a adição de um a três grupos fosfato à dose de um nucleosídeo forma um nucleotídeo . Um polímero resultante da polimerização de nucleotídeos é denominado polinucleotídeo . DNA e RNA são polinucleotídeos.
A ose que constitui a espinha dorsal da molécula é a 2'-desoxirribose , um derivado da ribose . A pentose alterna com grupos fosfato, para formar ligações fosfodiéster entre os átomos de N S 3 'e n o 5' resíduos de desoxirribose adjacente. Por causa dessa ligação assimétrica, as fitas de DNA fazem sentido. Em uma dupla hélice, as duas fitas de DNA estão em direções opostas: são consideradas antiparalelas . A direção 5 'para 3' de uma fita de DNA designa convencionalmente aquela da extremidade que carrega um grupo fosfato –PO 3 2−em direção à extremidade carregando um grupo hidroxila –OH; é nesse sentido que o DNA é sintetizado por DNA polimerases . Uma das grandes diferenças entre o DNA e o RNA é o fato de que a ousadia do esqueleto da molécula é a ribose, no caso do RNA, em vez da desoxirribose do DNA, que atua na estabilidade e na geometria dessa macromolécula .
A dupla hélice do DNA é estabilizada essencialmente por duas forças: as ligações de hidrogênio entre os nucleotídeos, por um lado, e as interações de empilhamento dos anéis aromáticos das bases nucléicas, por outro. No meio aquoso da célula , as ligações π conjugadas dessas bases se alinham perpendicularmente ao eixo da molécula de DNA para minimizar suas interações com a camada de solvatação e, portanto, sua entalpia livre . Os quatro nucleotídeos constituintes do DNA são adenina (A), citosina (C), guanina (G) e timina (T), formando respectivamente os quatro nucleotídeos a seguir, compondo o DNA:
As quatro bases nucleicas do DNA são de dois tipos: por um lado, as purinas - adenina e guanina - que são compostos bicíclicos compostos por dois heterociclos com cinco e seis átomos respectivamente, por outro lado as pirimidinas - citosina e timina - que são monocíclicas compostos compreendendo um heterociclo com seis átomos. Os pares de bases da dupla hélice de DNA são feitos de uma purina interagindo com uma pirimidina por meio de duas ou três ligações de hidrogênio :
Por causa dessa complementaridade, toda a informação genética carregada por uma das fitas da dupla hélice do DNA também é carregada de forma idêntica na outra fita. É neste princípio que se baseia o mecanismo de replicação do DNA , e é nessa complementaridade entre as bases nucleicas que todas as funções biológicas do DNA nas células vivas se baseiam.
O DNA de certos vírus , como os bacteriófagos PBS1 e PBS2 de Bacillus subtilis , o bacteriófago φR1-37 de Yersinia e o fago S6 de Staphylococcus , pode substituir a timina por uracila , uma pirimidina geralmente característica de RNA, mas normalmente ausente do DNA, onde só é encontrado como um produto de degradação da citosina.
As nucleobases acasalam-se com mais freqüência formando os pares de bases chamados "Watson-Crick" correspondentes a duas ou três ligações de hidrogênio estabelecidas entre duas bases orientadas anti ao resíduo de desoxirribose . No entanto, as ligações de hidrogênio também podem ser estabelecidas entre uma purina orientada para sin e uma pirimidina anti-orientada: neste caso, este é um par de Hoogsteen . Além disso, um par de bases Watson-Crick é capaz de estabelecer ligações de hidrogênio do tipo Hoogsteen com uma terceira base, o que permite a formação de estruturas de DNA de três fitas .
Apenas uma das fitas de um segmento de DNA que constitui um gene é transcrita em RNA funcional, de modo que as duas fitas de um gene não são equivalentes: diz-se que aquela que é transcrita em RNA funcional tem polaridade negativa e carrega uma sequência antisense, enquanto a fita complementar - que também pode ser transcrita em RNA, mas não funcional - é considerada como tendo polaridade positiva e carrega uma sequência de DNA de sentido. A fita transcrita em RNA funcional é algumas vezes chamada de fita codificadora, mas essa designação só é válida dentro de um determinado gene porque as duas fitas da mesma dupla hélice de DNA podem codificar proteínas diferentes; falamos então de fios ambisense. Os RNAs também são transcritos a partir de sequências de DNA sentido - portanto, sequências de RNA antisense - em procariotos e eucariotos , mas seu papel biológico não está totalmente elucidado; uma das hipóteses é que esses RNAs antisense poderiam intervir na regulação da expressão gênica por meio do pareamento entre sequências de RNA sense e antisense, que são, por definição, complementares.
A distinção entre as fitas de DNA sense e antisense é borrada em certos tipos de genes sobrepostos , bastante raros em procariotos e eucariotos, mas mais comuns em plasmídeos e em vírus , nos quais ambas as fitas do mesmo segmento de DNA codificam cada uma um RNA funcional diferente. Em bactérias , essa sobreposição pode desempenhar um papel na regulação da transcrição do gene, enquanto, nos vírus, os genes sobrepostos aumentam a quantidade de informação genética que pode ser codificada no tamanho pequeno do genoma viral.
O DNA liberado pode ser linear, como é tipicamente o caso em eucariotos , ou circular, como em procariotos . No entanto, ele pode ser torcido de uma maneira às vezes complexa sob o efeito da introdução de voltas adicionais da hélice ou da remoção de voltas na dupla hélice . A dupla hélice do DNA assim superenrolada sob o efeito de supervoluções positivas ou negativas tem um passo respectivamente encurtado ou alongado em relação ao seu estado relaxado: no primeiro caso, as bases nucleicas são arranjadas de uma maneira mais compacta; no segundo caso, ao contrário, eles interagem menos intimamente. In vivo , o ADN tipicamente exibe uma super-enrolamento ligeiramente negativo sob o efeito de enzimas denominadas topoisomerases de ADN , que são também essenciais para soltar as tensões introduzidas no ADN durante os processos que envolvem a hélice dupla a ser desenrolado para separar a partir dele. Os dois fios , como seja particularmente o caso durante a replicação do DNA e durante sua transcrição em RNA .
Como as ligações de hidrogênio não são covalentes , elas podem ser quebradas com bastante facilidade. Assim, é possível separar as duas fitas da dupla hélice do DNA como um zíper, tanto mecanicamente quanto sob o efeito de alta temperatura, bem como em baixa salinidade , em alto pH - solução básica - e em baixo pH - solução ácida , que no entanto, altera o DNA em particular por depurinação. Essa separação das fitas de DNA de fita dupla para formar duas moléculas de DNA de fita simples é chamada de fusão ou desnaturação do DNA . A temperatura na qual 50% do DNA de fita dupla é dissociado em duas moléculas de DNA de fita simples é chamada de temperatura de fusão ou temperatura de semi-desnaturação do DNA, denotada por T m . Ela pode ser medida seguindo a absorção óptica a 260 nm da solução que contém o DNA: essa absorção aumenta durante a incompatibilidade, que é chamada de hipercromia . As moléculas de DNA de fita simples liberadas não têm uma configuração particular, mas algumas estruturas tridimensionais são mais estáveis do que outras.
A estabilidade de uma dupla hélice de DNA depende essencialmente do número de ligações de hidrogênio a serem quebradas para separar as duas fitas. Portanto, quanto mais longa a dupla hélice, mais estável ela é. No entanto, uma vez que os L C pares estão unidos por três ligações de hidrogénio, em vez de dois para as Uma T pares , a estabilidade dos duplos - cadeia moléculas de ADN do mesmo comprimento aumenta com o número de L C pares eles contêm, medida pela sua taxa. por GC . Esse efeito é reforçado pelo fato de que as interações de empilhamento entre as bases nucleicas de uma mesma fita de DNA são mais fortes entre os resíduos de guanina e citosina, de forma que a sequência de DNA também influencia sua estabilidade. A temperatura de fusão do DNA, portanto, depende do comprimento das moléculas, seu nível de GC, sua sequência, sua concentração no solvente e a força iônica nele. Em biologia molecular , observa-se que os segmentos de ADN de cadeia dupla, cuja função implica que os dois cordões da dupla hélice pode facilmente separar tem uma alta taxa de A T pares : este é o caso da sequência TATAAT típico do Pribnow caixa de alguns promotores .
As duas fitas de DNA formam uma dupla hélice, cuja espinha dorsal forma duas ranhuras. Essas ranhuras são adjacentes aos pares de bases e provavelmente fornecem um local de ligação para várias moléculas. Uma vez que as fitas de DNA não estão posicionadas simetricamente em relação ao eixo da dupla hélice, elas definem dois sulcos de tamanhos desiguais: o sulco principal tem 2,2 nm de largura, enquanto o sulco menor tem 1,2 nm . As bordas das bases nucleicas são mais acessíveis no sulco maior do que no sulco menor. Assim, proteínas , como fatores de transcrição , que se ligam a sequências específicas no DNA de fita dupla geralmente o fazem no nível do sulco principal.
Existem muitos conformadores possíveis da dupla hélice do DNA. As formas clássicas são chamadas de DNA A , DNA B e DNA Z , das quais apenas as duas últimas foram observadas diretamente in vivo . A conformação adotada pelo DNA de fita dupla depende de seu grau de hidratação , de sua seqüência , de sua taxa de superenrolamento , das modificações químicas das bases que o compõem, da natureza e da concentração dos íons metálicos em solução , até mesmo da presença de poliaminas .
Contexto | DNA A | DNA B | Z DNA |
---|---|---|---|
Direção da hélice | direito | direito | deixou |
Padrão repetido | 1 bp | 1 bp | 2 bp |
Rotação por par de bases | 32,7 ° | 34,3 ° | 60 ° / 2 |
Par de bases por giro da hélice | 11 | 10,5 | 12 |
Passo da hélice por revolução | 2,82 nm | 3,32 nm | 4,56 nm |
Alongamento do eixo por par de bases | 0,24 nm | 0,32 nm | 0,38 nm |
Diâmetro | 2,3 nm | 2,0 nm | 1,8 nm |
Inclinação dos pares de bases no eixo da hélice | + 19 ° | -1,2 ° | -9 ° |
Torção média ( torção da hélice ) | + 18 ° | + 16 ° | 0 ° |
Orientação dos substituintes das bases nos resíduos osídicos |
anti | anti |
Pirimidina : anti, Purina : syn |
Dobramento / torção endocíclica da furanose ( pucker de açúcar ) |
C3'- endo | C2'- endo |
Citosina : C2'- endo , Guanina : C2'- exo |
A expressão gênica do DNA depende de como o DNA é empacotado nos cromossomos em uma estrutura chamada cromatina . Certas bases podem ser modificadas durante a formação da cromatina, sendo os resíduos de citosina das regiões pouco ou não expressas geneticamente, geralmente fortemente metiladas , principalmente nos sítios CpG . As histonas em torno das quais o DNA está envolvido nas cromatinas também podem ser modificadas covalentemente . A própria cromatina pode ser alterada por complexos de remodelação da cromatina. Além disso, a metilação do DNA e a modificação covalente das histonas são coordenadas para afetar a cromatina e a expressão gênica .
Assim, a metilação dos resíduos de citosina produz 5-metilcitosina , que desempenha um papel importante na inactivação do cromossoma X . A taxa de metilação varia entre os organismos, sendo o nematóide Caenorhabditis elegans completamente desprovido dela, enquanto os vertebrados têm cerca de 1% de seu DNA contendo 5-metilcitosina .
As pirimidinas têm uma estrutura molecular muito semelhante. Assim, a citosina e a 5-metilcitosina podem ser desaminadas para produzir uracila (que não é uma base que faz parte do código do DNA) e timina , respectivamente. A reação de desaminação poderia, portanto, promover mutações genéticas .
Existem também outras bases modificadas no DNA, resultantes, por exemplo, da metilação de resíduos de adenina em bactérias, mas também em nematóides ( Caenorhabditis elegans ), algas verdes ( Chlamydomonas ) e moscas da fruta . A 5-hidroximetilcitosina é um derivado da citosina particularmente abundante no cérebro de mamíferos . Organismos como os flagelados Diplonema e Euglena e o gênero Kinetoplastida , além disso, contêm uma pirimidina glicosilada derivada do uracila e denominada base J ; esta base modificada atua como um sinal de terminação da transcrição para a RNA polimerase II . Várias proteínas que se ligam especificamente à base J foram identificadas.
O DNA pode ser danificado por um grande número de mutagênicos que alteram sua sequência . Esses mutagênicos incluem oxidantes , agentes alquilantes , radiação eletromagnética energética, como ultravioleta e raios X e gama , bem como partículas subatômicas de radiação ionizante , como as resultantes da radioatividade ou mesmo dos raios cósmicos . O tipo de dano produzido depende do tipo de mutagênico. Assim, os raios ultravioleta são capazes de danificar o DNA, produzindo dímeros de pirimidina , estabelecendo ligações entre bases adjacentes da mesma fita de DNA. Oxidantes como radicais livres ou peróxido de hidrogênio produzem vários tipos de danos, como mudanças de base, incluindo guanosina , e quebras na estrutura de fita dupla . Uma célula humana típica contém cerca de 150.000 bases danificadas por um oxidante. Dentre essas lesões por oxidantes, as mais perigosas são as rupturas de fita dupla, pois são as mais difíceis de reparar e podem produzir mutações pontuais , inserções e deleções na sequência de DNA, bem como translocações cromossômicas . Essas mutações podem causar câncer . As alterações naturais do DNA, que resultam, por exemplo, de processos celulares que produzem derivados reativos de oxigênio , são bastante frequentes. Embora os mecanismos de reparo do DNA resolvam a maioria dessas lesões, algumas delas não são reparadas e se acumulam com o tempo em tecidos pós-mitóticos de mamíferos . O acúmulo de tais lesões não reparadas parece ser uma importante causa subjacente do envelhecimento .
Muitos mutagênicos se encaixam no espaço entre dois pares de bases adjacentes de uma forma chamada intercalação . A maioria das intercalações é feita por compostos aromáticos e moléculas planas, como brometo de etídio , acridinas , daunorrubicina ou doxorrubicina . As bases devem se afastar para permitir a inserção do composto de intercalação, que causa distorção da dupla hélice por desenrolamento parcial. Isso bloqueia a transcrição e a replicação do DNA , resultando em citotoxicidade e mutações . Consequentemente, os compostos intercalantes podem ser cancerígenos e, no caso da talidomida , teratogênicos . Outros compostos, como o epóxi benzo [ a ] pirenodiol e a aflatoxina, formam adutos com o DNA que causam erros na replicação. No entanto, devido à sua capacidade de bloquear a transcrição e replicação do DNA, outras toxinas semelhantes também são usadas na quimioterapia contra células de proliferação rápida.
O DNA é encontrado principalmente nos cromossomos , que geralmente são lineares nos eucariotos e circulares nos procariontes . Neste último, também pode ser encontrado fora dos cromossomos, dentro de plasmídeos . Todo o DNA de uma célula constitui seu genoma . O genoma humano representa aproximadamente três bilhões de pares de bases distribuídos em 46 cromossomos. As informações contidas no genoma são transportadas por segmentos de DNA que formam os genes . A informação genética é transmitida por meio de regras de correspondência específicas, chamadas de pareamento Watson-Crick: os únicos dois pares de bases normalmente permitidas são a adenina com timina e a guanina com citosina . Essas regras de emparelhamento são a base dos diferentes processos em ação nas funções biológicas do DNA:
Quando uma célula é dividida , ela deve replicar o DNA que carrega seu genoma para que ambas as células-filhas herdem a mesma informação genética da célula-mãe. A dupla hélice do DNA fornece um mecanismo de replicação simples: as duas fitas são desenroladas para serem separadas e cada uma das duas fitas serve como um modelo para recriar uma fita com a sequência complementar pelo pareamento entre bases nucleicas , o que torna possível reconstituir duas fitas idênticas hélices de DNA de fita dupla . Este processo é catalisado por um conjunto de enzimas entre as quais DNA polimerases são aquelas que complementam as fitas de DNA desenroladas para reconstruir as duas fitas complementares. Como essas DNA polimerases só podem polimerizar DNA na direção 5 'para 3' , diferentes mecanismos intervêm para copiar as fitas antiparalelas da dupla hélice:
O DNA no genoma é organizado e compactado em um processo chamado condensação de DNA para que possa caber no espaço apertado de uma célula . Nos eucariotos , o DNA está localizado principalmente no núcleo , com uma pequena fração também nas mitocôndrias e, nas plantas , nos cloroplastos . Nos procariotos , o DNA é encontrado dentro de uma estrutura irregular do citoplasma chamada nucleóide . A informação genética do genoma é organizada dentro dos genes , e todo o conjunto dessas informações é chamado de genótipo . Um gene é uma fração do DNA que influencia uma característica particular do organismo e, portanto, faz parte da hereditariedade . Ele contém um quadro de leitura aberto que pode ser transcrito em RNA , bem como sequências para regular a expressão de genes , como promotores e intensificadores que controlam a transcrição.
Na maioria das espécies , apenas uma pequena fração do genoma codifica proteínas . Assim, aproximadamente 1,5% do genoma humano consiste em exons que codificam proteínas, enquanto mais de 50% do DNA humano consiste em sequências não codificantes repetidas ; o resto do DNA codifica diferentes tipos de RNA , como RNAs de transferência e RNAs ribossômicos . A presença de tamanha quantidade de DNA não codificante no genoma dos eucariotos, bem como a grande variabilidade no tamanho do genoma de diferentes organismos - tamanho que não tem relação com a complexidade dos organismos correspondentes - é uma questão conhecida desde o início da biologia molecular e frequentemente chamado de paradoxo do valor C , esse " valor C " designando, nos organismos diplóides , o tamanho do genoma e um múltiplo desse tamanho nos poliploides . No entanto, certas sequências de DNA que codificam proteínas podem não codificar moléculas de RNA envolvidas na regulação funcional da expressão gênica .
Certas sequências de DNA não codificantes desempenham um papel estrutural nos cromossomos . Os telômeros e centrômeros normalmente contêm poucos genes, mas contribuem significativamente para as funções biológicas e a estabilidade mecânica dos cromossomos. Uma fração significativa do DNA não codificante consiste em pseudogenes , que são cópias de genes tornados inativos como resultado de mutações . Essas sequências geralmente são apenas fósseis moleculares, mas às vezes podem servir como matéria-prima genética para a criação de novos genes por meio de processos de duplicação genética e divergência evolutiva.
A expressão gênica consiste em converter o genótipo de um fenótipo de organismo , ou seja, um conjunto de características dessa organização. Este processo é influenciado por vários estímulos externos e consiste nas seguintes três etapas principais:
Observe que o mesmo DNA pode se expressar em dois estágios do desenvolvimento de um organismo (devido a diferentes repressores e desrepressores) de maneiras muito diferentes, sendo o exemplo mais conhecido o da lagarta e da borboleta, morfologicamente muito distantes.
O gene da informação codificado pela sequência de nucleotídeos do gene DNA pode ser copiado para um ácido nucleico diferente do DNA e RNA conhecidos . Este RNA é estruturalmente muito semelhante a uma molécula de DNA de fita simples, mas difere dela na natureza da ose de seus nucleotídeos - o RNA contém ribose onde o DNA contém desoxirribose - bem como por um de seus nucleotídeos. Bases de ácido nucleico - a timina no DNA é substituído por uracila .
A transcrição de DNA em RNA é um processo complexo, cuja elucidação foi um grande avanço em biologia molecular , durante a segunda metade do XX th século. É fortemente regulado, em particular por proteínas chamadas fatores de transcrição que, em resposta aos hormônios, por exemplo, permitem a transcrição de genes-alvo: é o caso, por exemplo, de hormônios sexuais como o estrogênio , a progesterona e a testosterona .
O RNA resultante da transcrição do DNA pode ser não codificador ou codificador. No primeiro caso, ele tem sua própria função fisiológica na célula ; no segundo caso, é um RNA mensageiro , utilizado para transportar a informação genética contida no DNA para os ribossomos , que organizam a decodificação dessa informação a partir do RNA de transferência . Esses RNAs de transferência estão ligados a um aminoácido entre os 22 aminoácidos proteinogênicos e cada um tem um grupo de três bases nucleicas consecutivas chamadas anticódon . As três bases desses anticódons podem emparelhar com três bases consecutivas do RNA mensageiro, esse trio de bases formando um códon complementar ao anticódon do RNA de transferência. A complementaridade do códon do RNA mensageiro e do anticódon do RNA de transferência é baseada nas regras de emparelhamento do tipo Watson-Crick que governam a estrutura secundária dos DNAs de fita dupla .
A correspondência entre os 64 códons possíveis e os 22 aminoácidos proteinogênicos é chamada de código genético . Este código é materializado pelos diferentes RNAs de transferência que fazem fisicamente a ligação entre um determinado aminoácido e diferentes anticódons de acordo com os diferentes RNAs de transferência que podem se ligar ao mesmo aminoácido. Assim, uma dada sequência de bases nucleicas dentro de um gene no DNA pode ser convertida em uma sequência precisa de aminoácidos formando uma proteína no citoplasma da célula.
Existem mais códons do que aminoácidos para codificar. O código genético é, portanto, considerado degenerado. Além dos aminoácidos proteinogênicos, ele também codifica o final da tradução usando três códons particulares chamados códons STOP : TAA, TGA e TAG no DNA.
Todas as funções biológicas do DNA dependem de interações com proteínas . Estes podem variar de interações não específicas a interações com proteínas que se ligam especificamente a uma sequência de DNA específica. De enzimas também podem se ligar ao DNA e, entre estas, as polimerases que proporcionam a replicação do DNA e sua transcrição em RNA desempenham um papel particularmente importante.
As proteínas estruturais que se ligam ao DNA fornecem exemplos bem conhecidos de interações não específicas entre as proteínas e o DNA. Isso é mantido dentro dos cromossomos pela formação de complexos com proteínas estruturais que condensam o DNA em uma estrutura compacta chamada cromatina . Em eucariotos , essa estrutura envolve pequenas proteínas básicas chamadas histonas , enquanto envolve muitas proteínas de diferentes tipos em procariotos . As histonas formam um complexo em forma de disco com o DNA, chamado nucleossomo, que contém duas voltas completas de uma molécula de DNA de fita dupla envolvida em torno da proteína. Essas interações inespecíficas são estabelecidas entre os resíduos básicos das histonas e a estrutura ácida formada por uma ose - fosfato alternada que carrega as bases nucleicas da dupla hélice do DNA. Desta forma, ligações iônicas são formadas que são independentes da sequência de bases do DNA. Esses resíduos de aminoácidos básicos sofrem alterações químicas, como metilação , fosforilação e acetilações . Essas modificações químicas modificam a intensidade das interações entre o DNA e as histonas, tornando o DNA mais ou menos acessível aos fatores de transcrição e, portanto, modulando a atividade de transcrição . Outras proteínas que se ligam ao DNA de forma não específica incluem proteínas nucleares do grupo de alta mobilidade eletroforética , conhecido como HMG , que se ligam a DNA dobrado ou distorcido. Essas proteínas são importantes para flexionar redes de nucleossomos e organizá-las nas estruturas maiores que constituem os cromossomos.
Das proteínas com interações não específicas com o DNA, aquelas que se ligam especificamente ao DNA de fita simples constituem um grupo especial. Em humanos , a proteína A é o representante mais bem compreendido. Ocorre quando as duas fitas de uma dupla hélice são separadas, em particular durante a replicação , recombinação e reparo do DNA . Essas proteínas parecem estabilizar o DNA de fita simples e impedi-lo de formar " stem-loop" - estruturas em grampo - ou se degradar por nucleases .
Proteínas específicas para uma sequência de DNAPor outro lado , outras proteínas apenas se ligam a sequências de DNA específicas. Dentre essas proteínas, as mais estudadas são os diversos fatores de transcrição , que são proteínas que regulam a transcrição . Cada fator de transcrição liga-se apenas a um determinado conjunto de sequências de DNA e ativa ou inibe genes dos quais uma dessas sequências específicas está próxima do promotor . Fatores de transcrição realizam isso de duas maneiras. Eles podem primeiro se ligar à RNA polimerase responsável pela transcrição, diretamente ou por meio de outras proteínas mediadoras; isto posiciona a polimerase ao nível do promotor e permite-lhe iniciar a transcrição. Eles também podem se ligar a enzimas que modificam as histonas no nível do promotor, o que tem o efeito de modificar a acessibilidade do DNA à polimerase.
Como esses alvos de DNA podem ser distribuídos por todo o genoma de um organismo, uma mudança na atividade de um tipo de fator de transcrição pode afetar milhares de genes. Portanto, essas proteínas são frequentemente o alvo de processos de transdução de sinal que controlam as respostas às mudanças ambientais, desenvolvimento ou diferenciação celular . A especificidade da interação desses fatores de transcrição com o DNA advém do fato de essas proteínas estabelecerem inúmeros contatos com as bordas das bases nucléicas , o que lhes permite "ler" a sequência do DNA. A maioria dessas interações ocorre no sulco principal da dupla hélice do DNA, onde as bases são mais acessíveis.
As nucleases são enzimas que clivam as fitas de DNA ao catalisar a hidrólise das ligações fosfodiéster . Nucleases que clivam nucleotídeos localizados no final das fitas de DNA são chamadas de exonucleases , enquanto aquelas que clivam nucleotídeos localizados dentro das fitas de DNA são chamadas de endonucleases . As nucleases mais comumente usadas em biologia molecular são enzimas de restrição , que clivam o DNA em sequências específicas. Assim, a enzima EcoRV reconhece a sequência de seis bases 5'-GATATC-3 ' e a cliva em seu meio. In vivo , essas enzimas protegem as bactérias contra a infecção por fagos , digerindo o DNA desses vírus quando ele entra na célula bacteriana. Na engenharia molecular, eles são usados em técnicas de clonagem molecular e para determinar a impressão digital genética .
DNA ligasesPor outro lado, enzimas chamadas DNA ligases podem reconectar fitas quebradas ou clivadas de DNA. Essas enzimas são particularmente importantes durante a replicação do DNA porque são aquelas que suturam os fragmentos de Okazaki produzidos na fita retardada, também chamada de fita indireta, no nível da forquilha de replicação. Eles também estão envolvidos no reparo do DNA e nos mecanismos de recombinação genética .
As topoisomerases são enzimas que possuem uma atividade nuclease e uma atividade ligase . A girase de DNA é um exemplo dessas enzimas. Essas proteínas alteram a taxa de superenrolamento do DNA, cortando uma dupla hélice para permitir que os dois segmentos formados girem um em relação ao outro, liberando os superenrolamentos antes de serem suturados novamente. Outros tipos de topoisomerases são capazes de cortar uma dupla hélice para permitir a passagem de outro segmento de dupla hélice pela brecha assim formada antes de fechar esta última. As topoisomerases são essenciais para muitos processos que envolvem o DNA, como a transcrição e replicação do DNA .
HelicasesAs helicases são tipos de motores moleculares . Eles usam a energia química do trifosfato de nucleosídeo , essencialmente ATP , para quebrar as ligações de hidrogênio entre os pares de bases e desenrolar a dupla hélice do DNA para liberar as duas fitas . Essas enzimas são essenciais para a maioria dos processos que requerem enzimas para acessar as bases do DNA.
Polimerases de DNAAs DNA polimerases são enzimas que sintetizam cadeias de polinucleotídeos a partir de trifosfatos de nucleosídeos . A sequência das cadeias que eles sintetizam é determinada por uma cadeia polinucleotídica pré-existente chamada matriz . Essas enzimas funcionam adicionando continuamente nucleotídeos à hidroxila da extremidade 3 'da cadeia polipeptídica em crescimento. Por esse motivo, todas as polimerases atuam na direção 5 'para 3' . Nucleosídeo trifosfato tendo uma base complementar à dos pares molde no sítio ativo dessas enzimas, o que permite que as polimerases produzam fitas de DNA cuja sequência é exatamente complementar à da fita molde. As polimerases são classificadas de acordo com o tipo de fio que usam.
Durante a replicação , as DNA polimerases dependentes de DNA fazem cópias das fitas de DNA. Para preservar a informação genética, é essencial que a sequência de base de cada cópia seja exatamente complementar à sequência de base da fita modelo. Para fazer isso, muitas DNA polimerases têm a capacidade de corrigir seus possíveis erros de replicação - função de revisão . Eles são, portanto, capazes de identificar o defeito na formação de um par de bases entre a fita molde e a fita em crescimento na base que acabaram de inserir e clivar este nucleotídeo usando a atividade de exonuclease 3 '→ 5' , a fim de eliminar esta replicação erro. Na maioria dos organismos, as DNA polimerases atuam em grandes complexos chamados replissomos, que contêm várias subunidades complementares, como grampos - pinças de DNA - e helicases .
DNA polimerases dependentes de RNA são uma classe de polimerases especializadas capazes de copiar uma sequência de RNA em DNA. Eles incluem a transcriptase reversa , que é uma enzima viral envolvida na infecção das células hospedeiras por retrovírus , e a telomerase , uma enzima essencial para a replicação dos telômeros . A telomerase é uma polimerase incomum, pois contém seu próprio modelo de RNA em sua estrutura.
RNA polimerasesA transcrição é realizada por uma RNA polimerase dependente de DNA que copia uma sequência de DNA em RNA . Para iniciar a transcrição de um gene , a RNA polimerase primeiro se liga a uma sequência de DNA chamada promotor e separa as fitas de DNA. Em seguida, ele copia a sequência de DNA que constitui o gene em uma sequência de RNA complementar até atingir uma região do DNA chamada terminador , onde para e se separa do DNA. Como o DNA DNA polimerase-dependente, a RNA polimerase II - enzima que transcreve a maioria dos genes do genoma humano - opera dentro de um grande complexo proteico que compreende várias subunidades complementares e regulatórias.
Cada divisão celular é precedida pela replicação do DNA, levando à replicação do cromossomo . Esse processo normalmente preserva a informação genética da célula , cada uma das duas células-filhas herdando uma composição genética completa idêntica à da célula-mãe. No entanto, às vezes esse processo não ocorre normalmente e a informação genética na célula é alterada. Falamos, neste caso, de mutação genética . Essa alteração do genótipo pode ser inconseqüente ou, ao contrário, alterar também o fenótipo resultante da expressão dos genes alterados.
Uma dupla hélice de DNA geralmente não interage com outros segmentos de DNA e, nas células humanas , os diferentes cromossomos, mesmo cada um, ocupando uma região própria dentro do núcleo chamada de território cromossômico . Essa separação física dos diferentes cromossomos é essencial para o funcionamento do DNA como repositório estável e duradouro de informações genéticas, uma vez que uma das raras vezes em que os cromossomos interagem ocorre durante o cruzamento responsável pela recombinação genética , ou seja, quando duas hélices duplas de DNA estão quebrado, trocar suas seções e soldar juntos.
A recombinação permite que os cromossomos troquem material genético e produzam novas combinações de genes , o que aumenta a eficiência da seleção natural e pode ser instrumental na rápida evolução de novas proteínas . A recombinação genética também pode ocorrer durante o reparo do DNA , especialmente no caso de quebra simultânea de ambas as fitas da dupla hélice do DNA.
A forma mais comum de recombinação cromossômica é a recombinação homóloga , na qual os dois cromossomos em interação compartilham sequências muito semelhantes. As recombinações não homólogas podem danificar gravemente as células, pois podem levar a translocações e anormalidades genéticas. A reação de recombinação é catalisada por enzimas chamadas recombinases , como a proteína Rad51. A primeira etapa desse processo é a quebra de ambas as fitas da dupla hélice causada por endonuclease ou dano ao DNA. Uma série de etapas catalisadas pela recombinase resulta na união das duas hélices por pelo menos uma junção de Holliday na qual um segmento de fita simples de cada dupla hélice é soldado à fita complementar da outra dupla hélice. A junção de Holliday é uma junção cruciforme que, quando as fitas têm sequências simétricas, pode se mover ao longo do par de cromossomos, trocando uma fita pela outra. A reação de recombinação é interrompida pela clivagem da junção e sutura do DNA liberado.
A informação genética codificada pelo DNA não é necessariamente fixada no tempo e certas sequências tendem a se mover de uma parte do genoma para outra. Esses são os elementos genéticos móveis . Esses elementos são mutagênicos e podem alterar o genoma das células . Entre eles encontram-se, em particular, transposões e retrotransposões , estes últimos atuando, ao contrário dos primeiros, por meio de um RNA intermediário que devolve uma sequência de DNA sob a ação de uma transcriptase reversa . Eles se movem dentro do genoma sob o efeito de transposases , enzimas particulares que os separam de um lugar e os reconectam a outro lugar no genoma celular, e são considerados responsáveis pela migração de não menos que 40% do genoma humano para o durante a evolução do Homo sapiens .
Esses elementos transponíveis constituem uma fração importante do genoma dos seres vivos, em particular nas plantas, onde frequentemente representam a maior parte do DNA nuclear , como no milho, onde 49 a 78% do genoma consiste em retrotransposons. No trigo , quase 90% do genoma é composto por sequências repetidas e 68% por elementos transponíveis. Em mamíferos , quase metade do genoma - 45-48% - é composta por elementos transponíveis ou remanescentes dos mesmos, e cerca de 42% do genoma humano é composto por retrotransposons, enquanto 2 a 3% é formado por transposons de DNA. Eles são, portanto, elementos importantes no funcionamento e evolução do genoma dos organismos.
Os chamados íntrons do grupo I e do grupo II são outros elementos genéticos móveis. São ribozimas , ou seja, sequências de RNA dotadas de propriedades catalíticas como as enzimas , capazes de autocatálise de seu próprio splicing . Os do grupo I precisam de nucleotídeos de guanina para funcionar, ao contrário dos do grupo II . Os íntrons do grupo I, por exemplo, são encontrados esporadicamente em bactérias , mais significativamente em eucariotos simples e em um grande número de plantas superiores. Finalmente, eles são encontrados nos genes de um grande número de bacteriófagos de bactérias Gram-positivas , mas apenas de alguns fagos de bactérias Gram-negativas - por exemplo, fago T4 .
A informação genética de uma célula pode evoluir sob o efeito da incorporação de material genético exógeno absorvido pela membrana plasmática . Falamos de transferência horizontal de genes , em oposição à transferência vertical resultante da reprodução de seres vivos. É um fator evolutivo importante em muitos organismos, especialmente em unicelulares . Esse processo geralmente envolve bacteriófagos ou plasmídeos .
As bactérias com capacidade de jurisdição tendem a absorver diretamente uma molécula de DNA externa e a incorporá-la em seu próprio genoma , um processo chamado transformação genética . Eles também podem obter esse DNA como um plasmídeo de outra bactéria por meio do processo de conjugação bacteriana . Finalmente, eles podem receber esse DNA por meio de um bacteriófago (um vírus ) por transdução . Os eucariotos também podem receber material genético exógeno por meio de um processo denominado transfecção .
O DNA contém todas as informações genéticas que permitem aos seres vivos viver, crescer e se reproduzir. No entanto, não se sabe se, durante os 4 bilhões de anos de história da vida na Terra , o DNA sempre desempenhou esse papel. Uma teoria sugere que foi outro ácido nucléico , o RNA , que foi o portador da informação genética das primeiras formas de vida que surgiram em nosso planeta. O RNA teria desempenhado um papel central em uma forma inicial do metabolismo celular, na medida em que é provável que tanto transmitir informações genéticas quanto catalisar as reações químicas formadoras de ribozimas . Esse mundo de RNA , em que o RNA teria servido tanto como suporte para a hereditariedade quanto como enzimas , teria influenciado a evolução do código genético com quatro bases nucléicas , o que oferece um compromisso entre a precisão da codificação da informação genética favorecida por um pequeno número de bases por um lado e a eficiência catalítica das enzimas favorecida por um maior número de monômeros por outro.
No entanto, não há nenhuma evidência direta da existência passada de sistemas metabólicos e genéticos diferentes daqueles que conhecemos hoje, pois permanece impossível extrair material genético da maioria dos fósseis . O DNA não persiste por mais de um milhão de anos antes de ser dividido em pequenos fragmentos. Foi proposta a existência de DNA mais antigo intacto, particularmente uma bactéria viável extraída de um cristal de sal com 150 milhões de anos, mas essas publicações permanecem controversas.
Alguns componentes do DNA - adenina , guanina e compostos orgânicos relacionados - podem ter se formado no espaço . Constituintes de DNA e RNA como uracila , citosina e timina também foram obtidos em laboratório em condições que reproduzem aquelas encontradas no ambiente interplanetário e interestelar de compostos mais simples como a pirimidina , encontrada em meteoritos . A pirimidina, como alguns hidrocarbonetos policíclicos aromáticos (PAHs) - os compostos de carbono mais ricos detectados no universo - podem se formar em estrelas gigantes vermelhas ou nuvens interestelares .
Métodos foram desenvolvidos para purificar DNA de seres vivos, como extração de fenol-clorofórmio , e manipulá-lo em laboratório, como enzimas de restrição e PCR . A biologia e a bioquímica modernas fazem amplo uso dessas técnicas na clonagem molecular (in) . O DNA recombinante é uma sequência de DNA sintético montado a partir de outras sequências de DNA. Esse DNA pode transformar organismos na forma de plasmídeos ou com o auxílio de um vetor viral . Os organismos geneticamente modificados (OGM) resultantes podem ser usados para produzir, por exemplo , proteínas recombinantes, usadas em pesquisas médicas ou na agricultura .
O DNA extraído de sangue , sêmen , saliva , um fragmento de pele ou cabelo retirado de uma cena de crime pode ser usado em perícia para determinar a impressão digital de DNA de um suspeito. Para tanto, a sequência de segmentos de DNA, como sequências de microssatélites ou minissatélites, é comparada com a de indivíduos escolhidos para a ocasião ou já listados em bancos de dados. Este método é geralmente muito confiável para identificar o DNA correspondente ao de um indivíduo suspeito. A identificação pode, no entanto, ser mais complexa se a cena do crime estiver contaminada com DNA de mais de uma pessoa. A identificação de DNA foi desenvolvida em 1984 pelo geneticista britânico Sir Alec Jeffreys e foi usada pela primeira vez em 1987 para confundir um estuprador com um assassino em série .
Na medida em que o DNA acumula mutações ao longo do tempo que são transmitidas por hereditariedade , ele contém informações históricas que, quando analisadas por geneticistas por meio da comparação de sequências de organismos com diferentes histórias, permitem traçar a história da evolução desses organismos, ou seja, seus filogênese . Esta disciplina, colocando a genética a serviço da paleobiologia , oferece uma ferramenta de investigação poderosa em biologia evolutiva . Ao comparar as sequências de DNA da mesma espécie , os geneticistas populacionais podem estudar a história de determinadas populações de seres vivos, um campo que vai da genética ecológica à antropologia . Assim, o estudo do DNA mitocondrial em populações humanas é usado para rastrear as migrações do Homo sapiens . O haplogrupo X , por exemplo, foi estudado a paleodemografia para avaliar o possível parentesco dos Paleo-índios com as populações europeias do Paleolítico Superior .
( fr ) Árvore filogenética enfatizando as três áreas da vida: os eucariotos são representados em vermelho, as archaea em verde e as bactérias em azul.
Mapa de migrações humanas deduzidas filogenéticas estudos do ser humano genoma mitocondrial .
A bioinformática envolve a manipulação, pesquisa e exploração de dados biológicos, o que inclui sequências de DNA. O desenvolvimento de técnicas para armazenar e pesquisar sequências de DNA levou a avanços computacionais amplamente usados em outros lugares, especialmente no que diz respeito a algoritmos de pesquisa de substring , aprendizado de máquina e teoria de banco de dados . Os algoritmos de busca de cadeias de caracteres , que permitem encontrar uma sequência de letras incluída em uma sequência de letras mais longas, foram desenvolvidos para pesquisar sequências específicas de nucleotídeos . A sequência de DNA pode ser alinhada com outras sequências de DNA para identificar sequências homólogas e localizar as mutações específicas que as distinguem. Essas técnicas, incluindo o alinhamento de várias sequências , são usadas para estudar as relações filogenéticas e as funções das proteínas .
Repositórios de dados que representam a sequência completa de um genoma, como os produzidos pelo Projeto Genoma Humano , atingem um tamanho que é difícil de usar sem as anotações que identificam a localização de genes e elementos regulatórios em cada cromossomo . Regiões de sequências de DNA que têm os motivos característicos associados a genes que codificam proteínas funcionais ou RNAs podem ser identificadas por algoritmos de previsão de genes , que permitem aos pesquisadores prever a presença de produtos genéticos específicos e sua possível função no corpo. Dentro de um organismo, mesmo antes deles são isolados experimentalmente. Genomas inteiros também podem ser comparados, o que pode destacar a história evolutiva de organismos específicos e permitir o estudo de eventos evolutivos complexos.
A nanotecnologia de DNA utiliza as propriedades únicas do DNA de reconhecimento molecular (en) e, mais geralmente, de ácidos nucléicos para criar complexos ramificados de DNA que se auto-organizam dotados de propriedades interessantes. Desse ponto de vista, o DNA é usado como um material estrutural e não como um portador de informações biológicas. Isso levou à criação de matrizes periódicas bidimensionais, sejam elas montadas em tijolos ou pelo processo de origami de DNA , ou tridimensionais com forma poliédrica . Nanomáquinas de DNA e construções por automontagem algorítmica também foram produzidas . Essas estruturas de DNA poderiam ser usadas para organizar o arranjo de outras moléculas , como nanopartículas de ouro e moléculas de estreptavidina , uma proteína que forma complexos muito resistentes com a biotina . A pesquisa em eletrônica molecular baseada em DNA levou a empresa Microsoft a desenvolver uma linguagem de programação chamada DNA Strand Displacement (DSD), usada em certas modalidades de componentes nanoeletrônicos moleculares baseados em DNA.
Como o DNA é usado por seres vivos para armazenar suas informações genéticas , certas equipes de pesquisa também o estão estudando como um meio destinado ao armazenamento de informações digitais da mesma forma que uma memória de computador . Os ácidos nucléicos apresentariam, de fato, a vantagem de armazenar informações com densidade consideravelmente maior do que a da mídia tradicional - teoricamente mais de dez ordens de magnitude - com uma vida útil também muito maior.
É teoricamente possível codificar dois bits de dados por nucleotídeo , permitindo que a capacidade de armazenamento atingindo 455 milhões de terabytes por grama de fita única de DNA permaneça legível por vários milênios, mesmo em condições de armazenamento não ideais, e técnica de codificação de até 215.000 terabytes por grama de DNA foi proposto em 2017; Em comparação, um DVD de dupla camada e dupla camada contém apenas 17 gigabytes para uma massa típica de 16 g - isso é 400 bilhões de vezes menos capacidade de armazenamento por unidade de massa. Uma equipe do Instituto Europeu de Bioinformática conseguiu, assim, em 2012, codificar 757.051 bytes de 17.940.195 nucleotídeos , o que corresponde a uma densidade de armazenamento de aproximadamente 2.200 terabytes por grama de DNA. Por sua vez, uma equipe suíça publicou em fevereiro de 2015 um estudo que demonstra a robustez do DNA encapsulado em sílica como meio durável de informação.
Além disso, outras equipes estão trabalhando na possibilidade de armazenar informações diretamente em células vivas, por exemplo, para codificar contadores no DNA de uma célula para determinar o número de divisões ou diferenciações , que poderiam encontrar aplicações na pesquisa do câncer e envelhecimento .
O DNA foi isolado pela primeira vez em 1869 pelo biólogo suíço Friedrich Miescher como uma substância rica em fósforo do pus de curativos cirúrgicos usados. Como essa substância foi encontrada no núcleo das células , Miescher a chamou de nucleína . Em 1878, o bioquímico alemão Albrecht Kossel isolou o componente não proteico dessa "nucleína" - os ácidos nucléicos - e identificou as cinco bases nucléicas . Em 1919, o biólogo americano Phoebus Levene identificou os constituintes dos nucleotídeos , ou seja, a presença de uma base , uma ose e um grupo fosfato . Ele sugeriu que o DNA consistia em uma cadeia de nucleotídeos unidos por seus grupos fosfato. Ele achava que as correntes eram curtas e que as bases se seguiam repetidamente em uma ordem fixa. Em 1937, o físico e biólogo molecular britânico William Astbury produziu o primeiro padrão de difração de DNA por cristalografia de raios X , mostrando que o DNA tem uma estrutura ordenada.
Em 1927 , o biólogo russo Nikolai Koltsov intuiu que a hereditariedade se baseava em uma "molécula hereditária gigante" composta de "duas fitas espelhadas uma da outra que se reproduziam de forma semiconservadora usando cada fita como modelo". Ele acreditava, entretanto, que se tratava de proteínas que carregavam informações genéticas. Em 1928 , o bacteriologista inglês Frederick Griffith realizou um famoso experimento que agora leva seu nome e pelo qual demonstrou que bactérias vivas não virulentas colocadas em contato com bactérias virulentas mortas pelo calor podiam ser transformadas em bactérias virulentas. Este experimento abriu caminho para a identificação em 1944 do DNA como um vetor de informação genética por meio do experimento de Avery, MacLeod e McCarty . O bioquímico belga Jean Brachet demonstrou em 1946 que o DNA é um constituinte dos cromossomos , e o papel do DNA na hereditariedade foi confirmado em 1952 pelos experimentos de Hershey e Chase, que demonstraram que o material genético do fago T2 é feito de DNA.
A primeira estrutura de dupla hélice antiparalela reconhecida hoje como o modelo correto de DNA foi publicada em 1953 pelo bioquímico americano James Watson e pelo biólogo britânico Francis Crick em um artigo já clássico na revista Nature . Trabalhavam no assunto desde 1951 no Laboratório Cavendish da Universidade de Cambridge , e mantinham como tal correspondência privada com o bioquímico austríaco Erwin Chargaff , originalmente das regras de Chargaff , publicadas na primavera de 1952, segundo as quais, dentro de uma molécula de DNA , o nível de cada uma das bases de purina é substancialmente igual ao nível de uma das duas bases de pirimidina , mais precisamente o nível de guanina é igual ao da citosina e o nível de adenina é igual ao da timina , o que sugeriu a ideia de um emparelhamento de adenina com timina e guanina com citosina.
Em maio de 1952, o estudante britânico Raymond Gosling , que trabalhava com Rosalind Franklin na equipe de John Randall , tirou uma imagem de difração de raios-X (ilustração 51 ) de um cristal de DNA altamente hidratado. Este instantâneo foi compartilhado com Crick e Watson sem o conhecimento de Franklin e foi fundamental para estabelecer a estrutura correta do DNA. Franklin também indicou aos dois pesquisadores que a estrutura de fósforo da estrutura tinha que estar fora desta, e não perto do eixo central como se pensava então. Ela identificou ainda mais o aglomerado espacial de cristais de DNA, o que permitiu a Crick determinar que as duas fitas de DNA eram antiparalelas. Enquanto Linus Pauling e Robert Corey publicaram um modelo molecular de um ácido nucléico formado por três cadeias entrelaçadas com, de acordo com as ideias da época, os grupos fosfato próximos ao eixo central e as bases nucléicas voltadas para fora, Crick e Watson finalizaram em fevereiro 1953, seu modelo antiparalelo de duas cadeias com os grupos fosfato do lado de fora e as bases nucleicas dentro da dupla hélice, um modelo agora considerado a primeira estrutura correta de DNA a ser proposta.
Este trabalho foi publicado na edição de 25 de abril de 1953 da revista Nature por meio de cinco artigos que descrevem a estrutura finalizada por Crick e Watson, bem como as evidências que sustentam esse resultado. No primeiro artigo, intitulado Estrutura Molecular dos Ácidos Nucleicos: Uma Estrutura para o Ácido Nucleico de Desoxirribose , Crick e Watson afirmam: “Não escapou à nossa observação que o emparelhamento específico que postulamos sugere imediatamente um possível mecanismo para a replicação do material. Genética ”. Este artigo foi seguido por uma publicação do britânico Maurice Wilkins et al. investigando a difração de raios-X por B-DNA in vivo , que sustentou a existência da estrutura de dupla hélice em células vivas e não apenas in vitro , e a primeira publicação do trabalho de Franklin e Goslin sobre os dados obtidos por difração de raios-X e seu próprio método de análise.
Rosalind Franklin morreu em 1958 de câncer e, portanto, não recebeu o Prêmio Nobel de Fisiologia ou Medicina concedido em 1962 , "por suas descobertas a respeito da estrutura molecular dos ácidos nucléicos e sua importância para a transferência da informação genética na matéria viva", para Francis Crick, James Watson e Maurice Wilkins, que não teve uma palavra para creditar Franklin por seu trabalho; o fato de ela não ter sido associada a este Prêmio Nobel continua a ser debatido.
Em 1957 , Crick publicou um artigo moldando o que hoje é conhecido como a teoria fundamental da biologia molecular ao descrever as relações entre DNA, RNA e proteínas , articuladas em torno da "hipótese do 'adaptador'. A confirmação do modo de replicação semiconservativa da dupla hélice veio em 1958 com o experimento de Meselson e Stahl . Crick et al. deram continuidade ao trabalho e mostraram que o código genético é baseado em sucessivos tripletos de bases nucléicas denominados códons , o que permitiu a decifração do próprio código genético por Robert W. Holley , Har Gobind Khorana e Marshall W. Nirenberg . Essas descobertas marcaram o nascimento da biologia molecular .
A estrutura helicoidal do DNA inspirou vários artistas, sendo o mais famoso o pintor surrealista Salvador Dalí , que se inspirou nela em nove pinturas entre 1956 e 1976 , incluindo Paysage de papillon (O Grande Masturbador em uma Paisagem Surrealista com DNA) (1957 -1958) e Galacidalacidesoxyribonucleicacid (1963).
“ Recuperamos 757.051 bytes de informação de 337 pg de DNA, dando uma densidade de armazenamento de informação de 2,2 PB / g (= 757.051 / 337 × 10 −12 ) . Observamos que essa densidade de informações é suficiente para armazenar o total de 2011 dos Arquivos de Registros Eletrônicos da Administração de Arquivos e Registros dos Estados Unidos de ~ 100 TB em < 0,05 g de DNA, o arquivo de 2 PB da Internet Archive Wayback Machines de sites em ~ 1 g de DNA e sistema CASTOR 80 PB do CERN para dados do LHC em ~ 35 g de DNA. "
" Ich habe mich daher später mit meinen Versuchen an die ganzen Kerne gehalten, die Trennung der Körper, die ich einstweilen ohne weiteres Präjudiz als lösliches und unlösliches Nuclein bezeichnen will, einem günstigeren Material überlenden. "
“Acho que o tamanho dos cromossomos nas glândulas salivares [da Drosophila ] é determinado pela multiplicação dos genonemas. Eu designo por esse termo o fio axial do cromossomo, no qual os geneticistas localizam a combinação linear de genes; ... No cromossomo normal, geralmente há apenas um genonema; antes da divisão celular, esse genonema é dividido em duas fitas. "
“ Butterfly Landscape (O Grande Masturbador em Surreallist Landscape with DNA) mostra a visão de Dali. Embora este fosse o primeiro, criado apenas alguns anos após o anúncio da dupla hélice de Watson e Crick, o DNA apareceria em muitos dos trabalhos futuros de Dali. Como agente de criação, talvez seja fácil ver por que as borboletas brotam da estrutura icônica desta pintura. Mas também parece que Dali usou DNA para simbolizar não apenas a criação, mas a idéia maior de Deus, e pode ser por isso que parte da estrutura molecular está visivelmente projetando-se das nuvens. "
“Salvador Dali evoca a sua relação com a ciência, em particular com o DNA, como fonte de inspiração para o seu trabalho. Ele dá à ciência uma dimensão poética e a desvia para fins plásticos. Ele a encena e a usa a serviço de suas fantasias e do método “crítico-paranóico”. "