Codice genetico e sintesi delle proteine

Ogni gene contiene, nella sequenza stessa di nucleotidi che lo costituisce, le informazioni necessarie per produrre una proteina. La produzione di proteine all'interno di ogni cellula è un processo biochimico molto complesso, che prevede prima la trascrizione del DNA in una molecola di RNA e quindi la traduzione dell'informazione in esso contenuta.

La Trascrizione

La trascrizione è il processo mediante il quale le informazioni genetiche contenute in un gene vengono trasferite in una molecola di RNA grazie a degli enzimi chiamati RNA-polimerasi.
La RNA polimerasi si lega al DNA del gene in alcune zone, dette promotori, e da qui produce una sequenza di nucleotidi complementare ad uno dei filamenti del DNA in via di trascrizione.

In pratica il DNA del gene funziona da stampo e la RNA-polimerasi, aggiungendo un nucleotide alla volta, produce un filamento di RNA complementare al DNA che mano a mano si allunga fino a quando la polimerasi incontra una particolare sequenza di nucleotidi che conclude questo processo. Tutti i tipi di RNA contenuti in una cellula sono prodotti attraverso il processo di trascrizione.

L'm-RNA contiene l'informazione genetica per produrre le proteine, mentre il t-RNA e l'r-RNA, pur non congenendo nessuna informazione genetica, sono altrettanto importanti per la produzione delle proteine che avviene grazie ai ribosomi.

Avvenuta la trascrizione di un gene, le nuove molecole di RNA escono dal nucleo ed entrano nel citoplasma.

Il codice genetico

L'm-RNA contiene l'informazione genetica necessaria per produrre le proteine. L'informazione è "codificata" nella sequenza dei nucleotidi dell'm-RNA. In particolare una sequenza di tre nucleotidi costituisce un'unità di codice genetico, detta codone. 

Poichè i nucleotidi dell'm-RNA sono 4 (C, G, A, U), combinandoli a tre alla volta sono possibili 64 combinazioni diverse (CCC, CCG, CCA ...GGU...). A ciascuna di queste 64 combinazioni corrisponde uno dei 20 aminoacidi presenti nelle proteine umane. 

La scoperta che le triplette di nucleotidi fossero le unità codificanti alla base del codice genetico è avvenuta nei primi anni '60 del secolo scorso, grazie a M.W. Niremberg, a cui venne assegnato il premio Nobel nel 1968 (insieme a R. Holley e a H.G. Khorana).

Prima dei loro esperimenti era noto che il DNA fosse formato da 4 tipi diversi di nucleotidi, che da soli non erano sufficienti per codificare i 20 diversi tipi di amminoacidi presenti nelle nostre cellule e che dovevano quindi essere uniti in sequenze diverse, come lettere per formare parole. 

Il codice esatto è costituito dalla sequenza delle triplette di nucleotidi (il numero minimo necessario e sufficiente per  i 20 amminoacidi utilizzati dalle nostre cellule: sequenze di soli 2 nucleotidi infatti non sarebbero sufficienti, perché 4 nucleotidi presi 2 alla volta avrebbero originato 4^2 = 16 combinazioni, insufficenti per i 20 aminoacidi). 

Una tripletta di 4 nucelotidi può presentarsi in 4^3 = 64 combinazioni, che sono più che sufficienti per codificare tutti i 20 amminoacidi. Infatti molti di essi sono codificati da più di un codone. Vi sono anche 3 codoni ai quali non corrisponde nessun amminoacido e in corrispondenza di essi la sintesi proteica cessa (codoni di stop).

Il codice genetico viene interpretato sui ribosomi, dove vengono "lette" le triplette dei codoni degli m-RNA, durante il processo di traduzione, che consiste nella sintesi delle proteine.

In questo processo, oltre ai ribosomi, partecipa il t-RNA, che svolge la funzione di trasportare gli amminoacidi sui ribosomi dove vengono uniti in lunghe catene che non sono altro che le proteine.

Il t-RNA è una breve catena di RNA (composta da un'ottantina circa di nucleotidi). Questa molecola ha una caratteristica forma a trifoglio, con tre protuberanze in cui i nucleotidi che la costituiscono non sono appaiati. Su una di queste protuberanze si trova una regione, costituita da 3 nucleotidi, detta anticodone, mentre all'estremità della molecola, sul gambo del trifoglio, si trova il sito di attacco per un aminoacido.

Nrl citoplasma di ogni cellula sono presenti diversi tipi di t-RNA che differiscono tra loro per la diversa sequenza dei 3 nucleotidi che costituiscono l'anticodone. Dovrebbero essercene almeno 61 (dei 64 codoni dell'm-RMA 3 sono codoni di stop e a questi non corrisponde nessun aminoacido). Tuttavia, a causa di una non precisa lettura del terzo nucleotide del codone, i 61 t-RNA ipotizzati si riducono a meno di 35. I diversi t-RNA sono in grado di legarsi in modo specifico ad un solo aminoacido.