La genetica molecolare indaga i meccanismi chimici che permettono l'espressione delle informa-2oni genetiche
in un individuo e la trasmissione dei caratteri ereditari da un individuo ai propri
discendenti. L'unità base dell'eredità è rappresentata dal gene, che in questo contesto
può essere definito come il tratto di DNA responsabile della determinazione di un
dato carattere. Agli inizi degli anni Quaranta, era noto che i geni determinano
i caratteri ereditari e che sono Spiazzati sui cromosomi, ma non se ne conosceva
l'esatta natura chimica. Poiché si sapeva che i cromosomi sono costituiti principalmente
da acido desossiribonucleico (DNA) e proteine, il depositano dell'informazione biologica
doveva essere una di queste due molecole. La maggior parte dei "cercatori riteneva
che il materiale genetico fosse costituito dalle proteine e che il DNA, essendo
formato da soli quattro nucleotidi, fosse troppo semplice per giustificare la varietà
e la ricchezza dell'informazione biologica. Questa ipotesi, però, si rivelò sbagliata.
Nel 1944, O.T. Avery, C.M. MacLeod e M. McCarty riuscirono a dimostrare che il depositario
dell'informazione genetica era il DNA, la prova decisiva fu però fornita nel 1952
da A.D. Hershey e M. Chase, i quali dimostrarono che i batteriofagi, per introdurre
nel batterio ospite il loro materiale ereditario, iniettano una molecola di DNA.
basi pirimidiniche o pirimidine, derivate dall'eterociclo pirimidina: citosina,
timina e uracile;
basi puriniche o purine, derivate dall'eterociclo purina: adenina e guanina.
Il DNA è un acido nucleico ed è quindi un polimero lineare di nucleotidi, in cui possono essere presenti quattro diverse basi azotate: due puriniche, adenina (A) e guanina (G), e due pirimidiniche, citosina (C) e timina (T). Nei primi anni '50, James Watson e Francis Crick, analizzando tutti i dati allora disponibili, individuarono la struttura tridimensionale del DNA delineando il noto modello della doppia elica. Secondo il modello di Watson e Crick, la molecola è costituita da due filamenti polinucleotidici avvolti a elica intorno a un asse centrale. Ogni filamento è formato da uno scheletro di molecole di zucchero e gruppi fosfato alternati: il gruppo ossidrilico del C5' di un'unità di ribosio è legato al gruppo ossidrilico del C3' del ribosio successivo attraverso un legame (o ponte) fosfodiestereo. A ogni molecola di zucchero è legata una base azotata, quindi le basi sporgono lateralmente dai filamenti polinucleotidici.due filamenti sono uniti da legami a idrogeno tra le basi azotate che si fronteggiano nella doppia elica.
Le basi azotate non si appaiano in modo casuale: la distanza tra i due filamenti nella doppia elica è costante, l'appaiamento, quindi, ha luogo necessariamente tra una purina (formata da due anelli) e una pirimidina (formata da un solo anello). Le basi appaiate sono dette complementari. In particolare, l'adenina si appaia con la ! timina mediante due legami a idrogeno, mentre la guanina si appaia con la citosina attraverso tre legami a idrogeno.
Utilizzando la tecnica della cromatografia su carta il biochimico austriaco
Erwin Chargaff (1905-2002) riuscì a separare la molecola del DNA nelle basi da cui
è formata e a determinare la loro percentuale di abbondanza relativa. I suoi studi
fornirono dati molto importanti per la comprensione della struttura del DNA, evidenziata
poi da Watson e Crick. Dal lavoro di questo scienziato derivano le regole di Chargaff,
riguardanti i rapporti esistenti fra le 4 basi azotate che formano il DNA:
esiste un rapporto 1:1 tra le basi puriniche (A+G) e le basi pirimidiniche (T+C)
contenute nel DNA di una cellula. Il rapporto è costante in ogni specie, ma per
specie diverse le percentuali delle varie basi sono diverse;
in una molecola di DNA a doppio filamento la percentuale di adenina è pari a quella
di timina, e la percentuale di citosina a quella di guanina (%A = %T; %C = %G).
La struttura del DNA è dunque paragonabile a quella di una scala a chiocciola, le cui le ringhiere sono formate da unità ibernate di zucchero e gruppi fosfato, mentre i pioli sono costituiti dalle coppie 3 oasi complementari appaiate. La distanza tra una coppia di basi e la successiva è di 3,4 Å e ogni giro completo dell'elica comprende 10 coppie di Poiché ogni molecola di DNA può essere lunga migliaia di nucleotidi, le quattro basi possono combinarsi in un numero enorme di sequenze. A causa della precisa complementarità tra le basi azotate, la sequenza dei nucleotidi di un filamento determina in modo univoco 2 sequenza dei nucleotidi di quello complementare. Ogni filamento ha un'estremità 5' ed un' estremità 3'. Poiché nella doppia elica l'estremità 3' a un filamento fronteggia l'estremità 5' a quello complementare, i due filamenti s dicono antiparalleli. La dimensione del genoma viene descritta in termini di "paia di basi" (in inglese base pair, con sigla bp) che corrispondono a coppie di nucleotidi appaiati. Questa quantità varia notevolmente nei diversi organismi: nei procarioti è nell'ordine di 104-107 paia di basi; negli eucarioti è 108-1011 paia di basi. Il DNA umano (diploide), disteso, avrebbe la lunghezza di circa 2 metri, corrispondenti a circa 6 miliardi di paia di basi.
Per poter essere trasmesso ai discendenti, il materiale genetico, cioè il DNA, deve essere in grado di duplicarsi. Il processo di duplicazione del DNA ha luogo prima che una cellula si divida ed è chiamato replicazione. Al momento della replicazione, i due filamenti della doppia elica si separano come in una cerniera lampo grazie alla rottura dei legami a idrogeno tra le basi appaiate. Ciascun filamento può così funzionare come stampo per la sintesi di un nuovo filamento a esso complementare, utilizzando i desossiribonucleotidi liberi presenti nella cellula. Gli esperimenti di Meselson e Stahl dimostrarono che la replicazione del DNA è semiconservativa, cioè che ognuna delle due molecole figlie di DNA è costituita da un filamento del DNA parentale (conservato) e da un filamento sintetizzato ex novo. L'intero processo richiede energia e molti enzimi. Un enzima (la DNA-elicasi) e particolari proteine sono necessari, per esempio, per "srotolare" la doppia elica nel punto di origine della replicazione, detto forcella di replicazione.
La sintesi vera e propria del nuovo filamento è catalizzata invece da un gruppo di enzimi noti come DNA polimerasi.
Il processo avviene con modalità leggermente differenti nei procarioti e negli eucarioti: nelle cellule procariotiche vi è un unico punto di origine della replicazione e il processo avviene nel citoplasma, mentre in quelle eucariotiche la replicazione ha luogo nel nucleo e vi sono diversi punti di origine in ogni cromosoma. La DNA polimerasi non può sintetizzare direttamente un nuovo filamento di DNA sul filamento parentale, ma ha bisogno di un primer, o innesco, cioè un breve tratto a doppia elica, da cui iniziare la propria sintesi; questo è permesso dalla sintesi di un breve filamento di RNA. La replicazione procede sempre in direzione 5' -> 3'(perché la DNA polimerasi, come l'RNA polimerasi, catalizza il legame di un nuovo nucleotide all'estremità 3') e questo ha una conseguenza importante: uno dei due filamenti, detto filamento guida (o leading strana), può essere sintetizzato in maniera continua, utilizzando un unico innesco, mentre l'altro filamento, chiamato filamento lento (o lagging strand), deve essere sintetizzato in direzione opposta, sotto forma di piccoli frammenti discontinui, chiamati frammenti di Okazaki, uniti successivamente. Il processo è comunque molto rapido: la velocità di crescita di un filamento varia infatti da 50 nu-:leotidi al secondo (nei mammiferi) a 500 nucleotidi al secondo (nei procarioti). La replicazione del DNA è anche estremamente precisa.
Oltre ad
aggiungere nuovi nucleotidi alla catena in crescita (funzione polimerasica), la
DNA poli--ìerasi è in grado di individuare l'eventuale aggiunta di un nucleotide
sbagliato al filamento in co-struzione. In caso di errore, l'enzima inverte la sua
direzione di marcia rimuovendo i nucleotidi uno a uno fino ad arrivare al punto
del nucleotide sbagliato (funzione esonucleasica). Anche altri enzimi, chiamati
nucleasi di restauro del DNA, hanno il compito di eliminare eventuali errori rimasti
dopo la replicazione: scorrendo lungo la doppia elica, individuano i nucleotidi
sbagliati e li sostituiscono con quelli corretti. Ognuno dei due filamenti
di DNA può fare da stampo per la sintesi dell'altro. Si può quindi dire che una
doppia elica di DNA reca lo stesso messaggio su entrambi i filamenti.
Una volta dimostrato che il DNA contiene tutte le informazioni necessarie per definire lo sviluppo e la fisiologia di una cellula, restava da stabilire in che modo questa molecola svolgesse tale funzione. A questo scopo sono stati importanti gli studi effettuati su microrganismi biochimicamente iterati in seguito a mutazioni. In linea generale, con il termine mutazione si intende un cambiamento nell'informazione genetica di un organismo e mutanti sono detti gli organismi che presentano una mutazione. Studiando i mutanti della comune muffa del pane (Neurospora crassa), 2. Beadle ed E. Tatum dimostrarono l'esistenza, per ciascuna mutazione, di un corrispondente enzima funzionante in modo anomalo. Sulla base dei loro esperimenti, nel 1941 formularono quindi l'ipotesi "un gene-un enzima", secondo la quale un determinato gene è responsabile della sintesi di un determinato enzima, cioè codifica per quell'enzima. L'espressione "un gene-un enzima" fu in seguito modificata in "un gene-una proteina", dal momento che non tutte le proteine, la cui sintesi è controllata dal DNA, sono enzimi. Poiché ulteriori esperimenti mostrarono che le proteine sono spesso costituite da due o più subunità (catene polipeptidiche) la formulazione originale venne corretta ancora una volta nella forma un gene una catena polipeptidica". L'alcaptonuria è un esempio della regola "un gene-una proteina". Questa è una malattia autosomica recessiva che ha come sintomi artrite e urine scure quando esposte all'aria. Il colore scuro è dovuto alla presenza di acido omogentisico, un intermedio della degradazione dell'amminoacido tirosina. Questa sostanza si accumula perché, a causa di una mutazione, viene a mancare uno degli enzimi coinvolti nella degradazione della tirosina.
Una volta individuata la relazione esistente fra i geni e le corrispondenti proteine
prodotte dalla cellula, restava da chiarire come un gene, contenuto nel nucleo e
formato da una sequenza costituita da solo quattro tipi di nucleotidi, potesse dar
luogo a una catena polipeptidica, sintetizzata nel citoplasma e costituita da una
sequenza di venti tipi di amminoacidi. Il passaggio dai geni alle proteine è reso
possibile dall'intervento dll'acido ribonucleico (RNA), un acido nucleico diverso
dal DNA, ma formato anch'esso da una sequenza lineare di nucleotidi. Il messaggio
contenuto in un gene viene copiato (trascritto) sotto forma di RNA, nel nucleo,
in un processo chiamato trascrizione. URNA si trasferisce poi dal nucleo al citoplasma,
dove il messaggio che esso trasporta viene usato per sintetizzare una proteina (traduzione).
Il flusso dell'informazione biologica va dunque sempre dal DNA all'RNA, alle proteine.
Il dogma centrale della biologia molecolare ammette un'eccezione: l'enzima trascrittasi
in-versa, presente in alcuni virus a RNA, permette la sintesi di un filamento di
DNA a partire da una molecola di RNA.
L'RNA differisce dal DNA per alcune caratteristiche:
lo zucchero pentoso è il ribosio anziché il desossiribosio;
è costituito da un filamento singolo anziché da una doppia elica;
contiene quattro basi azotate, tre delle quali (A, G e C) uguali
a quelle del DNA e una diversa: al posto della timina si trova infatti l'uracile
(U), che al pari della timina si appaia con l'adenina;
negli eucarioti l'RNA è sintetizzato nel nucleo, ma svolge i suoi compiti nel
citoplasma. uracile (U}
Esistono tre tipi diversi di RNA, ciascuno dei quali partecipa alla sintesi delle
proteine:
RNA messaggero (mRNA): trasporta l'informazione genetica dal DNA al citoplasma,
dove vengono sintetizzate le proteine;
RNA ribosomiale (rRNA): è un elemento costitutivo dei ribosomi;
RNA di trasporto (tRNA): trasporta gli amminoacidi liberi nel citoplasma
ai ribosomi, durante la sintesi proteica, e serve per tradurre l'informazione contenuta
nella sequenza di nucleotidi dell'mRNA in una sequenza di amminoacidi.
La trascrizione è il processo mediante il quale l'informazione contenuta
in un gene viene copiata (trascritta) in una molecola di mRNA. La
sintesi dell'mRNA è catalizzata da un gruppo di enzimi, il più importante
dei quali è l'RNA polimerasi. Nel punto di attacco dell'enzima i due filamenti del
tratto di DNA corrispondente a un gene (o a un gruppo di geni) si aprono e uno di
essi funziona da stampo per la sintesi di una molecola di mRNA a esso complementare,
con un meccanismo simile a quello della replicazione. L'RNA polimerasi si
sposta lungo il filamento stampo di DNA aggiungendo via via nuovi ribonucleotidi
all'estremità 3' del filamento di mRNA nascente; si dice infatti che
la trascrizione avviene in direzione 5' --> 3'. Per iniziare la sintesi, l'RNA polimerasi
si lega a una sequenza specifica sul DNA, detta promotore; un'altra
sequenza specifica, detta segnale di terminazione, indica il punto di
arresto della trascrizione. Nella trascrizione, a differenza di ciò che accade
nella replicazione, viene copiato solo uno dei due filamenti di DNA, riconosciuto
dalla RNA polimerasi per la presenza del promotore. Come nella replicazione,
il nuovo filamento di RNA sintetizzato è complementare, e non identico, al tratto
di DNA stampo da cui è stato copiato. Nei procarioti la trascrizione avviene nel
citoplasma e l'mRNA neoprodotto può essere utilizzato immediatamente per la sintesi
proteica. Negli eucarioti, invece, la trascrizione ha luogo nel nucleo e l'mRNA
deve essere modificato prima di migrare nel citoplasma. Quasi tutti i geni degli
eucarioti pluricellulari sono infatti discontinui, sono cioè formati da un'alternanza
di sequenze codificanti (che vengono tradotte in proteine), dette esoni, e sequenze
non codificanti, dette introni. Il DNA di un gene discontinuo viene trascritto completamente,
copiando sia gli esoni che gli introni e formando un mRNA immaturo; prima che l'mRNA
lasci il nucleo gli introni vengono quindi eliminati e gli esoni saldati in sequenza
per formare l'mRNA maturo (questo processo è detto splicing).
Prima maturazione dell'mRNA negli eucarioti
Prima dello splicing l'mRNA degli eucarioti subisce due processi particolari:
mentre l'mRNA è ancora in trascrizione, all'estremità 5' viene aggiunto un "cappuccio"
(in inglese cap) che protegge l'mRNA dalla degradazione. Questo è dato da un nucleotide
insolito: la 7-metilguanosina;
all'estremità 3' viene aggiunta una coda di 100-250 nucleotidi di adenina (o poli-A)
in un processo detto poliadenilazione. La funzione non è completamente nota, ma
pare che favorisca l'esportazione dal nucleo al citoplasma e che sia necessaria
per un corretto inizio della traduzione.
La parte centrale di un mRNA, quella che contiene le informazioni per assemblare
gli amminoacidi, è detta open reading trame (in italiano "cornice di lettura") o
ORF. Alle estremità 5' e 3' di ogni ORF si trovano gli elementi regolativi.
La traduzione del
messaggio contenuto nell'mRNA (scritto con un linguaggio basato su 4 nucleotidi
in una proteina (scritta con un linguaggio basato su 20 amminoacidi) è permessa
da un sistema di corrispondenza, che è detto codice genetico. Se la corrispondenza
tra nucleotidi e amminoacidi fosse 1:1, i 4 nucleotidi potrebbero specificare solo
4 amminoacidi. Se un amminoacido corrispondesse a una successione di due nucleotidi,
sarebbero possibili in totale 16 (= 42) combinazioni, ancora insufficienti per specificare
tutti gli amminoacidi necessari. Il codice è invece basato su triplette di nucleotidi,
dette codoni, che rendono possibili 64 (= 43) combinazioni, più che sufficienti
per codificare i 20 amminoacidi. Il codice genetico presenta una serie di interessanti
caratteristiche:
contiene un segnale di inizio, rappresentato dal codone AUG (che
codifica per l'amminoacido metionina);
contiene dei segnali di fine lettura, rappresentati da tre codoni di stop (o
codoni non senso);
non è ambiguo: un dato codone specifica sempre un unico amminoacido. Per esempio
il codone AUU codifica sempre l'isoleucina (Ile);
è ridondante (o degenerato): quasi tutti gli ammi-noacidi sono specificati da
più di un codone. Per esempio, l'isoleucina è codificata dai codoni AUU, AUC
e AUA;
è universale, cioè è valido per tutti gli organismi, con pochissime eccezioni.
I codoni sinonimi differiscono spesso solo per il terzo nucleotide; la presenza
dei sinonimi costituisce una difesa contro le mutazioni, perché, in caso si verifichi
una mutazione, abbas-sa la probabilità di inserire un amminoacido sbagliato durante
la sintesi proteica.
La sintesi proteica, indicata anche come traduzione è l'ultima tappa del processo di espressione di un
gene. Avviene nel citoplasma e ha sede sui ribosomi. Al processo partecipano
tutti e tre i tipi di RNA: l'mRNA, che trasporta il messaggio, l'rRNA,
che è parte integrante del ribosoma, e il tRNA, che fa da "interprete" traducendo
il linguaggio degli acidi nucleici in quello delle proteine. Questa molecola è infatti
in grado da un lato di legare gli amminoacidi, dall'altro di ricono-scere i codoni
dell'mRNA grazie a una tripletta di nucleotidi, detta anticodone, complementare
a uno specifico codone sull'mRNA. I tRNA sono molecole relativamente piccole, formate
da circa 80 nucleotidi e rappresentabili con una struttura a trifoglio. Ogni cellula
ne contiene almeno un tipo per ogni amminoacido; il legame fra un tRNA e lo specifico
ammi-noacido è catalizzato da uno specifico enzima amminoacil-tRNA-ligasi. I ribosomi
possiedono tre importanti siti di legame: uno per l'mRNA, nella subunità minore,
e due per il tRNA: il sito P (sito peptidilico) e il sito A (sito amminoacilico).
La principale eccezione è rappresentata dal DNA mitocondriale, il cui codice è diverso
da quello nucleare. Inoltre, in un piccolo gruppo di protisti, i codoni UAA e UAG,
anziché essere codoni di stop, codificano per l'amminoacido glutammina. La sintesi
di una proteina avviene in tre fasi: inizio, allungamento e terminazione.
Nella fase di inizio l'estremità 5' dell'mRNA si lega alla subunità minore
del ribosoma. A questo complesso si associano poi la subunità maggiore del ribosoma
e il primo tRNA legato al suo specifico amminoacido (amminoacil-tRNA), che si appaia
con il suo anticodone al codone di inizio e va a occupare il sito P.
La successiva
fase di allungamento inizia con l'inserimento nel sito A di un amminoacil-tRNA
con un anticodone complementare a quello del secondo codone dell'mRNA. A questo
punto si forma il legame peptidico tra i primi due amminoacidi e contemporaneamente
il tRNA che occupava il sito P esce dal ribosoma. Il ribosoma si sposta quindi di
un codone lungo l'mRNA (in direzione da 5' a 3'), in modo che il secondo tRNA con
i due amminoacidi attaccati vada ora a occupare il sito P. Nel sito A tornato libero
si porta un terzo amminoacil-tRNA e si forma un nuovo legame peptidico. L'operazione
si ripete più volte legando gli amminoacidi uno dopo l'altro secondo la specifica
sequenza contenuta nell'mRNA che dirige la sintesi, fino a che la catena polipetidica
è completa. Il sito P accetta di volta in volta il tRNA che lega la catena polipeptidica
in crescita, mentre il sito A è sempre occupato dal tRNA legato al nuovo amminoacido
che andrà ad aggiungersi alla catena.
Quando il ribosoma arriva a uno dei tre codoni di stop, a cui non corrisponde
nessun tRNA, si ha la terminazione: la traduzione si interrompe, la proteina si
stacca dal tRNA, che a sua volta abbandona il sito P, e le due subunità del ribosoma
si dissociano. Tutto il processo di sintesi proteica richiede una notevole quantità
di energia, fornita dall'idrolisi dell'ATP via via che durante l'allungamento il
primo ribosoma si sposta lungo l'mRNA, l'estremità 5' rimasta libera può iniziare
a essere letta da un altro ribosoma. Lo stesso filamento di mRNA può quindi essere
letto contemporaneamente da più ribosomi, l'insieme dei quali è detto polisoma.
La sintesi delle proteine è comunque un processo molto rapido, che richiede pochi
secondi; la sua /elocità è tale da far fronte in ogni momento alle necessità cellulari,
che variano da cellula a cellula e da proteina a proteina.