Alla luce della biologia cellulare, lo studio dell’espressione genica è strettamente legato alla nostra comprensione delle proteine. Fin dai primi lavori di Christian Anfinsen negli anni ’50, sappiamo che la sequenza degli aminoacidi in una proteina determina la sua struttura tridimensionale finale. In seguito a ciò, gli scienziati hanno ripetutamente osservato che la struttura della proteina detta dove agirà e cosa farà. Da nessuna parte questo è stato più ovvio che con la funzione degli enzimi. La forma e la struttura delle proteine è un aspetto cruciale della biologia dell’espressione genica e collega la nostra comprensione dell’espressione genica alla biologia della cellula. Sebbene si occupi principalmente di molecole proteiche che agiscono su sequenze di DNA e RNA, come i fattori di trascrizione e gli istoni, lo studio dell’espressione genica si concentra anche su dove viene modulata l’espressione nella cellula. Infatti, la modulazione dell’espressione genica può avvenire nel nucleo, nel citoplasma o anche nella membrana cellulare a causa dell’impatto delle proteine sull’RNA in quelle sottoregioni cellulari.
Come fanno gli scienziati a studiare la forma e la funzione delle proteine? Una tecnica chiamata spettrometria di massa permette agli scienziati di sequenziare gli aminoacidi di una proteina. Dopo che una sequenza è nota, confrontare la sua sequenza di aminoacidi con i database permette agli scienziati di scoprire se ci sono proteine correlate la cui funzione è già nota. Spesso sequenze di aminoacidi simili avranno funzioni simili all’interno di una cellula. La sequenza di aminoacidi permette anche agli scienziati di prevedere la carica della molecola, la sua dimensione e la sua probabile struttura tridimensionale. La carica e la dimensione possono poi essere confermate sperimentalmente (tramite SDS-PAGE e gel a doppia dimensione). Per dedurre le complessità della struttura tridimensionale, gli scienziati cercheranno di cristallizzare la proteina per confermare la sua struttura molecolare attraverso la cristallografia a raggi X e/o la spettroscopia di risonanza magnetica nucleare (pNMR).
Come studiano gli scienziati l’impatto delle proteine sui geni o altre proteine? Un buon modo per studiare la funzione della proteina è vedere cosa succede nella cellula quando la proteina non è presente. Per questo gli scienziati usano sistemi modello, come la coltura cellulare o organismi interi, in cui possono testare la funzione di proteine o geni specifici modificandoli o mutandoli. Il livello di espressione di un gene può essere calcolato misurando l’mRNA trascritto (northern blot), la proteina espressa (Western Blot), o colorando direttamente la proteina o l’mRNA quando è ancora nella cellula. Le nuove tecniche hanno cambiato il modo in cui studiamo l’espressione genica – i microarray di DNA, l’analisi seriale dell’espressione genica (SAGE), e il sequenziamento ad alto rendimento permettono schermi più grandi di più molecole simultaneamente e hanno aperto la possibilità di nuovi e più ampi tipi di domande. Per analizzare grandi serie di dati e vedere come le reti di molecole interagiscono, una nuova disciplina chiamata biologia dei sistemi fornisce il quadro per queste comprensioni più ampie e più integrate delle reti di regolazione.
Interessante, le proteine non sono gli unici regolatori genici. Le molecole regolatrici si presentano sotto forma di RNA e agiscono su altri acidi nucleici modificandoli o distruggendoli. Un esempio è la famiglia dei riboswitch, molecole di acido ribonucleico che formano strutture tridimensionali che fermano o interferiscono con la trascrizione, dato il giusto segnale esterno. Un altro esempio di RNA che agisce su altri RNA è il meccanismo di interferenza dell’RNA (RNAi), per cui le molecole di RNA a doppio filamento degradano l’mRNA prima della traduzione, interferendo così efficacemente con l’espressione delle proteine. La dissezione di questo meccanismo e la sua successiva imitazione sperimentale è stata una manna per coloro che sono interessati a manipolare la funzione dei geni.
In definitiva, i risultati di questo tipo di studi hanno una rilevanza fondamentale, dalla comprensione di base della normale funzione cellulare, come la differenziazione, la crescita e la divisione delle cellule, per informare approcci radicalmente nuovi per il trattamento delle malattie. Infatti, alcune malattie umane possono derivare semplicemente da un difetto nella struttura tridimensionale di una proteina. Attraverso lo studio dell’espressione genica e delle proteine, è facile vedere come minuscoli cambiamenti a livello molecolare abbiano un impatto riverberante.
Immagine: Biblioteca di algoritmi biochimici.