Por meio de uma lente de biologia celular, o estudo da expressão gênica está intimamente ligado à nossa compreensão das proteínas. Desde o trabalho inicial de Christian Anfinsen nos anos 50, sabemos que a seqüência de aminoácidos em uma proteína determina sua estrutura tridimensional final. A partir daí, os cientistas têm observado repetidamente que a estrutura da proteína dita onde ela vai agir e o que ela vai fazer. Em nenhum lugar isso foi mais óbvio do que com a função das enzimas. A forma e a estrutura das proteínas é um aspecto crucial da biologia da expressão gênica e liga nossa compreensão da expressão gênica à biologia da célula. Enquanto que o estudo das moléculas proteicas que atuam nas seqüências de DNA e RNA, tais como fatores de transcrição e histórias, o estudo da expressão gênica também se concentra em onde na expressão celular é modulada. Na verdade, a modulação da expressão gênica pode ocorrer no núcleo, no citoplasma, ou mesmo na membrana celular devido ao impacto das proteínas no RNA nessas sub-regiões celulares.
Como os cientistas estudam a forma e função das proteínas? Uma técnica chamada espectroscopia de massa permite aos cientistas sequenciar os aminoácidos em uma proteína. Depois que uma seqüência é conhecida, comparar sua seqüência de aminoácidos com bancos de dados permite aos cientistas descobrir se há proteínas relacionadas cuja função já é conhecida. Muitas vezes seqüências de aminoácidos similares terão funções similares dentro de uma célula. A sequência de aminoácidos também permite aos cientistas prever a carga da molécula, o seu tamanho e a sua provável estrutura tridimensional. A carga e o tamanho podem ser posteriormente confirmados experimentalmente (via SDS-PAGE e géis bidimensionais). Para deduzir as complexidades da estrutura tridimensional, os cientistas tentarão cristalizar a proteína para confirmar sua estrutura molecular através da cristalografia de raios X e/ou espectroscopia de ressonância magnética nuclear (pNMR).
Como os cientistas estudam o impacto das proteínas nos genes ou outras proteínas? Uma boa maneira de estudar a função da proteína é ver o que acontece na célula quando a proteína não está presente. Para isso, os cientistas utilizam sistemas modelo, como a cultura celular ou organismos inteiros, onde podem testar a função de proteínas ou genes específicos, modificando-os ou mutando-os. O nível de expressão de um gene pode ser calculado medindo o mRNA transcrito (Western Blot), a proteína expressa (Western Blot), ou manchando diretamente a proteína ou mRNA quando ela ainda está na célula. Novas técnicas mudaram a forma como estudamos a expressão gênica – microarrays de DNA, análise serial da expressão gênica (SAGE), e sequenciamento de alto rendimento permitem telas maiores de múltiplas moléculas simultaneamente e abriram a possibilidade de novos e mais amplos tipos de questões. Para analisar grandes conjuntos de dados e ver como as redes de moléculas interagem, uma nova disciplina chamada biologia de sistemas fornece a estrutura para estes entendimentos maiores e mais integrados das redes reguladoras.
Interessantemente, as proteínas não são os únicos reguladores genéticos. As moléculas reguladoras vêm na forma de RNA e atuam em outros ácidos nucléicos, mudando ou interrompendo-os. Um exemplo é a família de riboswitches, moléculas de ácido ribonucleico que formam estruturas tridimensionais que param ou interferem com a transcrição, dado o sinal externo adequado. Outro exemplo de RNA agindo em outro RNA é o mecanismo de interferência de RNA (RNAi), onde moléculas de RNA de cadeia dupla degradam mRNA antes da tradução, assim efetivamente interferindo com expressão de proteína. A dissecção deste mecanismo e sua posterior imitação experimental tem sido uma bênção para aqueles interessados em manipular a função gênica.
Ultimamente, os resultados deste tipo de estudos têm relevância fundamental, desde o entendimento básico da função celular normal, como diferenciação, crescimento e divisão celular, até informar radicalmente novas abordagens para o tratamento de doenças. Na verdade, algumas doenças humanas podem surgir simplesmente de um defeito na estrutura tridimensional de uma proteína. Através do estudo da expressão gênica e das proteínas, é fácil ver como mudanças minúsculas no nível molecular têm um impacto reverberante.
Image: Biblioteca de Algoritmos Bioquímicos.