A través de la lente de la biología celular, el estudio de la expresión génica está estrechamente vinculado a nuestra comprensión de las proteínas. Desde los primeros trabajos de Christian Anfinsen en la década de 1950, sabemos que la secuencia de aminoácidos de una proteína determina su estructura tridimensional final. A partir de ahí, los científicos han observado repetidamente que la estructura de la proteína dicta dónde actuará y qué hará. En ninguna parte ha sido esto más evidente que en la función de las enzimas. La forma y la estructura de las proteínas es un aspecto crucial de la biología de la expresión génica y vincula nuestra comprensión de la expresión génica con la biología de la célula. Aunque se ocupa principalmente de las moléculas proteicas que actúan sobre las secuencias de ADN y ARN, como los factores de transcripción y las histonas, el estudio de la expresión génica también se centra en el lugar de la célula donde se modula la expresión. De hecho, la modulación de la expresión génica puede producirse en el núcleo, el citoplasma o incluso en la membrana celular debido al impacto de las proteínas sobre el ARN en esas subregiones celulares.
¿Cómo estudian los científicos la forma y la función de las proteínas? Una técnica llamada espectrometría de masas permite a los científicos secuenciar los aminoácidos de una proteína. Una vez conocida una secuencia, la comparación de su secuencia de aminoácidos con las bases de datos permite a los científicos descubrir si existen proteínas relacionadas cuya función ya se conoce. A menudo, secuencias de aminoácidos similares tendrán funciones similares dentro de una célula. La secuencia de aminoácidos también permite a los científicos predecir la carga de la molécula, su tamaño y su probable estructura tridimensional. La carga y el tamaño pueden confirmarse posteriormente de forma experimental (mediante SDS-PAGE y geles de doble dimensión). Para deducir los entresijos de la estructura tridimensional, los científicos intentarán cristalizar la proteína para confirmar su estructura molecular mediante cristalografía de rayos X y/o espectroscopia de resonancia magnética nuclear (pNMR).
¿Cómo estudian los científicos el impacto de las proteínas en los genes u otras proteínas? Una buena forma de estudiar la función de la proteína es ver qué ocurre en la célula cuando la proteína no está presente. Para ello, los científicos utilizan sistemas modelo, como los cultivos celulares o los organismos completos, en los que pueden probar la función de proteínas o genes específicos modificándolos o mutándolos. El nivel de expresión de un gen puede calcularse midiendo el ARNm transcrito (northern blot), la proteína expresada (Western Blot) o tiñendo directamente la proteína o el ARNm cuando aún está en la célula. Las nuevas técnicas han cambiado la forma de estudiar la expresión de los genes: los microarrays de ADN, el análisis en serie de la expresión de los genes (SAGE) y la secuenciación de alto rendimiento permiten realizar grandes análisis de múltiples moléculas simultáneamente y han abierto la posibilidad de plantear nuevos y más amplios tipos de preguntas. Para analizar grandes conjuntos de datos y ver cómo interactúan las redes de moléculas, una nueva disciplina llamada biología de sistemas proporciona el marco para esta comprensión más amplia e integrada de las redes reguladoras.
Es interesante que las proteínas no sean los únicos reguladores de los genes. Las moléculas reguladoras se presentan en forma de ARN y actúan sobre otros ácidos nucleicos modificándolos o alterándolos. Un ejemplo es la familia de los riboswitches, moléculas de ácido ribonucleico que forman estructuras tridimensionales que detienen o interfieren en la transcripción, dada la señal externa adecuada. Otro ejemplo de ARN que actúa sobre otro ARN es el mecanismo del ARN de interferencia (ARNi), por el que las moléculas de ARN de doble cadena degradan el ARNm antes de su traducción, interfiriendo así de forma efectiva en la expresión de las proteínas. La disección de este mecanismo y su posterior imitación experimental ha sido una gran ayuda para los interesados en manipular la función de los genes.
En definitiva, los resultados de este tipo de estudios tienen una relevancia fundamental, desde la comprensión básica de la función celular normal, como la diferenciación, el crecimiento y la división de las células, hasta la información de enfoques radicalmente nuevos para el tratamiento de enfermedades. De hecho, algunas enfermedades humanas pueden surgir simplemente de un defecto en la estructura tridimensional de una proteína. A través del estudio de la expresión de los genes y las proteínas, es fácil ver cómo cambios minúsculos a nivel molecular tienen un impacto reverberante.
Imagen: Biblioteca de algoritmos bioquímicos.