À travers une lentille de biologie cellulaire, l’étude de l’expression génétique est étroitement liée à notre compréhension des protéines. Depuis les premiers travaux de Christian Anfinsen dans les années 1950, nous savons que la séquence des acides aminés dans une protéine détermine sa structure tridimensionnelle finale. À partir de là, les scientifiques ont observé à plusieurs reprises que la structure d’une protéine dictait l’endroit où elle allait agir et ce qu’elle allait faire. Cela n’a jamais été aussi évident que dans le cas de la fonction des enzymes. La forme et la structure des protéines constituent un aspect crucial de la biologie de l’expression génétique et relient notre compréhension de l’expression génétique à la biologie de la cellule. Bien qu’elle concerne principalement les molécules protéiques qui agissent sur les séquences d’ADN et d’ARN, telles que les facteurs de transcription et les histones, l’étude de l’expression génique se concentre également sur l’endroit de la cellule où l’expression est modulée. En fait, la modulation de l’expression des gènes peut se produire dans le noyau, le cytoplasme, ou même à la membrane cellulaire en raison de l’impact des protéines sur l’ARN dans ces sous-régions cellulaires.
Comment les scientifiques étudient-ils la forme et la fonction des protéines ? Une technique appelée spectrométrie de masse permet aux scientifiques de séquencer les acides aminés d’une protéine. Une fois la séquence connue, la comparaison de sa séquence d’acides aminés avec des bases de données permet aux scientifiques de découvrir s’il existe des protéines apparentées dont la fonction est déjà connue. Souvent, des séquences d’acides aminés similaires auront des fonctions similaires dans une cellule. La séquence d’acides aminés permet également aux scientifiques de prédire la charge de la molécule, sa taille et sa structure tridimensionnelle probable. La charge et la taille peuvent ensuite être confirmées expérimentalement (par SDS-PAGE et gels à double dimension). Pour déduire les subtilités de la structure tridimensionnelle, les scientifiques essaieront de cristalliser la protéine pour confirmer sa structure moléculaire par cristallographie aux rayons X et/ou par spectroscopie de résonance magnétique nucléaire (pNMR).
Comment les scientifiques étudient-ils l’impact des protéines sur les gènes ou d’autres protéines ? Une bonne façon d’étudier la fonction de la protéine est de voir ce qui se passe dans la cellule lorsque la protéine n’est pas présente. Pour cela, les scientifiques utilisent des systèmes modèles, tels que des cultures cellulaires ou des organismes entiers, dans lesquels ils peuvent tester la fonction de protéines ou de gènes spécifiques en les modifiant ou en les faisant muter. Le niveau d’expression d’un gène peut être calculé en mesurant l’ARNm transcrit (Northern Blot), la protéine exprimée (Western Blot), ou en colorant directement la protéine ou l’ARNm lorsqu’il est encore dans la cellule. De nouvelles techniques ont changé la façon dont nous étudions l’expression des gènes – les microréseaux d’ADN, l’analyse en série de l’expression des gènes (SAGE) et le séquençage à haut débit permettent des criblages plus importants de plusieurs molécules simultanément et ouvrent la voie à des questions nouvelles et plus vastes. Pour analyser de grands ensembles de données et voir comment les réseaux de molécules interagissent, une nouvelle discipline appelée biologie des systèmes fournit le cadre pour ces compréhensions plus larges et plus intégrées des réseaux de régulation.
Fait intéressant, les protéines ne sont pas les seuls régulateurs de gènes. Les molécules régulatrices se présentent sous la forme d’ARN et agissent sur d’autres acides nucléiques en les modifiant ou en les perturbant. Un exemple est la famille des riboswitches, des molécules d’acide ribonucléique qui forment des structures tridimensionnelles qui stoppent ou interfèrent avec la transcription, sous réserve d’un signal externe approprié. Un autre exemple d’ARN agissant sur d’autres ARN est le mécanisme d’interférence ARN (ARNi), par lequel des molécules d’ARN double brin dégradent l’ARNm avant la traduction, interférant ainsi efficacement avec l’expression des protéines. La dissection de ce mécanisme et son imitation expérimentale ultérieure ont été une aubaine pour ceux qui s’intéressent à la manipulation de la fonction des gènes.
En fin de compte, les résultats de ce type d’études sont d’une importance fondamentale, qu’il s’agisse de la compréhension de base du fonctionnement normal des cellules, comme la différenciation, la croissance et la division cellulaires, ou de l’élaboration d’approches radicalement nouvelles pour le traitement des maladies. En fait, certaines maladies humaines peuvent découler simplement d’un défaut dans la structure tridimensionnelle d’une protéine. Grâce à l’étude de l’expression des gènes et des protéines, il est facile de voir comment des changements infimes au niveau moléculaire ont un impact réverbérant.
Image : Bibliothèque des algorithmes biochimiques.