Med en cellebiologisk optik er studiet af genekspression tæt forbundet med vores forståelse af proteiner. Siden Christian Anfinsens tidlige arbejde i 1950’erne har vi vidst, at sekvensen af aminosyrer i et protein bestemmer dets endelige tredimensionelle struktur. I forlængelse heraf har forskerne gentagne gange observeret, at proteinets struktur dikterer, hvor det vil virke, og hvad det vil gøre. Intet sted har dette været mere tydeligt end i forbindelse med enzymernes funktion. Proteinernes form og struktur er et afgørende aspekt af genekspressionsbiologien og forbinder vores forståelse af genekspression med cellens biologi. Selv om vi primært beskæftiger os med proteinmolekyler, der virker på DNA- og RNA-sekvenser, f.eks. transkriptionsfaktorer og histoner, fokuserer studiet af genekspression også på, hvor i cellen ekspressionen moduleres. Faktisk kan modulering af genekspressionen ske i kernen, cytoplasmaet eller endog ved cellemembranen på grund af proteiners indvirkning på RNA i disse cellulære underområder.
Hvordan studerer forskerne proteiners form og funktion? En teknik kaldet massespektrometri gør det muligt for forskere at sekventere aminosyrerne i et protein. Når en sekvens er kendt, kan forskerne ved at sammenligne dens aminosyresekvens med databaser finde ud af, om der findes beslægtede proteiner, hvis funktion allerede er kendt. Ofte vil lignende aminosyresekvenser have lignende funktioner i en celle. Aminosyresekvensen giver også forskerne mulighed for at forudsige molekylets ladning, dets størrelse og dets sandsynlige tredimensionelle struktur. Ladningen og størrelsen kan senere bekræftes eksperimentelt (via SDS-PAGE og dobbeltdimensionelle geler). For at udlede de indviklede detaljer i den tredimensionelle struktur vil forskerne forsøge at krystallisere proteinet for at bekræfte dets molekylære struktur ved hjælp af røntgenkrystallografi og/eller kernemagnetisk resonansspektroskopi (pNMR).
Hvordan undersøger forskerne proteiners indvirkning på gener eller andre proteiner? En god måde at undersøge proteinets funktion på er at se, hvad der sker i cellen, når proteinet ikke er til stede. Til dette formål bruger forskerne modelsystemer, f.eks. cellekulturer eller hele organismer, hvor de kan teste funktionen af specifikke proteiner eller gener ved at ændre eller mutere dem. Ekspressionsniveauet for et gen kan beregnes ved at måle det transskriberede mRNA (Northern Blot), det udtrykte protein (Western Blot) eller ved direkte farvning af proteinet eller mRNA’et, når det stadig befinder sig i cellen. Nye teknikker har ændret den måde, vi studerer genekspression på – DNA-mikroarrays, seriel analyse af genekspression (SAGE) og sekventering med højt gennemløb giver mulighed for større screeninger af flere molekyler på samme tid og har åbnet mulighed for nye og bredere former for spørgsmål. For at analysere store datasæt og se, hvordan netværk af molekyler interagerer, giver en ny disciplin kaldet systembiologi rammerne for disse større og mere integrerede forståelser af reguleringsnetværk.
Interessant nok er proteiner ikke de eneste genregulatorer. Regulerende molekyler kommer i form af RNA og virker på andre nukleinsyrer ved at ændre eller forstyrre dem. Et eksempel er familien af riboswitches, ribonukleinsyremolekyler, der danner tredimensionelle strukturer, som standser eller forstyrrer transkriptionen, hvis de får det rette eksterne signal. Et andet eksempel på RNA, der virker på andet RNA, er mekanismen RNA-interferens (RNAi), hvorved dobbeltstrengede RNA-molekyler nedbryder mRNA før translation og dermed effektivt forstyrrer proteinekspressionen. Dissektionen af denne mekanisme og dens efterfølgende eksperimentelle efterligning har været en velsignelse for dem, der er interesseret i at manipulere genfunktionen.
I sidste ende har resultaterne af denne type undersøgelser grundlæggende relevans, lige fra den grundlæggende forståelse af normal cellefunktion som f.eks. celledifferentiering, vækst og deling til information om radikalt nye metoder til behandling af sygdomme. Faktisk kan nogle sygdomme hos mennesker opstå blot på grund af en defekt i et proteins tredimensionelle struktur. Gennem studiet af genekspression og proteiner er det let at se, hvordan små ændringer på molekylært niveau har en efterklangsvirkning.
Billede: Biochemical Algorithms Library.