[Kokoteksti] Eksomin sekvensointi: mitä lääkäreiden on tiedettävä | AGG

Esittely

Lukuisten sairauksien taustalla on geneettinen perusta. Jotkin niistä ovat seurausta tietyn proteiinin puuttumisesta tai toimintahäiriöstä, joka johtuu koodaavan geenin mutaatioista. Näin on Mendelin periytyvissä sairauksissa, kuten Huntingtonin taudissa, talassemiassa ja noin tuhannessa muussa harvinaisessa perinnöllisessä sairaudessa.1 Monilla sairauksilla on geneettinen perusta, vaikka ne eivät johtuisikaan yksinomaan yksittäisen geenin mutaatiosta, ja yhä useammat geneettiset variantit ja polymorfismit tunnistetaan monitahoisten sairauksien riskitekijöiksi.2 Syöpä on geneettinen sairaus, joka johtuu yhden tai useamman geenin mutaatiosta, jotka joko lisäävät syövän riskiä (kuten sukulinjamutaatiot), edistävät syöpää (onkogeenit) tai heikentävät solujen lisääntymistä sääteleviä solumekanismeja (suppressorigeenit), kuten somaattisten mutaatioiden kohdalla tapahtuu.3

Tautien geneettisen perustan tunnistaminen on ollut muutama vuosi sitten asti työläs ja haastava projekti. Nämä hankkeet alkoivat usein siten, että geneettisten assosiaatiotutkimusten avulla tunnistettiin perimän alue, joka mahdollisesti osallistuu taudin siirtymiseen.1 Sellainen perimän alue, jolla on suuri yhteys taudin siirtymiseen, voidaan yleensä määritellä analysoimalla suuria perheitä, joissa on useita sairastuneita jäseniä. Yleensä tämä alue sisältää useita geenejä, jotka on sekvensoitava, jotta voidaan tunnistaa geenimutaatio, jota esiintyy kaikilla sairastuneilla henkilöillä eikä heidän terveillä sukulaisillaan, jos kyseessä on dominoiva periytyminen. Jos kyseessä on resessiivinen periytyminen, mutaation pitäisi esiintyä sairastuneiden jäsenten molemmissa alleeleissa ja sairastumattomien sukulaisten yhdessä alleelissa tai ei missään niistä.

Geenisairauksien diagnosointi oli, ja useimmissa tapauksissa on edelleen, yhtä työlästä. Parhaassa tapauksessa sairaus voi saada alkunsa mutaatiosta vain yhdessä geenissä. Diagnoosi edellyttäisi vain tuon geenin nukleotidisekvenssin määrittämistä. Tyypillisesti geeni monistetaan useina fragmentteina polymeraasiketjureaktioilla, ja kunkin fragmentin nukleotidisekvenssi määritetään. Usein tauti voi johtua mutaatioista missä tahansa useista geeneistä, ja kaikki ne on monistettava ja sekvensoitava, jotta voidaan selvittää taudin geneettinen alkuperä sairastuneilla potilailla. Esimerkiksi dyskeratosis congenita -taudissa mutaatioita voi löytyä mistä tahansa dkc-, tert-, terc-, NOP10-, NH2- tai TINF2-geenistä, ja tautia aiheuttavien geenien määrä voi olla vieläkin suurempi, koska on olemassa osa potilaista, joilla taudin aiheuttavaa mutaatiota ei ole tunnistettu.4,5 Kunkin potilaan molekyylidiagnoosia varten on määritettävä kaikkien näiden geenien nukleotidisekvenssi. Eri syöpätyypeissä esiintyy useita mutatoituneita geenejä.3 Molekyylidiagnoosi edellyttää useiden näiden geenien nukleotidisekvenssin määrittämistä. Tällä hetkellä tämä on työläs ja kallis prosessi, jota ei voida käyttää suureen potilasjoukkoon. Käytännössä diagnoosia ja hoitoa varten sekvensoidaan vain muutamia geenejä, jotka ovat mutatoituneet merkittävällä osalla joidenkin syöpätyyppien potilaista.

Vain viime vuosina on kehitetty tekniikoita useiden sekvenssivarianttien samanaikaiseen havaitsemiseen tietystä näytteestä. Monet niistä perustuvat deoksiribonukleiinihapon (DNA) mikrosirutekniikkaan. Genotyypin määritysmatriiseissa oligonukleotidit, jotka sisältävät tiettyyn tautiin liittyviä aktiivisesti tunnistettuja mutaatioita, sijoitetaan objektilasille. Potilaan DNA-näyte lisätään dian päälle ja hybridisoivat oligonukleotidit tunnistetaan. Miljoonia tunnettuja mutaatioita voidaan testata yhdellä mikrosiruhybridisaatiolla.6 Kopiolukuvariaatioita voidaan analysoida myös DNA-mikrosarjoilla, jotka on suunniteltu havaitsemaan sellaisten DNA-alueiden esiintyminen, jotka ovat monistuneet tai poistuneet potilaan DNA:ssa.7 Näitä tekniikoita käytetään usein lääketieteellisessä tutkimuksessa ja kliinisessä diagnostiikassa.8

Merkittävä edistysaskel molekyylilääketieteessä on kuitenkin viime aikoina ollut sellaisten massiivisten sekvensointitekniikoiden kehittäminen, joiden avulla potilaan DNA:n nukleotidisekvenssi voidaan määrittää lyhyessä ajassa ja kohtuulliseen hintaan.9,10 Näitä menetelmiä on käytetty vuodesta 2005 lähtien, ja ne perustuvat miljoonien DNA-fragmenttien nukleotidisekvenssin samanaikaiseen määrittämiseen. Niitä on kutsuttu toisen sukupolven sekvensoinniksi, seuraavan sukupolven sekvensoinniksi, syväsekvensoinniksi tai massiivisesti rinnakkaiseksi sekvensoinniksi. Näillä laitteilla määritetään tuhansia miljoonia nukleotidisekvenssejä enintään kahdessa viikossa. Esimerkkinä näiden uusien sekvensointijärjestelmien kapasiteetista mainittakoon, että ensimmäisen ihmisen genomin sekvensointi, joka julkaistiin vuonna 200111 , vaati 23 laboratorion koordinoitua työtä, joka kesti 13 vuotta ja jonka kokonaiskustannukset olivat noin 3 miljardia Yhdysvaltain dollaria. Uusilla menetelmillä ihmisen genomin sekvensointi vie yhden laboratorion ja noin kaksi viikkoa, ja kustannukset ovat arviolta 4000 Yhdysvaltain dollaria.

Nykyaikaisten sekvensointimenetelmien saatavuus lisää räjähdysmäisesti tietämystämme ihmisen genomista, yksilöiden välisestä vaihtelusta ja sairauksiin liittyvien geneettisten varianttien tunnistamisesta. Nämä menetelmät ovat esimerkiksi perustana meneillään olevalle 1000 genomia -hankkeelle12 , jonka tavoitteena on määrittää noin tuhannen eri maantieteellistä ja etnistä alkuperää olevan henkilön täydellinen nukleotidisekvenssi, jotta voidaan määrittää keskimääräinen sekvenssivaihtelu yksilöiden välillä ja tunnistaa yleisimmät polymorfismit.

Massiiviset sekvensointitekniikat kehittyvät tällä hetkellä nopeaa vauhtia. Pienempiä ja nopeampia koneita kehitetään ja uusia sekvensointimenetelmiä otetaan käyttöön. Tärkeä tavoite on esimerkiksi sekvensoida yksittäinen DNA-molekyyli yksittäisestä solusta.13,14 Teknisten haasteiden lisäksi edistysaskeleet laskevat jatkuvasti DNA:n sekvensoinnin hintaa niin, että tavoite yksittäisen ihmisen genomin sekvensoinnista tuhannella Yhdysvaltain dollarilla näyttäisi olevan saavutettavissa muutaman vuoden kuluessa. Tällä hetkellä koko ihmisen genomin sekvensointi ja kaikkien tuotettujen sekvenssitietojen analysointi on monimutkaista, kallista ja aikaa vievää, ja monet tutkimukset tehdään pienemmällä osalla genomia. Erityisesti genomin proteiineja koodaavan alueen, niin sanotun eksomin, sekvensointiin kiinnitetään tällä hetkellä paljon huomiota. Eksomin sekvensointi on huomattavasti edullisempaa kuin koko genomin sekvensointi, ja tässä katsauksessa käsitellään tämän tekniikan mahdollisuuksia, etuja ja rajoituksia.

Mikä on eksomi?

Lähes kaikilla ihmisen proteiineja koodaavilla geeneillä on epäjatkuva rakenne. Proteiinia koodaava alue on pirstoutunut useisiin osiin, joita kutsutaan eksoneiksi. Eksonit ovat yhteydessä toisiinsa ei-proteiinia koodaavien DNA-fragmenttien eli intronien avulla, kuten kaaviomaisesti on esitetty kuvassa 1. Geenit transkriboituvat promoottorialueelta useiden säätelyalueiden valvonnassa, jotka sijaitsevat eri paikoissa suhteessa geeniin, ylävirtaan, alavirtaan tai jopa geenin sisällä. Transkriptio luo ensisijaisen transkriptin, joka sisältää eksoneja ja introneja. Myöhemmät ribonukleiinihapon (RNA) splikointiprosessit poistavat intronit ja yhdistävät eksonit tuottaakseen kypsän lähetti- RNA:n (mRNA), joka sisältää vain yhden jatkuvan proteiinia koodaavan alueen. Viimeaikaiset tutkimukset osoittavat, että useimpien geenien primaariset transkriptit voidaan splikoida useilla eri tavoilla, jolloin syntyy erilaisia kypsiä mRNA:ita, jotka sisältävät tiettyjä eksonien yhdistelmiä, joita kutsutaan vaihtoehtoisiksi splikointivaihtoehdoiksi (kuva 1). Nämä mRNA:t koodaavat proteiini-isomuotoja, joilla on joitakin yhteisiä alueita, mutta jotka myös eroavat toisista riippuen sisällytetyistä eksoneista.15

Ihmisen genomin analyysi on osoittanut, että proteiineja koodaavat geenit edustavat vain pientä osaa DNA:sta, vain noin 3 %.16 Eksonit edustavat vieläkin pienempää osaa, 1 %:a genomista.16 Yhteenveto näistä tiedoista on esitetty taulukossa 1. Ihmisen genomi koostuu 3,3 × 109 emäsparista (bp) ja sisältää 20 078 proteiineja koodaavaa geeniä.17 Kukin geeni jakautuu keskimäärin kahdeksaan eksoniin, joista kukin on noin 170 bp pitkä. Kokonaisuudessaan kaikki eksonit sisältävät noin 3 ×107 bp. Kaikkien eksonien sekvensoinnilla saadaan kuitenkin samat tiedot koodattujen proteiinien aminohapposekvenssistä kuin koko genomin sekvensoinnilla, lukuun ottamatta mRNA:n splikointia muuttavia mutaatioita, joita käsitellään kohdassa Eksomin sekvensointi ja tietojen analysointi. Tätä järjestelmää, jossa kaikki eksonit sekvensoidaan, on kutsuttu eksomisekvensoinniksi, ja siitä on tullut pätevä menetelmä kaikkien ihmisproteiinien aminohapposekvenssin variaatioiden havaitsemiseksi18 . Hyvin huomattava kokoero tekee eksomisekvensoinnista paljon halvempaa kuin genomisekvensoinnista, mikä helpottaa tuotetun sekvenssidatan laskennallista ja funktionaalista analysointia.

Kuva 1 Kaavamainen esitys geenien rakenteesta ja ilmentymisestä.
Huom: Proteiineja koodaavat geenit koostuvat eksoneista, jotka sisältävät proteiineja koodaavaa tietoa (laatikot) ja jotka on erotettu toisistaan ei-koodaavilla introneilla (viivat). Harmaat laatikot kuvaavat eksonien proteiinia koodaavia alueita ja valkoiset laatikot mRNA:n 5′ ja 3′ kääntämättömiä alueita. Geenit transkriboituvat promoottorialueilta, jotka ovat välittömästi eksoni 1:n yläpuolella. Transkription aloituskohta on merkitty nuolella. Geenin ilmentymistä ohjataan useilla TR-alueilla, jotka voivat sijaita geenin ylä- tai alapuolella, vaihtelevalla etäisyydellä tai geenin sisällä (useimmiten introneissa). MRNA:n stabiilisuutta ja translaatiota voidaan säädellä mikroRNA:n sitoutumisella tiettyihin kohtiin 3′-transloimattomalla alueella (merkitty tähdillä). Geenit transkriboituvat primääriseksi RNA:ksi, joka sisältää introneja ja eksoneja. Myöhemmät splikointiprosessit poistavat intronit, jolloin syntyy kypsiä mRNA:ita. Vaihtoehtoiset splikointiprosessit voivat synnyttää erilaisia mRNA:ita riippuen niiden sisältämistä eksoneista (mRNA1, mRNA2), jotka koodaavat eri proteiini-isomuotoja.
Lyhenteet: TR, transkription säätelyalue; RNA, ribonukleiinihappo; mRNA, lähetti-ribonukleiinihappo.

Taulukko 1 Ihmisen genomin ja eksomin yleispiirteet

Exomin talteenottotekniikat

Ensimmäisenä ja kriittisimpänä askeleena eksomisekvensoinnissa on eksonien eristäminen eli talteenotto. Käytetyt menetelmät perustuvat DNA:n hybridisaatioon. Ihmisen genomin analysointi on mahdollistanut kaikkien geenien eksonien tunnistamisen, ja se helpottaa kullekin eksonille spesifisten oligonukleotidikoettimien suunnittelua. Koettimia käytetään eksonien puhdistamiseen DNA:sta.19 DNA:n pirstominen enintään 500 bp:n palasiksi on ensimmäinen vaihe. Tämän jälkeen DNA hybridisoidaan eksonispesifisiin oligonukleotidikoettimiin ja hybridisoidut fragmentit puhdistetaan. Hybridisointi voidaan suorittaa nestefaasissa. Tällöin oligonukleotidit leimataan, jotta DNA-oligonukleotidikompleksit voidaan erottaa hybridisoitumattoman DNA:n massasta. Yleisessä esimerkissä oligonukleotidit sidotaan kovalenttisesti biotiiniin, jotta DNA-oligonukleotidihybridit voidaan eristää käyttämällä biotiinia sitovaa molekyyliä, streptavidiinia, joka on kytketty magneettihelmiin. DNA-fragmentit, jotka eivät sisällä eksoneja, eivät sitoudu streptavidiinihelmiin, ja ne voidaan poistaa tehokkaasti useiden pesuvaiheiden jälkeen. Eksoneja sisältävät, helmiin sitoutuneet fragmentit voidaan ottaa talteen DNA-oligonukleotidihybridien dissosioitumisen jälkeen alhaisen ionivahvuuden olosuhteissa.

Eksonit voidaan eristää myös hybridisoimalla kiinteälle alustalle, johon eksonispesifiset oligonukleotidit on täplikäsitelty, kuten DNA-mikrosarjojen kanssa. Tällöin fragmentoitu DNA levitetään oligonukleotidien päälle hybridisaation mahdollistamiseksi. Myöhemmin hybridisoitumaton DNA pestään pois ja eksonirikastettu DNA eluoidaan matalaionisissa olosuhteissa.

Vaihtelevat kaupalliset toimittajat tarjoavat paketteja nestemäisen faasin hybridisaatioprotokollia käyttävään eksomin eristämiseen, mukaan lukien Agilent Technologies (Santa Clara, CA, USA), Roche NimbelGen, Inc. (Madison, WI, Yhdysvallat), Illumina, Inc. (San Diego, CA, Yhdysvallat) ja Life Technologies (Carlsbad, CA, Yhdysvallat). Näillä sarjoilla voidaan eristää yli 90 prosenttia genomissa olevista eksoneista yli 90 prosentin spesifisyydellä, ja hinta on noin 150 Yhdysvaltain dollaria eksomia kohti. Useat kirjoittajat ovat vertailleet näitä eksomin talteenottoalustoja,20-22 ja Clark ym.22 saamat tiedot, joissa verrataan SureSelect Human All Exon 50 Mb (Agilent Technologies), Roche NimbleGen, Inc:n SeqCap EZ Exome Library v2.0 ja Illumina, Inc:n TruSeq Exome Enrichment -paketteja, on esitetty taulukossa 2. Taulukossa 2 esitetään yhteenveto. Jotkin sarjoista kattavat proteiineja koodaavien alueiden lisäksi mRNA:n translaatiota vailla olevat alueet, mikä mahdollistaa säätelyalueiden, kuten mikroRNA:n (miRNA) sitoutumiskohtien, analysoinnin. Lisäksi useimmat sarjat kattavat jopa 80 prosenttia miRNA:ta koodaavista alueista.21 Nämä ja muut toimittajat ovat viime aikoina kehittäneet parempia sarjoja, joten taulukossa 2 esitettyjä tietoja olisi pidettävä vain ohjeellisina. On tärkeää huomata, että eksonipuhdistus on kriittinen vaihe. Eksonien 100-prosenttinen talteenotto on vaikeaa, ja eksonit ovat usein kadonneet tai aliedustettuina eristetyssä eksomissa. Jos esimerkiksi potilaan eksomi analysoidaan ja 10 prosenttia eksoneista häviää puhdistuksen aikana, todennäköisyys sille, että merkityksellinen mutaatio puuttuu, on noin 10 prosenttia tämän teknisen virheen vuoksi. Siksi erittäin tehokkaiden eksonien talteenottomenetelmien käyttö on ratkaisevan tärkeää eksomisekvensoinnissa.

Taulukko 2 Kolmen tärkeimmän eksomin talteenottoalustan vertailu
Huomautukset: aEnsemble81- ja RefSeq82-tietokantojen vertailu; bvalittujen alueiden prosentuaalinen osuus, jotka kumpikin alusta on sekvensoinut vähintään kymmenen kertaa sen jälkeen, kun on analysoinut 80:n megan lukeman DNA-sekvenssin. Agilent Technologies (Santa Clara, CA, USA); Roche NimbelGen, Inc. (Madison, WI, Yhdysvallat); Illumina, Inc. (San Diego, CA, USA).
Lyhenteet: mRNA, messenger ribonukleiinihappo; miRNA, mikroribonukleiinihappo; DNA, deoksiribonukleiinihappo.

Exomin sekvensointi ja data-analyysi

Exonien sisältämät pätkät sekvensoidaan millä tahansa tällä hetkellä saatavilla olevilla massiivisilla sekvensointilaitteisto-järjestelmillä tai tekniikoilla. Kuten johdannossa mainittiin, näillä alustoilla määritetään miljoonien DNA-fragmenttien nukleotidisekvenssi samanaikaisesti. Kunkin fragmentin määritetyn sekvenssin pituus eksomisekvensoinnissa ei ole pitkä, tyypillisesti 35 bp:n ja 100 bp:n välillä. Koska DNA kuitenkin pirstoutui alun perin satunnaisesti, kukin yksittäinen nukleotidi esiintyy monissa päällekkäisissä fragmenteissa. Jos siis saadaan riittävän suuri määrä sekvenssejä, vaikka ne olisivat lyhyitäkin, jokainen emäs sekvensoidaan itsenäisesti useista DNA-fragmenteista. Kunkin emäksen sekvensointikertojen määrää kutsutaan kattavuudeksi tai sekvensointisyvyydeksi. Kattavuus on suoraan yhteydessä tuotetun nukleotidisekvenssin laatuun ja luotettavuuteen. Yleisesti ottaen 20×-30×:n kattavuutta pidetään välttämättömänä luotettavien tulosten saamiseksi eksomisekvensoinnissa.59 Tämä sekvensointisyvyys tarkoittaa, että mahdollinen sekvenssivaihtelu olisi sekvensoitu itsenäisesti 20-30 eri DNA-fragmentista.

Datan analysointi on viimeinen vaihe eksomisekvensointihankkeissa (kuva 2). Kuten edellä mainittiin, tietoja tuotetaan miljoonista sekvensseistä, ja niiden analysointi vaatii erityisiä ja monimutkaisia tietokoneohjelmia ja asiantuntemusta.19,23 Alustava vaihe on tuotetun sekvenssin laadun analysointi. Sekvenssien lukutarkkuus eri sekvenssipituuksilla, lukujen keskimääräinen pituus sekä muut parametrit testataan. Jos laatu on riittävän hyvä, kutakin sekvenssiä verrataan referenssisekvenssiin, joka on yleensä ihmisen genomisekvenssin viimeinen saatavilla oleva versio. Tyypillisesti yli 80 prosenttia tuotetuista sekvensseistä voidaan sovittaa yhteen referenssigenomin kanssa.22 Tässä vaiheessa sallitaan pieni nukleotidivaihtelu referenssigenomiin nähden. Analyysin seuraava vaihe on tunnistaa sekvenssivaihtelut referenssisekvenssin ja tutkimuksessamme saadun eksomisekvenssin välillä. Näiden varianttien myöhemmät analyysit voisivat antaa haluttua tietoa tutkittavasta lääketieteellisestä ongelmasta.

Kuva 2 Eksomisekvensointidatan analyysi.
Huom: Eksomin eristämiseen, sekvensointiin ja datan analysointiin tarvittavat vaiheet on esitetty kaavamaisesti. Tämän prosessin avulla tunnistetaan geenivariantit, jotka ovat osallisina sairauksien synnyssä (ajurigeenit) tai jotka muuten liittyvät tautialttiuteen, evoluutioon tai lääkevasteeseen. Nämä tiedot tarjoavat arvokasta tietoa diagnoosia ja ennustetta, geneettistä neuvontaa ja yksilöllisten hoitojen suunnittelua varten.
Abbreviation: DNA, deoksiribonukleiinihappo.

Exomin sekvensoinnilla voidaan havaita useita erilaisia geneettisiä variaatioita. Yksi yleisimmin havaituista eroista on yhden nukleotidin vaihtuminen toiseen, esimerkiksi A:n vaihtuminen G:ksi (ATA-kodoni ATG:ksi). Näitä muunnoksia kutsutaan yhden nukleotidin muunnoksiksi (single nucleotide variants, SNV), vaikka niitä pidetäänkin yhden nukleotidin polymorfismeina (single nucleotide polymorphisms, SNP), kun niiden esiintymistiheys populaatiossa on yli 1-5 prosenttia eikä niillä ole vahvaa vaikutusta minkään sairauden riskiin. Useimmat SNV:t ovat hiljaisia eli synonyymejä, koska molemmat sekvenssivariantit koodaavat samaa aminohappoa (esimerkiksi GCA:n vaihtuminen GCC:ksi, koska molemmat ovat alaniinikoodoneja). Useimmat näistä polymorfismeista eivät merkitse mitään eroa koodatun proteiinin kannalta, ne eivät ole evolutiivisen valinnan kohteena, ja ne edustavat ihmisen eksomissa yleisimmin esiintyviä variaatioita. Poikkeuksena ovat eräät hiljaiset mutaatiot, jotka vaikuttavat spleikkausta sääteleviin signaaleihin tai jopa transkriptiota sääteleviin kohtiin ja muuttavat mRNA:n spleikkausta tai ilmentymistä, vaikka ne eivät muuta koodattuja aminohappoja. Muissa tapauksissa nukleotidimuutoksella on seurauksia koodattavassa proteiinissa, ja nämä ovat ei-hiljaisia tai ei-synonyymisiä variantteja. Nämä muutokset voivat johtaa koodatun aminohapon vaihteluun (esimerkiksi GAT GAG:ksi muuttaa asparagiinihapon glutamiinihapoksi), ja niitä kutsutaan missense-mutaatioiksi. Jyrkempiä muutoksia syntyy, kun nukleotidimuunnos luo translaation stop-kodonin (esimerkiksi TGC:stä TGA:ksi muuttuu kysteiinikodoni stop-kodoniksi), jota kutsutaan nonsense-mutaatioksi. On myös eräs SNV-tyyppi, joka voidaan havaita eksomisekvensoinnilla, vaikka se ei vaikuttaisikaan proteiinikodoneihin. Koska eksonit valitaan DNA:n satunnaisen pirstoutumisen jälkeen, ne voivat sisältää myös vierekkäisiä DNA-alueita, mukaan lukien viereisiä intronisekvenssejä ja jopa geenipromoottoreita, jos ei-transloidut alueet on otettu talteen.24 Intronialueet sisältävät säätelysignaaleja, joita tarvitaan mRNA:n splikointiin. Näillä alueilla olevat SNV:t voivat muuttaa splikointia eri tavoin.15 Vaikuttava introni voi esimerkiksi säilyä kypsässä mRNA:ssa tai vierekkäinen eksoni voi splikoitua pois (exon skipping). Nämä muutokset muuttavat kypsän mRNA:n nukleotidisekvenssiä ja siten SNV:n jälkeistä koodattua proteiinia.25 Eksomisekvensoinnilla voidaan myös havaita sekvenssivaihteluita, jotka johtuvat pienistä insertioista tai deletoinneista (indeleistä).22 Nämä vaihtelut voivat johtaa kehyssiirtymään, paitsi jos ne vaikuttavat kolmeen tai useampaan kuin kolmeen nukleotidiin. Tällöin syntyisi pieniä aminohappojen deletioita tai insertioita.

Syymutaatioiden tunnistaminen

Havaittujen sekvenssivarianttien toiminnallinen merkitys on määritettävä seuraavassa datan analysointivaiheessa. Vaikka kaikki ihmiset ovat geneettiseltä kannalta lähes identtisiä, nukleotidisekvenssierojen määrä yksilöiden välillä on huomattava.26 Tämä heterogeenisuus vaikeuttaa yksittäisissä sekvensointihankkeissa saatujen tietojen tulkintaa. Taulukossa 3 esitetään joitakin yleisiä tietoja yksittäisistä sekvenssivaihteluista. Kun tarkastellaan koko genomia, yksilöiden välisten sekvensserierojen määräksi on arvioitu 4 × 106 1000 Genomes Project -hankkeessa ja pienemmissä koko genomin sekvensointihankkeissa saatujen tietojen mukaan.27 Eksomeissa on pienempi mutta silti huomattava määrä sekvenssivariaatioita, joita on noin 20 000-25 000 kahden toisiinsa liittymättömän yksilön välillä.27,28 Suurin osa näistä geneettisistä variaatioista on piileviä (silent), kuten aiemmin todettiin. Yksilöiden välisten hiljaisten sekvenssierojen määräksi on arvioitu 10 000. Suurin osa näistä varianteista esiintyy yleisessä väestössä, ja ne periytyvät sukupolvelta toiselle. On arvioitu, että jokaisella yksilöllä esiintyy de novo alle yksi ei-hiljainen SNV.29

Eksomisekvensointihankkeissa saadut tiedot suodatetaan usein, jotta voidaan tunnistaa kaikki SNP:t, jotka esiintyvät muilla yksilöillä ja jotka eivät siten liity tutkittavaan sairauteen.2,19,23 Tämä prosessi voidaan tehdä vertaamalla niitä julkisiin tietokantoihin, joihin on koottu sekvensointihankkeissa löydetyt SNP:t. Varoituksena on otettava huomioon, että kaikki suuret tietokannat sisältävät useita todistetusti suhteellisen yleisiä sairauksia aiheuttavia mutaatioita. Tämän suodatusvaiheen jälkeen jäljelle jää noin 400-700 uutta ja mahdollisesti merkityksellistä SNV:tä (taulukko 3).28 Seuraavana haasteena on määritellä, mitkä niistä SNV:istä, joita ei esiinny maailmanlaajuisessa populaatiossa, jos sellaisia on, ovat tutkittavan sairauden taustalla. Monet havaituista eroista eivät liity mihinkään taudin esiintyvyyteen, ja näitä kutsutaan matkustajamuutoksiksi.23 Sitä vastoin yhdellä tai muutamalla muutoksella voi olla kausaalinen rooli, ja niitä kutsutaan kuljettajamuutoksiksi. Lähestymistapa, jota käytetään näiden ajurimuutosten tunnistamiseen, riippuu tutkimuksen erityisolosuhteista. Sairauksissa, joiden periytymismalli on mendeliläinen, on yleensä analysoitava useita sairastuneita ja ei-sairastuneita yksilöitä, jotta löydetään geenimuutokset, jotka erottelevat täydellisesti sairauden kanssa. Tämä vertailu on informatiivisempaa suurissa perheissä, joilla on hyvin karakterisoidut sukutaulut. Jos riittävän suuria sairastuneita perheitä ei ole, useiden toisiinsa liittymättömien potilaiden ja kontrollien vertailu mahdollistaa myös ajurigeenien tunnistamisen. Mahdollisten tautiin liittyvien SNV:iden valinnassa käytetään lisäkriteerejä, kuten in silico -algoritmeja, jotka ennustavat mutatoituneen aminohapon mahdollisen merkityksen evolutiivisen säilymisen perusteella ja ennustetun vaikutuksen perusteella proteiinin rakenteeseen ja toimintaan. Myös mutatoituneen proteiinin ennustettu funktio ja sen kudosspesifinen ilmentymismalli ovat kriteerejä, joita käytetään valittaessa oletettuja aiheuttajamutaatioita.

Taulukko 3 Yhteenveto yksilöiden välisestä sekvenssivaihtelusta

Joitakin esimerkkejä tämäntyyppisistä tutkimuksista esitetään myöhemmin. Kuitenkin sitä mukaa kuin tutkimuksia tehdään yhä enemmän, yhä useampia geenimuunnoksia tunnistetaan perinnöllisten sairauksien aiheuttajiksi, minkä vuoksi on todennäköistä, että osa potilaassa mutatoituneista geeneistä olisi jo kuvattu. Näitä mutatoituneita geenejä löytyy kirjallisuudesta ja erikoistuneista tietokannoista, kuten Online Mendelian Inheritance in Man -tietokannasta (http://www.omim.org). Eri geeneistä löytyneiden mutaatioiden mahdollista merkitystä voi etsiä myös Genome Ensemble -sivulta (http://www.ensembl.org/), jos niitä on aiemmin kuvattu.

Syöpä on luultavasti yleisin ryhmä sairauksia, joilla on geneettinen perusta. Monia tutkimuksia on suunnattu eri syöpätyyppien ajurigeenien selvittämiseksi.30 Syöpien ajurigeenien esiin nousevaan ryhmään voi tutustua tietokannoista, kuten Catalogue of Somatic Mutations In Cancer (COSMIC; http://cancer.sanger.ac.uk) tai The Cancer Genome Atlas (http://cancergenome.nih.gov/). Useita yksityiskohtaisempia esimerkkejä esitetään kohdassa Esimerkkejä eksomisekvensoinnin kliinisestä käytöstä.

Exomisekvensoinnin vertailu muihin massiivisiin sekvensointimenetelmiin

Genomin sekvensointi

Kuten johdannossa mainittiin, koko ihmisen genomin sekvensointi on tulossa yhä edullisemmaksi. Eksomin sekvensointiin verrattuna koko genomin sekvensointi on paljon monimutkaisempi vaihtoehto. Suoritettavien sekvensointireaktioiden määrä on paljon suurempi, samoin kuin tuotettavien nukleotidisekvenssitietojen määrä. Laskennallinen analyysi lisääntyy huomattavasti. Lisäksi löydetään paljon enemmän geneettisiä variantteja, kuten taulukosta 3 käy ilmi, mikä vaikeuttaa kuljettajageenien tunnistamista. Genomin sekvensointi antaa kuitenkin täydellisen kuvan potilaassa esiintyvistä geneettisistä muutoksista, mukaan lukien suuret genomin uudelleenjärjestelyt. Genomin lyhyen lukusekvensoinnin avulla kohtuullisella syvyydellä ei kuitenkaan havaita rakenteellisia variaatioita etenkään matalan kompleksisuuden alueilla. Nämä tiedot on koottu taulukkoon 4, jossa verrataan eksomisekvensointia muihin sekvensointimenetelmiin.

Kuten aiemmin mainittiin, proteiineja koodaavien geenien osuus genomista on vain 3 %.16 Viime aikoihin asti loput genomista pidettiin ”bulkki-DNA:na”, jolla ei ole suurta informaatioarvoa. Viimeaikaiset tutkimukset ovat kuitenkin muuttaneet tämän näkemyksen täysin. Suuressa koko genomin kattavassa hankkeessa, ENCODE-hankkeessa (Encyclopedia of DNA Elements), tutkitaan kaikkien genomin alueiden toimintaa.31 Tällä hetkellä saatavilla olevat tulokset osoittavat, että yli 70 prosenttia genomista on transkriboitua. Monet syntyneistä transkripteistä eivät koodaa proteiineja, mutta niillä näyttää olevan säätelevä rooli geeniekspressiossa. Niiden joukossa on jo tunnettuja miRNA:ita, jotka säätelevät mRNA:n vakautta ja translaatiota (kuva 1), mutta myös yli 20 000 pitkää ei-koodaavaa RNA:ta, jotka säätelevät transkriptiota. Lisäksi on tunnistettu monia geeniekspressiota sääteleviä DNA-alueita, mukaan lukien monia aiemmin tuntemattomia promoottori- ja transkription säätelyalueita (kuva 1). Näillä tiedoilla on kliinistä merkitystä, koska säätelyalueiden mutaatiot voivat vaikuttaa tiettyjen geenien ilmentymiseen ja niillä voi olla patologisia seurauksia. Itse asiassa suuri osa genominlaajuisista assosiaatiotutkimuksista on yhdistänyt DNA-alueet, joissa ei ole löydetty proteiineja koodaavia mutaatioita, patologisiin tiloihin.32 ENCODE-hankkeessa tuotetut tiedot ovat mahdollistaneet joidenkin tapausten tarkistamisen, jossa todettiin, että geenien ilmentymistä säätelevillä alueilla olevat mutaatiot ovat vastuussa taudista.31,32 Lisäksi tuoreessa esimerkkitapauksessa Weedon ym.33 raportoivat, että mutaatiot transkriptiota säätelevällä PTF1Ageenin transkriptiota säätelevällä alueella aiheuttavat isoloitua haiman ageneesiä. Säätelyalueiden mutaatioita ei voida havaita eksomisekvensoinnilla, koska ne eivät vaikuta koodattuun proteiiniin vaan sen ilmentymiseen. Siksi koko genomin sekvensoinnilla saadaan enemmän tietoa kuin eksomisekvensoinnilla monimutkaisuuden ja taloudellisten kustannusten lisääntymisen kustannuksella.

Taulukko 4 Massiivisten sekvensointitekniikoiden vertailu
Lyhenteet: RNA, ribonukleiinihappo; DNA, deoksiribonukleiinihappo.

RNA:n sekvensointi

RNA:n sekvensointitekniikat koostuvat RNA-populaatioiden muuntamisesta komplementaariseksi DNA:ksi (cDNA:ksi) käänteisellä transkriptiolla ja niiden myöhemmästä sekvensoinnista.34,35 mRNA-sekvensoinnissa solulinjassa tai kudosnäytteessä ilmentyvien mRNA:iden koko populaatio (ns. transkriptomi) muunnetaan cDNA:ksi ja sekvensoidaan. MRNA:n sekvensointiprosessi antaa tietoa analysoidussa näytteessä transkriptoituvien geenien nukleotidisekvenssistä ja siten vastaavien proteiinien aminohapposekvenssistä. Lisäksi voidaan arvioida kunkin mRNA:n tuottamien sekvenssien määrä, joka on verrannollinen sen runsauteen. Näin ollen geenien ilmentymistasot voidaan määrittää ja verrata muiden näytteiden, myös mahdollisten kontrollinäytteiden, ilmentymistasoihin (taulukko 4). Toinen mRNA:n sekvensoinnin erityinen etu on se, että sen avulla voidaan tutkia vaihtoehtoisia splikointitapahtumia.36,37 Kuten aiemmin mainittiin, primaariset transkriptit prosessoidaan usein useilla eri tavoilla, jolloin syntyy mRNA:ta, joka sisältää eri eksoneja (kuva 1). Nämä mRNA:t voidaan tunnistaa mRNA-sekvensoinnilla eikä eksomin tai genomin sekvensoinnilla, jossa määritetään transkriboitavan DNA:n sekvensointi eikä kypsän transkriptin sekvensointi. Muutoin mRNA:n ja eksomin sekvensoinnilla saadaan samanlaista tietoa genomin proteiinia koodaavasta alueesta. Erona on, että eksomisekvensointi sisältää kaikki geenit ja mRNA-sekvensointi rajoittuu analysoidussa näytteessä ilmentyviin geeneihin. Esimerkiksi äskettäin tehdyssä mRNA-sekvensointitutkimuksessa, jossa tutkittiin 462 henkilön lymfoblastoidisolulinjoja, määritettiin noin 13 000 geenin koodaava sekvenssi ihmisen 20 078 geenistä.38 Tässä esimerkissä noin 7 000 geeniä ei tutkittu, koska ne eivät ilmentyneet lymfoblastoidisolulinjoissa. Tapauksissa, joissa solutyyppi tai kudos, johon tietty sairaus vaikuttaa, tunnetaan hyvin, mRNA-sekvensointi vastaisi kuitenkin eksomisekvensointia kuljettajamutaatioiden tutkimisessa. Toinen mRNA:n sekvensoinnin ominaispiirre on se, että sen avulla voidaan havaita RNA:n muokkauksen aiheuttamat sekvenssivaihtelut.39 Useita mRNA:ita prosessoidaan siten, että jotkin nukleotidit muuttuvat, ja adenosiini-inosiinimuutokset ovat yleisimpiä niistä. Nämä muutokset havaitaan mRNA:n sekvensoinnilla, mutta sitä, johtuvatko ne RNA:n muokkauksesta vai genomivaihteluista, ei voida määrittää, ellei mRNA:n ja genomin sekvenssejä verrata keskenään.

MRNA:n ilmentymistasojen määrittäminen voi olla erittäin kätevää tietyissä tapauksissa, koska jotkin sairaudet voivat johtua yhden tai useamman geenin poikkeavasta ilmentymisestä. Ekspressiotasojen muutokset voivat olla hyvin informatiivisia sairauden geneettisen alkuperän suhteen. Esimerkiksi muutokset yhden tai useamman geenin ilmentymisessä potilaalla voivat viitata niiden ilmentymistä säätelevien mekanismien toimintahäiriöön. Tämä toimintahäiriö voi johtua mutaatioista geenin transkriptiota säätelevillä alueilla, kuten genomin sekvensointia koskevassa jaksossa käsitellään. Se voi johtua myös muutoksista transkriptiota säätelevien tekijöiden ilmentymisessä tai rakenteessa.40 Geeniekspression muutokset johtuvat usein muutoksista geeniekspression säätelyn epigeneettisissä mekanismeissa, kuten DNA:n metylaatiossa, jota ei voida havaita genomin tai eksomin sekvensoinnilla.41 Hiljattain on kehitetty koko genomin metylaation tutkimusmenetelmiä, jotka mahdollistavat tämän epigeneettisen informaation yksityiskohtaisen tutkimisen.42 Syöpä on yksi niistä sairauksista, joiden osalta geeniekspressiotasoja on tutkittu enemmän. Yhä useammissa tapauksissa geenien tai geeniryhmien ilmentymisen muutokset liittyvät syöpädiagnoosiin, ennusteeseen tai syöpälääkkeiden vasteen ennustamiseen.43 Näitä geenien ilmentymisen muutoksia käytetään biomarkkereina. Monet näistä tutkimuksista ovat saatavilla Cancer Genome Anatomy Project (http://cgap.nci.nih.gov) -tietokannan kautta.

Ensimmäisen tyyppisen RNA-sekvensointihankkeen tarkoituksena on määrittää pienten säätely-RNA:iden (miRNA:iden) nukleotidisekvenssi ja ilmentymistasot. Pienet RNA:t säätelevät muiden geenien ilmentymistä määrittämällä niiden mRNA:iden stabiilisuutta ja/tai translaatiota (kuva 1). Muutokset miRNA:n ilmentymismalleissa voivat näin ollen vaikuttaa merkittävästi solujen ja kudosten proteiinien ilmentymisprofiiliin. On kehitetty protokollia tietyn näytteen koko miRNA-populaation puhdistamiseksi ja sekvensoimiseksi sekä niiden ilmentymistasojen määrittämiseksi.44 Useimmat eksonien sieppausalustat sisältävät myös jopa 80 % tunnetuista miRNA:ta koodaavista alueista.21

Valittujen geenijoukkojen sekvensointi

Joitakin tauteja on jo tutkittu niin yksityiskohtaisesti, että suurin osa niihin liittyvistä geeneistä tunnetaan. Näin voi olla sellaisten sairauksien kohdalla, joilla on Mendelin periytymismalli, jolloin kaikki tutkitut tapaukset johtuvat mutaatioista jossakin tunnetuista geeneistä. Muita esimerkkejä ovat eräät syöpätyypit, jotka johtuvat pääasiassa mutaatioista harvoissa geeneissä. Tällaisissa tapauksissa suorempi lähestymistapa potilasnäytteen karakterisoimiseksi olisi määrittää niiden geenien sekvenssi, jotka on aiemmin tunnistettu taudin aiheuttajiksi. Klassinen lähestymistapa olisi monistaa näiden geenien kaikki eksonit ja määrittää kunkin geenin nukleotidisekvenssi. Vaihtoehtoinen massiivinen sekvensointimenetelmä olisi puhdistaa kaikki kyseessä olevat oletetut genomialueet ja määrittää niiden nukleotidisekvenssi samanaikaisesti yhdellä ajokerralla.45-47 Ehdokkaiden DNA-alueiden puhdistamiseen käytetään yleensä kahta menetelmää. Ensimmäinen on niiden monistaminen polymeraasiketjureaktioilla käyttäen alukkeina tiettyjä oligonukleotideja. Toinen menetelmä koostuu näytteen DNA:n fragmentoinnista ja kyseisten fragmenttien puhdistamisesta hybridisoimalla ne spesifisiin oligonukleotideihin joko liuoksessa tai kiinteälle alustalle kiinnitettynä, kuten aiemmin on kuvattu eksonien puhdistamista varten.48 Valitut alueet voivat sisältää proteiineja koodaavia eksoneja ja myös muita DNA-alueita, kuten transkription säätelyalueita. Nämä alueet vastaavat yleensä muutamaa sataa geeniä, ja siksi tuotetun sekvenssidatan analysointi on paljon helpompaa kuin muissa massasekvensointimenetelmissä. Tärkein rajoitus on se, että kyseessä on hypoteesipohjainen lähestymistapa, joka ei mahdollista mutaatioiden havaitsemista sellaisissa geeneissä, jotka eivät ole aiemmin liittyneet tutkittuun tautiin (taulukko 4).

Esimerkkejä eksomisekvensoinnin kliinisestä käytöstä

Exomisekvensoinnin yleisin käyttö lienee monogeenisten sairauksien diagnosointi. Monogeenisia sairauksia on kuvattu yli 3 000, vaikka useimpien niistä molekyyligeneettiset syyt ovat edelleen tuntemattomia.1 Eksomisekvensointia voidaan käyttää näiden mutaatioiden tunnistamiseen, kuten Kuhlenbäumer ym.1 käsittelevät tuoreessa katsauksessaan. Joissakin ensimmäisissä tutkimuksissa eksomisekvensointia käytettiin tunnistamaan geneettisiä mutaatioita, jotka ovat vastuussa tutuista sairauksista, kuten Kabukin,49 Schinzel-Giedionin,50 Joubertin,51 ja hyperfosfatasian kehitysvammaisuusoireyhtymistä,52 vaikeista aivojen epämuodostumista53 tai tutusta amyotrofisesta lateraaliskleroosista.54 Eksomisekvensointia on käytetty myös uusien mutaatioiden löytämiseksi, joita esiintyi eräässä sporadisesti esiintyneessä mielenterveydellisessä kehitysvammaisuustapauksessa.29 Lisäksi tätä tekniikkaa on käytetty esimerkiksi synnynnäisen kloridiripulin55 , tulehduksellisen suolistosairauden56 , Charcot-Marie-Toothin taudin57 , vastasyntyneen diabetes mellituksen58 tai Brown-Vialetto-van Laere -oireyhtymän59 diagnosoimiseen.59 Wortheyn ym.56 raportoima tutkimus on merkityksellinen esimerkki eksomisekvensoinnin kliinisestä soveltamisesta. Poikalapsi sairasti Crohnin taudin kaltaista sairautta ilman lopullista diagnoosia kattavasta kliinisestä arvioinnista huolimatta. Kirjoittajat päättivät käyttää eksomisekvensointia aiheuttajamutaation tai -mutaatioiden tunnistamiseksi. Sekvenssidatan analyysissä havaittiin potilaalla 16 124 varianttia. Suodattamalla tiedot ja ottamalla huomioon uudet variantit, jotka esiintyvät homotsygootti-, hemisygootti- tai yhdistelmäheterotsygoottiudessa ja vaikuttavat erittäin konservoituneisiin aminohappojäännöksiin, joiden ennustetaan olevan haitallisia proteiinin toiminnalle, kirjoittajat pystyivät valitsemaan mutaation X-linked inhibitor of apoptosis -geenissä (XIAP). Funktionaaliset tutkimukset osoittivat tämän mutaation merkityksen potilaalla havaitun proinflammatorisen vasteen kannalta. Tämän mutaation tunnistamisen perusteella tehtiin allogeeninen hematopoieettisten progenitorisolujen siirto. Näin ollen eksomisekvensointi mahdollisti tuntemattoman mutaation tunnistamisen, jotta yksittäiselle potilaalle voitiin tehdä molekyylidiagnoosi uuden taudin yhteydessä, mikä johti hoitosuunnitelmaan. Eksomisekvensoinnin käyttöä uusien aiheuttajamutaatioiden löytämisessä ja diagnosoinnissa on hiljattain tarkasteltu.60,61

Yleisten ja monimutkaisten sairauksien tutkimusta on lähestytty myös eksomisekvensoinnin avulla. Genominlaajuiset assosiaatiotutkimukset ovat osoittaneet, että jotkin geneettiset variantit aiheuttavat riskin useille sairauksille. Hyvin karakterisoituja esimerkkejä ovat apolipoproteiini E Alzheimerin taudissa, komplementtitekijä H makuladegeneraatiossa tai glukoserebrosidaasi/leusiinirikas toistokinaasi 2 Parkinsonin taudissa.62-64 Eksomisekvensoinnin mahdollisesta käytöstä monitahoisten sairauksien tutkimuksessa on keskusteltu.2,28,28 Yksi rajoitus eksomisekvensoinnin käytölle näissä tutkimuksissa on se, että suurin osa fenotyyppiin liittyvistä varianteista sijaitsee kaukana proteiineja koodaavista alueista, mikä tekisi koko genomin sekvensoinnista paremman lähestymistavan.32 Jotkin näistä geneettisistä varianteista voivat vaikuttaa geenien ilmentymistä kontrolloivien transkription säätelyalueiden toimintaan. ENCODE-hankkeessa31,65 on tehty genominlaajuisia analyysejä näistä säätelyalueista, ja havaittiin, että esimerkiksi kromosomin 5 tietyillä alueilla on useita geneettisiä variantteja, jotka ovat sitoutumispaikkoja transkriptiotekijä GATA2:lle, joka on vahvasti yhteydessä Crohnin tautiin ja muihin tulehdussairauksiin.

Syövät ovat sairauksia, jotka johtuvat useiden biologisten prosessien muuttumiseen johtavien genomimuutosten kasaantumisesta.19 Toisin kuin aiemmin käsitellyt monogeeniset geneettiset muutokset, useimpia syövän ajurimutaatioita ei esiinny potilaan normaalissa kudoksessa; suuri osa näistä mutaatioista sijaitsee proteiineja koodaavilla alueilla ja ne voidaan havaita eksomisekvensoinnilla.19 Toinen tärkeä geneettisten muutosten ryhmä ovat kuitenkin suuret genomin uudelleenjärjestelyt, kuten deletiot, inversiot tai translokaatiot, joita ei voida havaita eksomisekvensoinnilla.66 Tästä rajoituksesta huolimatta eksomisekvensointia on sovellettu syövän ajurigeenien löytämiseen kahdella yleisellä strategialla: vertaamalla kasvainten eksomia saman potilaan terveiden kudosten eksomiin tai vertaamalla useiden toisiinsa liittymättömien potilaiden eksomia vastaavaan määrään terveiden kontrollien eksomiin.67-70 Tällä hetkellä tehdään laajoja tutkimuksia, joissa eksomi tai genomi sekvensoidaan suuresta syöpäpotilaiden ja kontrolliryhmän kohortista kaikkien syövän ajurigeenien tunnistamiseksi.19,71,72 Esimerkkinä voidaan mainita 5 000 syöpägenomia -hanke,73 jonka tavoitteena on sekvensoida 50 yleisimmän syöpätyypin genomi. Käytettävissä olevista tiedoista on jo saatu yleiskuva yleisimpien syöpien genomista, kuten Vogelstein ym. ovat tarkastelleet.3 Noin 140 geeniä on tunnistettu, jotka muutettuina edistävät kasvainten syntyä, ja ne löytyvät aiemmin mainitusta COSMIC-tietokannasta.3 Jonkin tällaisen geenin mutaation havaitseminen syöpänäytteen eksomista voi olla tärkeä askel potilaan oikean diagnoosin ja hoidon kannalta. Nykyiset tiedot antavat myös käsityksen syövän genomin monimutkaisuudesta.3 Tavallisissa kiinteissä kasvaimissa on keskimäärin 33-66 ei-silenttiä somaattista mutaatiota.3 Määrä kasvaa yli 200:aan mutageenisten aineiden aiheuttamissa kasvaimissa, kuten keuhkosyövässä ja melanoomassa, ja jopa yli tuhanteen kasvaimissa, joissa DNA:n korjausmekanismit tai DNA-polymeraasi E:n toiminta on puutteellista.3 Sitä vastoin nestemäisissä kasvaimissa ja lasten kasvaimissa on alle kymmenen somaattista mutaatiota.3 Kasvainten tärkeä ominaisuus on, että ne kehittyvät nopeasti ja muuttuvat heterogeenisiksi, jolloin samasta potilaasta eri alueilta tai eri aikoina hoidon aikana kerätyistä näytteistä voi löytyä erilaisia mutaatioita, kuten eksomisekvensointi on hiljattain osoittanut74,75 . Tästä monimutkaisuudesta huolimatta joitakin yhdistäviä käsitteitä on syntymässä, ja suurin osa tunnetuista syövän ajurigeeneistä osallistuu yhteen tai useampaan 12:sta polusta, jotka säätelevät solujen selviytymistä, solujen kohtaloa ja genomin ylläpitoa.3,19 Tässä skenaariossa eksomisekvensointia aletaan käyttää syövän diagnosointiin tunnistamalla ajurimutaatioita esimerkiksi eturauhassyövässä.76

Eksomisekvensoinnista voi olla hyötyä myös syövän hoidossa. Joidenkin geenimutaatioiden esiintyminen voi aiheuttaa herkkyyttä tai resistenssiä tietylle lääkkeelle, mistä on käytetty nimitystä farmakogenomiikka. Esimerkiksi proteiinityrosiinikinaasin estäjien käyttö syövissä, joissa Abelson murine leukemia viral oncogene homolog 1 (ABL) tai epidermisen kasvutekijän reseptorin (EGFR) proteiineja yliekspressoidaan, on ollut tiedossa jo useita vuosia. Eksomin ja genomin sekvensointimenetelmät paljastavat kuitenkin paljon enemmän mutaatiovastauksia hoitoyhdistelmiin (kuten eräässä katsauksessa korostetaan77). Informatiivinen esimerkki on hiljattain julkaistu NCI-60-solupaneelin eksomi.78 Tämä paneeli sisältää 60 hyvin karakterisoitua solulinjaa yhdeksästä syöpätyypistä, ja sitä on käytetty monenlaisissa biologisissa ja farmakologisissa tutkimuksissa.79 Näiden solujen eksomin nukleotidisekvenssi määritettiin, jotta saatiin selville, mitkä syöpäkuljettajageenit ovat mutaatioita kussakin solussa. Sen lisäksi, että kirjoittajat laativat luettelon oletetuista uusista syöpäkuljettajageeneistä, he tutkivat kunkin solulinjan genotyypin ja aiemmin määritetyn vasteen mahdollista korrelaatiota useille syöpälääkkeille. Tiettyjen geenimutaatioiden ja useille lääkkeille saadun vasteen välillä havaittiin korrelaatio, mikä paljasti eksomisekvensoinnin mahdollisen merkityksen yksilöllisen hoidon valinnassa. Eksomisekvensointia voidaan käyttää myös syöpäalttiuden ennustamiseen. Joitakin esimerkkejä löytyy tuoreesta katsauksesta, jossa keskitytään paksu- ja peräsuolisyöpään ja käytetään kokogenomisekvensointia.72

Exomisekvensoinnin lääketieteelliset haasteet

Exomisekvensointi lupaa huomattavia parannuksia potilaiden diagnooseihin, ennusteisiin ja yksilöllisiin hoitoihin. Tämän tekniikan laaja soveltaminen edellyttää kuitenkin vielä useita parannuksia sekä tärkeiden eettisten ja lääketieteellisten näkökohtien määrittelyä, kuten viimeaikaisissa katsauksissa on käsitelty.23,27,60,61,71,77 Teknisiä haasteita ovat muun muassa tehokkaampien eksonien talteenotto-, sekvensointi- ja kohdistustekniikoiden kehittäminen, jotta saataisiin täydellinen ja tasainen edustus kaikista sekvenssin sisältämistä eksoneista. Tietojen analysointiohjelmistoja on myös parannettava, jotta patologiset variantit voidaan havaita nopeasti ja tarkasti. Laajamittainen eksomisekvensointi edellyttää erikoislaitteiden käyttöönottoa ja sellaisten asiantuntijaryhmien palkkaamista, joilla on riittävä asiantuntemus sekvenssien tuottamiseksi sekä saatujen tietojen analysoimiseksi ja tulkitsemiseksi.

Eksomisekvensoinnin käyttö diagnoosin tekoon edellyttää myös teknisten ohjeiden ja määräysten käyttöönottoa. Sellaiset parametrit kuin sekvensointisyvyys, eksonien kattavuus, nukleotidisekvenssidatan laatumetriikka tai linjausten kutsuminen on normalisoitava. Myös tietojen säilytystä olisi säänneltävä.

On myös useita monimutkaisia eettisiä kysymyksiä. Yksi tärkeä kysymys liittyy siihen, mitä tietoja potilaalle olisi annettava. Eksomisekvensoinnilla saatetaan havaita geneettisiä variaatioita, jotka eivät liity diagnosoitavaan sairauteen. Potilaalla saattaa olla geneettisiä variantteja, jotka edustavat riskitekijöitä tai voivat olla muiden sairauksien aiheuttajia. Mitä tietoja potilaalle olisi palautettava? Mitä todisteita tarvitaan, jotta voidaan katsoa, että geneettinen muunnos liittyy sairauteen? Tietojen omistajuus, saatavuus ja säilytys ovat muita olennaisia kysymyksiä. Pitäisikö tuotetut tiedot säilyttää mahdollista myöhempää käyttöä varten potilaan elinaikana? Nämä ja muut eettiset näkökohdat herättävät todennäköisesti huomattavia kiistoja80 , ja ne edellyttävät laajaa keskustelua, jotta päästään yhteisymmärrykseen kliinisessä käytännössä käytettävistä kriteereistä.

Johtopäätökset

Eksomisekvensointi on jo nyt tehokas väline, jota käytetään geneettisten sairauksien molekyyliperustan selvittämiseen. Geneettisen analyysin syvyys on pienempi kuin koko geeniperimän sekvensoinnissa, koska ei-proteiinikoodaavilla alueilla esiintyviä geneettisiä variaatioita ei havaita. Eksomisekvensoinnissa tarvittavien sekvenssien ja sekvenssianalyysien vähäisempi määrä tekee siitä kuitenkin edullisemman lähestymistavan kliiniseen käytäntöön. Siksi eksomisekvensointi on todennäköisesti ensisijainen tekniikka potilaiden alustavaan analyysiin ainakin siihen asti, kunnes koko genomin sekvensoinnin hinta laskee ja huomattavaa data-analyysimenettelyä parannetaan. Tärkeä rajoitus eksomisekvensoinnin soveltamisessa kliiniseen käytäntöön on se, että useimpien odotettavissa olevien geneettisten varianttien toiminnallista merkitystä ei vielä tunneta. Tilanne on nopeasti muuttumassa, kun yhä suurempi määrä sairauksiin liittyviä geneettisiä variantteja määritetään ja asetetaan saataville julkisiin tietokantoihin. On todennäköistä, että muutamassa vuodessa tiedetään suurin osa geneettisistä variaatioista, jotka liittyvät sairauden riskiin sairastua ja joiden avulla voidaan tehdä tarkkaa molekyylidiagnostiikkaa, ennustaa sairauden kehittymistä ja antaa farmakologinen vaste. Tarkka tieto potilaan eksomista eli genomista on silloin ratkaiseva tekijä lääketieteellisessä käytännössä.

Kiitokset

Kiitän kiitollisena Rosario Peronaa ja Juliette Siegfriediä (ServingEdit.com) käsikirjoituksen kriittisestä tarkistamisesta.

Paljastukset

Tekijä ei ilmoita eturistiriitoja tähän työhön liittyen.

	Kuhlenbäumer G, Hullmann J, Appenzeller S. Uudet genomitekniikat avaavat uusia väyliä monogeenisten häiriöiden analysoinnissa. Hum Mutat. 2011;32(2):144-151.
	Kiezun A, Garimella K, Do R, et al. Exome sequencing and the genetic basis of complex traits. Nat Genet. 2012;44(6):623-630.
	Vogelstein B, Papadopoulos N, Velculescu VE, Zhou S, Diaz LA Jr, Kinzler KW. Syövän genomimaisemat. Science. 2013;339(6127):1546-1558.
	Kirwan M, Dokal I. Dyskeratosis congenita: monikasvoinen geneettinen häiriö. Clin Genet. 2008;73(2):103-112.
	Walne AJ, Dokal I. Advances in the understanding of dyskeratosis congenita. Br J Haematol. 2009;145(2):164-172.
	Brady PD, Vermeesch JR. Genomic microarrays: a technology overview. Prenat Diagn. 2012;32(4):336-343.
	Hehir-Kwa JY, Pfundt R, Veltman JA, de Leeuw N. Pathogenic or not? Kopiomäärämuunnosten kliinisen merkityksen arviointi. Clin Genet. 2013;84(5):415-421.
	Simons A, Sikkema-Raddatz B, de Leeuw N, Konrad NC, Hastings RJ, Schoumans J. Genominlaajuiset matriisit hematologisten maligniteettien rutiinidiagnostiikassa. Hum Mutat. 2012;33(6):941-948.
	Metzker ML. Sekvensointitekniikat – seuraava sukupolvi. Nat Rev Genet. 2010;11(1):31-46.
	Sastre L. Uudet DNA-sekvensointitekniikat avaavat lupaavan aikakauden syövän tutkimukselle ja hoidolle. Clin Transl Oncol. 2011;13(5):301-306.
	Lander ES, Linton LM, Birren B, et al. International Human Genome Sequencing Consortium. Ihmisen genomin alustava sekvensointi ja analyysi. Nature. 2001;409(6822):860-921.
	Abecasis GR, Auton A, Brooks LD, et al. 1000 Genomes Project Consortium. Integroitu kartta geneettisestä variaatiosta 1092 ihmisen genomista. Nature. 2012;491(7422):56-65.
	Yang Y, Liu R, Xie H, et al. Advances in nanopore sequencing technology. J Nanosci Nanotechnol. 2013;13(7):4521-4538.
	Chen YS, Lee CH, Hung MY, Pan HA, Chiou JC, Huang GS. DNA:n sekvensointi DNA-polymeraasin sähkönjohtavuusmittausten avulla. Nat Nanotechnol. 2013;8(6):452-458.
	Lu ZX, Jiang P, Xing Y. Pre-mRNA:n vaihtoehtoisen pilkkomisen geneettinen vaihtelu ihmispopulaatioissa. Wiley Interdiscip Rev RNA. 2012;3(4):581-592.
	Pruitt KD, Harrow J, Harte RA, et al. The consensus coding sequence (CCDS) project: Identifying a common protein-coding gene set for the human and mouse genomes. Genome Res. 2009;19(7):1316-1323.
	Harrow J, Frankish A, Gonzalez JM, et al. GENCODE: The ENCODE Project for The ENCODE Project: the reference human genome annotation. Genome Res. 2012;22(9):1760-1774.
	Teer JK, Mullikin JC. Eksomin sekvensointi: makea paikka ennen kokonaisia genomeja. Hum Mol Genet. 2010;19(R2):R145-R151.
	Liu X, Wang J, Chen L. Whole-exome sequencing reveals recurrent somatic mutation networks in cancer. Cancer Lett. 2013;340(2):270-276.
	Parla JS, Iossifov I, Grabill I, Spector MS, Kramer M, McCombie WR. Eksomin kaappauksen vertaileva analyysi. Genome Biol. 2011; 12(9):R97.
	Sulonen AM, Ellonen P, Almusa H, et al. Comparison of solution-based exome capture methods for next generation sequencing. Genome Biol. 2011;12(9):R94.
	Clark MJ, Chen R, Lam HY, et al. Performance comparison of exome DNA sequencing technologies. Nat Biotechnol. 2011;29(10):908-914.
	Gullapalli RR, Desai KV, Santana-Santos L, Kant JA, Becich MJ. Seuraavan sukupolven sekvensointi kliinisessä lääketieteessä: Challenges and lessons for pathology and biomedical informatics. J Pathol Inform. 2012;3:40.
	Samuels DC, Han L, Li J, et al. Finding the lost treasures in exome sequencing data. Trends Genet. 2013;29(10):593-599.
	Taneri B, Asilmaz E, Gaasterland T. Biomedical impact of splicing mutations revealed through exome sequencing. Mol Med. 2012;18:314-319.
	Fu W, O’Connor TD, Jun G, et al; NHLBI Exome Sequencing Project. Analyysi 6515 eksomista paljastaa useimpien ihmisen proteiineja koodaavien varianttien tuoreen alkuperän. Nature. 2013;493(7431):216-220.
	Marian AJ. Haasteet koko eksomin/genomin sekvensointilöydösten lääketieteellisissä sovelluksissa. Trends Cardiovasc Med. 2012;22(8):219-223.
	Singleton AB. Eksomin sekvensointi: mullistava teknologia. Lancet Neurol. 2011;10(10):942-946.
	Vissers LE, de Ligt J, Gilissen C, et al. A de novo paradigm for mental retardation. Nat Genet. 2010;42(12):1109-1112.
	Gonzalez-Perez A, Perez-Llamas C, Deu-Pons J, et al. IntOGen-mutations identifies cancer drivers across tumor types. Nat Methods. 2013;10(11):1081-1082.
	Bernstein BE, Birney E, Dunham I, Green ED, Gunter C, Snyder M; ENCODE Project Consortium. Ihmisen genomin DNA-elementtien integroitu tietosanakirja. Nature. 2012;489(7414):57-74.
	Hardison RC. Genominlaajuiset epigeneettiset tiedot helpottavat tautialttiusassosiaatiotutkimusten ymmärtämistä. J Biol Chem. 2012;287(37):30932-30940.
	Weedon MN, Cebola I, Patch AM, et al. International Pancreatic Agenesis Consortium. Resessiiviset mutaatiot distaalisessa PTF1A:n tehostajassa aiheuttavat eristettyä haima-ageneesiä. Nat Genet. 2014;46(1):61-64.
	Wang Z, Gerstein M, Snyder M. RNA-Seq: vallankumouksellinen työkalu transkriptomiikkaan. Nat Rev Genet. 2009;10(1):57-63.
	Mutz KO, Heilkenbrinker A, Lönne M, Walter JG, Stahl F. Transkriptomianalyysi seuraavan sukupolven sekvensoinnilla. Curr Opin Biotechnol. 2013;24(1):22-30.
	Hitzemann R, Bottomly D, Darakjian P, et al. Genes, behavior and next-generation RNA sequencing. Genes Brain Behav. 2013;12(1):1-12.
	Costa V, Aprile M, Esposito R, Ciccodicola A. RNA-Seq and human complex diseases: recent accomplishments and future perspectives. Eur J Hum Genet. 2013;21(2):134-142.
	Lappalainen T, Sammeth M, Friedländer MR, et al; Geuvadis Consortium; Geuvadis Consortium. Transkriptomin ja genomin sekvensointi paljastaa toiminnallista vaihtelua ihmisillä. Nature. 2013; 501(7468):506-511.
	Slotkin W, Nishikura K. Adenosine-to-inosine RNA editing and human disease. Genome Med. 2013;5:105.
	Lee TI, Young RA. Transkriptionaalinen säätely ja sen virheellinen säätely sairauksissa. Cell. 2013;152(6):1237-1251.
	Suvà ML, Riggi N, Bernstein BE. Epigeneettinen uudelleenohjelmointi syövässä. Science. 2013;339(6127):1567-1570.
	Li P, Demirci F, Mahalingam G, Demirci C, Nakano M, Meyers BC. Integroitu työnkulku DNA-metylaatioanalyysiä varten. J Genet Genomics. 2013;40(5):249-260.
	Chibon F. Cancer gene expression signatures – the rise and fall? Eur J Cancer. 2013;49:2000-2009.
	Dedeoğlu BG. Suuren läpimenon lähestymistavat mikroRNA-ekspression analyysiin. Methods Mol Biol. 2014;1107:91-103.
	Ni T, Wu H, Song S, Jelley M, Zhu J. Selective gene amplification for high-throughput sequencing. Recent Pat DNA Gene Seq. 2009; 3(1):29-38.
	Barretina J, Caponigro G, Stransky N, et al. The Cancer Cell Line Encyclopedia enables predictive modelling of anticancer drug sensitivity. Nature. 2012;483(7391):603-607.
	Garnett MJ, Edelman EJ, Heidorn SJ, et al. Systematic identification of genomic markers of drug sensitivity in cancer cells. Nature. 2012;483(7391):570-575.
	Hoischen A, Gilissen C, Arts P, et al. Massively parallel sequencing of ataxia genes after array-based enrichment. Hum Mutat. 2010;31(4):494-499.
	Ng SB, Bigham AW, Buckingham KJ, et al. Exome sequencing identifies MLL2 mutations as a cause of Kabuki syndrome. Nat Genet. 2010;42(9):790-793.
	Hoischen A, van Bon BW, Gilissen C, et al. De novo mutations of SETBP1 cause Schinzel-Giedion syndrome. Nat Genet. 2010;42(6):483-485.
	Edvardson S, Shaag A, Zenvirt S, et al. Joubertin oireyhtymä 2 (JBTS2) ashkenazijuutalaisilla liittyy TMEM216-mutaatioon. Am J Hum Genet. 2010;86(1):93-97.
	Krawitz PM, Schweiger MR, Rödelsperger C, et al. Identity-by-descent filtering of exome sequence data identifies PIGV mutations in hyperphosphatasia mental retardation syndrome. Nat Genet. 2010;42(10):827-829.
	Bilgüvar K, Oztürk AK, Louvi A, et al. Whole-exome sequencing identifies recessive WDR62 mutations in severe brain malformations. Nature. 2010;467(7312):207-210.
	Johnson JO, Mandrioli J, Benatar M, et al. ITALSGEN Consortium. Exome sequencing reveals VCP mutations as a cause of familial ALS. Neuron. 2010;68(5):857-864.
	Choi M, Scholl UI, Ji W, et al. Genetic diagnosis by whole exome capture and massively parallel DNA sequencing. Proc Natl Acad Sci U S A. 2009;106(45):19096-19101.
	Worthey EA, Mayer AN, Syverson GD, et al. Making a definitive diagnosis: successful clinical application of whole exome sequencing in a child with intractable inflammatory bowel disease. Genet Med. 2011;13(3):255-262.
	Montenegro G, Powell E, Huang J, et al. Exome sequencing allows for rapid gene identification in a Charcot-Marie-Tooth family. Ann Neurol. 2011;69(3):464-470.
	Bonnefond A, Durand E, Sand O, ym. neonatal diabetes mellituksen molekyylidiagnostiikka käyttäen koko eksomin seuraavan sukupolven sekvensointia. PLoS One. 2010;5(10):e13630.
	Johnson JO, Gibbs JR, Van Maldergem L, Houlden H, Singleton AB. Eksomin sekvensointi Brown-Vialetto-van Laeren oireyhtymässä. Am J Hum Genet. 2010;87(4):567-9; author reply 569.
	Bras JM, Singleton AB. Eksomin sekvensointi Parkinsonin taudissa. Clin Genet. 2011;80(2):104-109.
	Topper S, Ober C, Das S. Exome sequencing and the genetics of intellectual disability. Clin Genet. 2011;80(2):117-126.
	Corder EH, Saunders AM, Strittmatter WJ, ym. apolipoproteiini E:n tyypin 4 alleelin geeniannos ja Alzheimerin taudin riski myöhään alkaneissa perheissä. Science. 1993;261(5123):921-923.
	Klein RJ, Zeiss C, Chew EY, ym Komplementtitekijä H:n polymorfismi iän mukaisessa makuladegeneraatiossa. Science. 2005;308(5720):385-389.
	Tan EK. Yleisen geneettisen riskimuunnoksen (LRRK2 Gly2385Arg) tunnistaminen Parkinsonin taudissa. Ann Acad Med Singapore. 2006;35(11):840-842.
	Libioulle C, Louis E, Hansoul S, ym. genominlaajuisella assosiaatioanalyysillä tunnistettu uusi Crohnin taudin lokaatio karttuu 5p13.1:n aavikolla sijaitsevaan geeniin ja moduloi PTGER4:n ilmentymistä. PLoS Genet. 2007;3(4):e58.
	Stephens PJ, Greenman CD, Fu B, et al. Massive genomic rearrangement acquired in a single catastrophic event during cancer development. Cell. 2011;144(1):27-40.
	Jones S, Zhang X, Parsons DW, et al. Core signaling pathways in human pancreatic cancers revealed by global genomic analyses. Science. 2008;321(5897):1801-1806.
	Parsons DW, Jones S, Zhang X, et al. An integrated genomic analysis of human glioblastoma multiforme. Science. 2008;321(5897):1807-1812.
	Timmermann B, Kerick M, Roehr C ym. MSI- ja MSS-kolorektaalisyövän somaattiset mutaatioprofiilit, jotka on tunnistettu koko eksomin seuraavan sukupolven sekvensoinnilla ja bioinformatiikan analyysillä. PLoS One. 2010;5(12):e15661.
	Varela I, Tarpey P, Raine K, et al. Exome sequencing identifies frequent mutation of the SWI/SNF complex gene PBRM1 in renal carcinoma. Nature. 2011;469(7331):539-542.
	Ku CS, Cooper DN, Roukos DH. Syövän genomin sekvensoinnin kliininen merkitys. World J Gastroenterol. 2013;19(13):2011–2018.
	Kilpivaara O, Aaltonen LA. Syöpägenomin diagnostinen sekvensointi ja sukusoluvarianttien osuus. Science. 2013;339(6127):1559-1562.
	Hudson TJ, Anderson W, Artez A, et al; International Cancer Genome Consortium. Syöpägenomiprojektien kansainvälinen verkosto. Nature. 2010;464(7291):993-998.
	Gerlinger M, Rowan AJ, Horswell S, et al. Intratumor heterogeneity and branched evolution revealed by multiregion sequencing. N Engl J Med. 2012;366(10):883-892.
	Ren SC, Qu M, Sun YH. Kasvainsisäisen heterogeenisuuden tutkiminen yhden solun sekvensoinnilla. Asian J Androl. 2013;15(6):729-734.
	Hieronymus H, Sawyers CL. Traversing the genomic landscape of prostate cancer from diagnosis to death. Nat Genet. 2012;44(6):613-614.
	McLeod HL. Syöpäfarmakogenomiikka: varhainen lupaus, mutta tarvitaan yhteisiä ponnisteluja. Science. 2013;339(6127):1563-1566.
	Abaan OD, Polley EC, Davis SR, et al. The exomes of the NCI-60 panel: a genomic resource for cancer biology and systems pharmacology. Cancer Res. 2013;73(14):4372-4382.
	Weinstein JN. Lääkkeiden löytäminen: Solulinjat taistelevat syöpää vastaan. Nature. 2012;483:544-545.
	Shahmirzadi L, Chao EC, Palmaer E, Parra MC, Tang S, Gonzalez KD. Potilaiden päätökset toissijaisten löydösten julkistamisesta ensimmäisten 200 kliinisen diagnostisen eksomisekvensoinnin läpikäyneen henkilön keskuudessa. Genet Med. Epub October 10, 2013.
	Flicek P, Amode MR, Barrell D, et al. Ensembl 2011. Nucleic Acids Res. 2011;39:D800-D806.
	Pruitt KD, Tatusova T, Klimke W, Maglott DR. NCBI:n viitesekvenssit: nykytila, politiikka ja uudet aloitteet. Nucleic Acids Res. 2009;37:D32-D36.

Free Press

Exomin sekvensointi: mitä lääkäreiden on tiedettävä

Vastaa Peruuta vastaus