Inleiding

Veel ziekten hebben een genetische basis. Sommige zijn het gevolg van een afwezigheid of disfunctie van een bepaald eiwit door mutaties in het coderende gen. Dit is het geval met ziekten van Mendeliaanse overerving, zoals de ziekte van Huntington, thalassemie, en ongeveer 1000 andere overgeërfde zeldzame ziekten.1 Veel ziekten hebben een genetische basis, ook al zijn zij niet uitsluitend te wijten aan de mutatie van één enkel gen, en een toenemend aantal genetische varianten en polymorfismen wordt geïdentificeerd als risicofactoren voor complexe ziekten.2 Kanker is een genetische ziekte die wordt veroorzaakt door de mutatie van een of meer genen die hetzij het risico op kanker verhogen (zoals kiembaanmutaties), hetzij kanker bevorderen (oncogenen), hetzij afbreuk doen aan de cellulaire mechanismen die de celproliferatie controleren (suppressorgenen), zoals bij somatische mutaties het geval is.3

De identificatie van de genetische basis van deze ziekten is tot voor enkele jaren een arbeidsintensief en veeleisend project geweest. Deze projecten begonnen vaak met de identificatie van een genoomregio die mogelijk betrokken is bij de overdracht van de ziekte door middel van genetische associatiestudies.1 De analyse van grote families met meerdere getroffen leden is meestal vereist om een genoomregio te definiëren die sterk gerelateerd is aan de overdracht van de ziekte. In het algemeen bevat dit gebied verscheidene genen die moeten worden gesequenced om een genmutatie te identificeren die bij alle getroffen personen aanwezig is en niet bij hun gezonde verwanten, in het geval van dominante overerving. In het geval van recessieve overerving moet de mutatie aanwezig zijn in beide allelen van de getroffen leden en in één of geen van de allelen van de niet getroffen verwanten.

De diagnose van genetische ziekten was, en is in de meeste gevallen nog steeds, even arbeidsintensief. In het beste geval kan de ziekte haar oorsprong vinden in een mutatie in slechts één gen. Voor de diagnose zou alleen de nucleotide-sequentie van dat gen moeten worden bepaald. Gewoonlijk wordt het gen met behulp van polymerase-kettingreacties als verschillende fragmenten geamplificeerd en wordt van elk daarvan de nucleotidenvolgorde bepaald. Vaak kan de ziekte worden veroorzaakt door mutaties in één of meer genen, en al deze genen moeten worden geamplificeerd en gesequeneerd om de genetische oorsprong van de ziekte bij de getroffen patiënten te vinden. Bij dyskeratose congenita bijvoorbeeld kunnen mutaties worden gevonden in elk van de genen dkc, tert, terc, NOP10, NH2, of TINF2, en het aantal betrokken genen kan nog groter zijn aangezien er een fractie van patiënten is bij wie de oorzakelijke mutatie niet is geïdentificeerd.4,5 Voor de moleculaire diagnose van elke patiënt moet de nucleotidenvolgorde van al deze genen worden bepaald. We vinden verschillende gemuteerde genen in verschillende soorten kanker.3 Moleculaire diagnose vereist het bepalen van de nucleotidevolgorde van verschillende van deze genen. Momenteel is dit een moeizaam en duur proces dat niet voor een grote patiëntenpopulatie kan worden gebruikt. In de praktijk worden slechts van enkele genen die bij een belangrijk deel van de patiënten met bepaalde kankersoorten gemuteerd zijn, sequenties bepaald voor diagnose en behandeling.

Pas de laatste jaren zijn er technieken ontwikkeld voor de gelijktijdige detectie van meerdere sequentievarianten in een gegeven monster. Veel van deze technieken zijn gebaseerd op deoxyribonucleïnezuur (DNA) microarray-technologie. In genotyperingsarrays worden oligonucleotiden die de actief geïdentificeerde mutaties bevatten die verband houden met een bepaalde ziekte, op een objectglaasje gespot. Het DNA-monster van een patiënt wordt bovenop het plaatje gelegd en de hybridiserende oligonucleotiden worden geïdentificeerd. Met één enkele microarray-hybridisatie kunnen miljoenen bekende mutaties worden getest.6 Kopieaantalvariaties kunnen ook worden geanalyseerd met DNA-microarrays die zijn ontworpen om de aanwezigheid op te sporen van DNA-gebieden die in het DNA van de patiënt zijn gedupliceerd of verwijderd.7 Deze technieken worden vaak gebruikt in medisch onderzoek en voor klinische diagnose.8

Een belangrijke stap in de moleculaire geneeskunde is echter de recente ontwikkeling van massale sequencingtechnologieën waarmee de nucleotidenvolgorde van het DNA van een patiënt in korte tijd en tegen een betaalbare prijs kan worden bepaald.9,10 Deze methodologieën zijn sinds 2005 in gebruik en zijn gebaseerd op de gelijktijdige bepaling van de nucleotidenvolgorde van miljoenen DNA-fragmenten. Ze worden aangeduid als tweede generatie sequencing, volgende generatie sequencing, deep sequencing, of massively parallel sequencing. Duizenden miljoenen nucleotide-sequenties worden met deze machines in niet meer dan 2 weken bepaald. Als voorbeeld van de capaciteit van deze nieuwe sequencingsystemen zij erop gewezen dat voor de mijlpaalsequencing van het eerste menselijke genoom, die in 2001 werd gepubliceerd,11 het gecoördineerde werk van 23 laboratoria nodig was, dat 13 jaar in beslag nam, met een totale kostprijs van ongeveer 3 miljard dollar. Met de nieuwe methodologieën neemt het sequencen van een menselijk genoom één laboratorium en ongeveer 2 weken in beslag, met een geschatte kostprijs van US$4,000.

De beschikbaarheid van moderne sequencing-methodologieën zorgt voor de exponentiële groei van onze kennis over het menselijk genoom, de variabiliteit tussen individuen, en de identificatie van genetische varianten in ziekten. Deze methodologieën liggen bijvoorbeeld aan de basis van het lopende 1000-genomeproject,12 dat erop gericht is de volledige nucleotidenvolgorde te bepalen van ongeveer 1000 personen van verschillende geografische en etnische oorsprong om de gemiddelde sequentievariatie tussen individuen te bepalen en de meest frequente polymorfismen te identificeren.

Massale sequencingtechnologieën evolueren momenteel in een snel tempo. Er worden kleinere, snellere machines ontwikkeld en er worden nieuwe sequencingmethoden geïntroduceerd. Een belangrijk doel is bijvoorbeeld de sequentie van één DNA-molecule van een individuele cel.13,14 Afgezien van de technische uitdagingen daalt de prijs van DNA-sequencing gestaag, zodat het doel om een individueel menselijk genoom te sequencen voor 1000 dollar binnen enkele jaren binnen bereik lijkt te liggen. Momenteel is het sequencen van een volledig menselijk genoom en het analyseren van alle sequentiegegevens die dat oplevert complex, duur en tijdrovend, en veel studies worden dan ook uitgevoerd op een kleiner deel van het genoom. Met name wordt momenteel veel aandacht besteed aan het sequencen van de eiwitcoderende regio van het genoom, die bekend staat als het exoom. Exoomsequencing is veel betaalbaarder dan whole-genome sequencing, en de mogelijkheden, voordelen en beperkingen van deze techniek zullen in dit overzicht worden besproken.

Wat is een exoom?

Alle menselijke eiwit-coderende genen hebben een discontinue structuur. De eiwitcoderende regio is opgedeeld in verschillende stukken, exonen genaamd. Exonen worden verbonden door niet-eiwit-coderende DNA-fragmenten, of intronen, zoals schematisch is weergegeven in figuur 1. Genen worden getranscribeerd vanuit de promotorregio onder controle van verscheidene regulatorische regio’s, die op verschillende plaatsen ten opzichte van het gen aanwezig zijn, stroomopwaarts, stroomafwaarts, of zelfs binnenin het gen. Transcriptie creëert een primair transcript dat exonen en intronen bevat. Latere ribonucleïnezuur (RNA) splicingprocessen verwijderen de introns en voegen de exons samen om het rijpe boodschapper-RNA (mRNA) te genereren dat slechts één ononderbroken eiwit-coderende regio bevat. Uit recente studies blijkt dat de primaire transcripten van de meeste genen op verschillende manieren kunnen worden gespliced, waardoor verschillende rijpe mRNA’s ontstaan met specifieke combinaties van exonen, de zogeheten alternatieve splicingvarianten (figuur 1). Deze mRNA’s coderen voor eiwitisovormen die enkele gemeenschappelijke regio’s hebben, maar die ook van andere verschillen, afhankelijk van de opgenomen exonen.15

Analyse van het menselijk genoom heeft aangetoond dat eiwitcoderende genen een klein deel van het DNA uitmaken, namelijk slechts ongeveer 3%.16 Exonen maken met 1% van het genoom een nog kleinere fractie uit.16 Een samenvatting van deze gegevens is te vinden in tabel 1. Het menselijke genoom bestaat uit 3,3 ×109 basenparen (bp) en bevat 20.078 eiwit-coderende genen.17 Elk gen is verdeeld in een gemiddeld aantal van acht exonen, die elk ongeveer 170 bp lang zijn. Alle exonen tezamen bevatten ongeveer 3 ×107 bp. De sequentiebepaling van alle exonen levert echter dezelfde informatie over de aminozuursequentie van de gecodeerde eiwitten op als de sequentiebepaling van het volledige genoom, met uitzondering van mutaties die de mRNA-splicing veranderen, zoals zal worden besproken in de sectie Exoomsequentiebepaling en -gegevensanalyse. Dit systeem, waarbij alle exonen worden gesequeneerd, wordt exoomsequencing genoemd en is een geldige methode geworden voor het opsporen van variaties in de aminozuursequentie van alle menselijke eiwitten.18 Het zeer duidelijke verschil in grootte maakt exoomsequencing veel goedkoper dan genoomsequencing, en dit vergemakkelijkt computationele en functionele analyses van de gegenereerde sequentiegegevens.

Figuur 1 Schematische voorstelling van genstructuur en -expressie.
Noten: Eiwit-coderende genen zijn samengesteld uit exonen die eiwit-coderende informatie bevatten (vakken), gescheiden door niet-coderende intronen (lijnen). Grijze vakken geven exon eiwit-coderende regio’s en witte vakken vertegenwoordigen mRNA 5′ en 3′ ongetransluteerde regio’s. De genen worden getranscribeerd vanaf de promotor regio’s, onmiddellijk stroomopwaarts van exon 1. De startplaats van de transcriptie is aangegeven met een pijl. De expressie van het gen wordt gecontroleerd door een aantal TR-gebieden die zich stroomopwaarts of stroomafwaarts van het gen kunnen bevinden, op variabele afstanden, of binnen het gen (meestal in introns). De stabiliteit en translatie van het mRNA kunnen worden gereguleerd door binding van microRNA aan specifieke plaatsen in de 3′ onvertaalde regio (aangegeven met asterisken). Genen worden getranscribeerd in primaire RNA’s die introns en exons bevatten. Latere splicingprocessen elimineren de introns om rijpe mRNA’s te genereren. Alternatieve splicingprocessen kunnen aanleiding geven tot verschillende mRNA’s, afhankelijk van de exonen die zij bevatten (mRNA1, mRNA2), die coderen voor verschillende eiwitisovormen.
Afkortingen: TR, transcriptieregulatieregio; RNA, ribonucleïnezuur; mRNA, boodschapperribonucleïnezuur.

Tabel 1 Algemene kenmerken van het menselijk genoom en het exoom

Exome capture techniques

De eerste en meest kritische stap bij exome sequencing is het isoleren of capteren van de exonen. De gebruikte methoden zijn gebaseerd op DNA-hybridisatie. De analyse van het menselijk genoom heeft de identificatie van alle gen-exonen mogelijk gemaakt, en zij vergemakkelijkt het ontwerpen van oligonucleotide-probes die specifiek zijn voor elk van hen. De probes worden gebruikt voor de zuivering van de exonen uit het DNA.19 Fragmentatie van het DNA in stukjes die niet groter zijn dan 500 bp is de eerste stap. Het DNA wordt vervolgens gehybridiseerd aan de exonspecifieke oligonucleotide probes en de gehybridiseerde fragmenten worden gezuiverd. De hybridisatie kan in de vloeistoffase worden uitgevoerd. In dat geval worden de oligonucleotiden gelabeld zodat de DNA-oligonucleotidecomplexen kunnen worden gescheiden van de bulk van het niet gehybridiseerde DNA. In een gebruikelijk voorbeeld worden oligonucleotiden covalent gebonden aan biotine, zodat DNA-oligonucleotidehybriden kunnen worden geïsoleerd met behulp van het biotinebindende molecuul streptavidine, gekoppeld aan magnetische korrels. DNA-fragmenten die geen exonen bevatten, binden zich niet aan de streptavidinekorrels en kunnen na verschillende wasstappen efficiënt worden verwijderd. De fragmenten die exonen bevatten en aan de korrels zijn gebonden, kunnen worden teruggewonnen na dissociatie van de DNA-oligonucleotidehybriden onder omstandigheden met lage ionensterkte.

Exonen kunnen ook worden geïsoleerd door hybridisatie op een vaste drager waarop de exonspecifieke oligonucleotiden zijn gespot, zoals bij DNA-microarrays. In dit geval wordt het gefragmenteerde DNA over de oligonucleotiden verspreid om hybridisatie mogelijk te maken. Later wordt niet-gehybridiseerd DNA weggespoeld en wordt het exon-verrijkte DNA geëlueerd onder laag-ionische omstandigheden.

Verschillende commerciële leveranciers bieden kits aan voor exoomisolatie met gebruikmaking van hybridisatieprotocollen in vloeibare fase, waaronder Agilent Technologies (Santa Clara, CA, VS), Roche NimbelGen, Inc. (Madison, WI, VS), Illumina, Inc. (San Diego, CA, VS), en Life Technologies (Carlsbad, CA, VS). Deze kits maken de isolatie mogelijk van meer dan 90% van de exonen die in het genoom aanwezig zijn, met een specificiteit van meer dan 90% en een prijs van ongeveer 150 US dollar per exoom. Verscheidene auteurs hebben deze platforms voor het vastleggen van exomen met elkaar vergeleken,20-22 en de door Clark et al22 verkregen gegevens waarbij de SureSelect Human All Exon 50 Mb (Agilent Technologies), de SeqCap EZ Exome Library v2.0 van Roche NimbleGen, Inc. en de TruSeq Exome Enrichment kits van Illumina, Inc. worden vergeleken, zijn samengevat in tabel 2. Sommige kits omvatten de niet-vertaalde regio’s van het mRNA, naast de eiwitcoderende regio’s, en dit maakt de analyse van regulerende regio’s zoals microRNA (miRNA) bindingsplaatsen mogelijk. De opname van 5′-onvertaalde regio’s maakt ook de analyse van de proximale promotorregio’s mogelijk.22 Bovendien bestrijken de meeste kits tot 80% van de miRNA-coderende regio’s.21 Onlangs zijn door deze en andere leveranciers verbeterde kits ontwikkeld, zodat de in tabel 2 vermelde gegevens slechts als een indicatie moeten worden beschouwd. Het is belangrijk op te merken dat exonzuivering een kritische stap is. Het is moeilijk 100% van de exonen te recupereren en vaak gaan exonen in het geïsoleerde exoom verloren of zijn ze ondervertegenwoordigd. Als bijvoorbeeld het exoom van een patiënt wordt geanalyseerd en 10% van de exonen tijdens de zuivering verloren gaan, zal de kans dat een relevante mutatie wordt gemist door deze technische fout ongeveer 10% bedragen. Daarom is het gebruik van zeer efficiënte exon-captureprocedures van cruciaal belang bij exoomsequencing.

Tabel 2 Vergelijking van drie grote exoom-captureplatforms
Noten: aVergelijking van respectievelijk de Ensemble81- en de RefSeq82-databank; bpercentage van de geselecteerde regio’s die door elk platform ten minste tien keer zijn gesequenced na de analyse van 80 mega-lezen van de DNA-sequentie. Agilent Technologies (Santa Clara, CA, VS); Roche NimbelGen, Inc. (Madison, WI, VS); Illumina, Inc. (San Diego, CA, VS).
Afkortingen: mRNA, boodschapperribonucleïnezuur; miRNA, microribonucleïnezuur; DNA, desoxyribonucleïnezuur.

Exoomsequencing en gegevensanalyse

Exon-bevattende fragmenten worden gesequenced met behulp van een van de momenteel beschikbare massale sequencing-apparatuursystemen of -technologieën. Zoals in de inleiding vermeld, bepalen deze platforms de nucleotidesequentie van miljoenen DNA-fragmenten tegelijk. De bepaalde lengte van de sequentie van elk fragment bij exoomsequencing is niet lang, meestal tussen 35 bp en 100 bp. Aangezien het DNA echter aanvankelijk willekeurig werd gefragmenteerd, zal elke individuele nucleotide in vele overlappende fragmenten aanwezig zijn. Indien een voldoende groot aantal sequenties wordt verkregen, ook al zijn ze kort, zal elke base in verschillende DNA-fragmenten onafhankelijk worden gesequeneerd. Het aantal keren dat elke base wordt gesequeneerd wordt dekkingsgraad of sequencingdiepte genoemd. De dekking houdt rechtstreeks verband met de kwaliteit en de betrouwbaarheid van de gegenereerde nucleotidensequentie. In het algemeen wordt een dekking van 20×-30× noodzakelijk geacht om betrouwbare resultaten te verkrijgen bij exoomsequencing.59 Deze sequencingdiepte betekent dat een mogelijke sequentievariatie onafhankelijk zou zijn gesequenced in 20-30 verschillende DNA-fragmenten.

Data-analyse is de laatste stap in exoom-sequencingprojecten (figuur 2). Zoals hierboven vermeld, worden gegevens van miljoenen sequenties gegenereerd, en de analyses daarvan vereisen specifieke en complexe computerprogramma’s en expertise.19,23 Een voorbereidende stap is een analyse van de kwaliteit van de gegenereerde sequentie. De nauwkeurigheid van het lezen van de sequentie bij verschillende sequentielengtes, de gemiddelde lengte van de gelezen sequenties, alsook andere parameters, worden getest. Als de kwaliteit goed genoeg is, wordt elke sequentie vergeleken met een referentiesequentie, meestal de laatst beschikbare versie van de sequentie van het menselijk genoom. Gewoonlijk kan meer dan 80% van de gegenereerde sequenties aan het referentiegenoom worden gealigneerd.22 Deze stap laat een kleine mate van nucleotidenvariatie ten opzichte van het referentiegenoom toe. De volgende stap in de analyse is het identificeren van sequentievarianten tussen de referentiesequentie en de in onze studie verkregen exoomsequentie. De daaropvolgende analyses van deze varianten zouden de gewenste informatie over het bestudeerde medische probleem kunnen opleveren.

Figuur 2 Exoomsequencing-gegevensanalyse.
Noten: De stappen die nodig zijn voor exoomisolatie, sequencing en gegevensanalyse zijn schematisch weergegeven. Dit proces leidt tot de identificatie van genvarianten die betrokken zijn bij het ontstaan van de ziekten (driver genen) of anderszins verband houden met ziektegevoeligheid, evolutie, of farmaceutische respons. Deze gegevens leveren waardevolle informatie op voor diagnose en prognose, voor genetische counseling en voor het ontwerpen van gepersonaliseerde behandelingen.
Abbreviation: DNA, desoxyribonucleïnezuur.

Exome sequencing kan verschillende soorten genetische variaties opsporen. Een van de meest gevonden verschillen is een verandering van een nucleotide in een andere, bijvoorbeeld A voor G (ATA codon naar ATG). Deze variaties worden single nucleotide variants (SNV’s) genoemd, hoewel ze als single nucleotide polymorphisms (SNPs) worden beschouwd wanneer hun frequentie in de bevolking groter is dan 1%-5% en er geen sterk effect is op het risico van een ziekte. De meeste SNV’s zijn silent, of ook wel synoniem genoemd, omdat beide sequentievarianten voor hetzelfde aminozuur coderen (bijvoorbeeld een variatie van GCA naar GCC, aangezien het in beide gevallen om alanine codons gaat). De meeste van deze polymorfismen betekenen geen verschil voor het gecodeerde eiwit, staan niet onder evolutionaire selectie, en vertegenwoordigen de meest frequent gevonden variaties in het menselijk exoom. Een uitzondering vormen sommige stille mutaties die invloed hebben op splitsings-regulerende signalen, of zelfs op transcriptieregulerende plaatsen, waardoor de splitsing of expressie van het mRNA wordt veranderd, ook al veranderen de gecodeerde aminozuren niet. In andere gevallen heeft de nucleotidevariatie een gevolg in het gecodeerde eiwit en dit zijn niet-silicente of niet-synonieme varianten. Deze veranderingen kunnen resulteren in variaties in het gecodeerde aminozuur (bijvoorbeeld, GAT naar GAG verandert asparaginezuur in glutaminezuur), en worden missense mutaties genoemd. Meer drastische veranderingen ontstaan wanneer de nucleotidevariatie een translatiestopcodon creëert (bijvoorbeeld TGC naar TGA verandert een cysteïnecodon in een stopcodon), wat een nonsensmutatie wordt genoemd. Er is ook een type SNV dat door exoomsequencing kan worden opgespoord, zelfs als het geen effect heeft op de eiwitcodons. Aangezien exonen worden geselecteerd na willekeurige fragmentatie van het DNA, kunnen zij ook aaneengesloten DNA-regio’s bevatten, met inbegrip van aangrenzende intronsequenties en zelfs genpromotors als niet-vertaalde regio’s werden vastgelegd.24 Intronregio’s bevatten de regulerende signalen die nodig zijn voor mRNA-splicing. SNV’s in deze regio’s kunnen de splicing op verschillende manieren veranderen.15 Het aangetaste intron kan bijvoorbeeld in het rijpe mRNA behouden blijven, of het aangrenzende exon kan worden weggesplitst (exon skipping). Deze veranderingen veranderen de nucleotidevolgorde van het rijpe mRNA en daardoor ook het gecodeerde eiwit stroomafwaarts van de SNV.25 Met behulp van genoomsequencing kunnen ook sequentievariaties door kleine inserties of deleties (indels) worden opgespoord.22 Deze variaties kunnen in een frameverschuiving resulteren, behalve wanneer zij drie of een veelvoud van drie nucleotiden betreffen. In dat geval zouden kleine deleties of inserties van aminozuren worden geproduceerd.

Identificatie van oorzakelijke mutaties

De functionele relevantie van de gedetecteerde sequentievarianten moet worden bepaald in de volgende stap van de gegevensanalyse. Ook al zijn alle mensen genetisch gezien vrijwel identiek, het aantal nucleotide sequentieverschillen tussen individuen is aanzienlijk.26 Deze heterogeniteit bemoeilijkt de interpretatie van de gegevens die in afzonderlijke sequencingprojecten zijn verkregen. Enkele algemene gegevens over individuele sequentievariaties zijn te vinden in tabel 3. Wanneer naar het volledige genoom wordt gekeken, wordt het aantal sequentieverschillen tussen individuen geschat op 4 × 106, volgens de gegevens die zijn verkregen in het 1000 Genomes Project en kleinere sequentieprojecten voor het volledige genoom.27 Exomen vertonen een kleiner, maar nog steeds aanzienlijk aantal sequentievariaties, namelijk ongeveer 20.000-25.000 tussen twee niet-verwante individuen.27,28 De meeste van deze genetische variaties zijn “silent”, zoals eerder besproken. Het aantal niet-zwijgende sequentieverschillen tussen individuen wordt geschat op 10.000. De meeste van deze varianten komen voor in de algemene bevolking en worden generaties lang doorgegeven. Er wordt geschat dat minder dan één nonsilente SNV de novo voorkomt in elk individu.29

De gegevens verkregen in exoom sequencing projecten worden vaak gefilterd om alle SNPs te identificeren die aanwezig zijn in andere individuen en die dus niet gerelateerd zijn aan de ziekte die wordt bestudeerd.2,19,23 Dit proces kan worden gedaan door vergelijking met openbare databases waarin de SNPs die worden gevonden in de sequencing projecten zijn verzameld. Een voorbehoud waarmee rekening moet worden gehouden, is dat alle grote databanken een aantal bewezen mutaties bevatten die relatief vaak voorkomende ziekten veroorzaken. Ongeveer 400-700 nieuwe, en mogelijk relevante, SNV’s blijven over na deze filterstap (tabel 3).28 De volgende uitdaging is te bepalen welke van de SNV’s die niet aanwezig zijn in de wereldpopulatie, als die er al zijn, aan de basis liggen van de bestudeerde ziekte. Veel van de waargenomen verschillen zullen niet geassocieerd zijn met enige incidentie van de ziekte, en deze staan bekend als “passenger changes”.23 Daarentegen kunnen één of enkele veranderingen een oorzakelijke rol spelen, en deze worden “driver changes” genoemd. De aanpak die wordt gebruikt om deze driver changes te identificeren zal afhangen van de specifieke omstandigheden van het onderzoek. Bij ziekten met een Mendeliaans overervingspatroon is het gewoonlijk nodig om een aantal getroffen en niet getroffen individuen te analyseren om genvariaties te vinden die perfect segregeren met de ziekte. Deze vergelijking is informatiever in grote families met goed gekarakteriseerde stambomen. Bij gebrek aan voldoende grote getroffen families, maakt de vergelijking van een aantal niet-verwante patiënten en controles ook de identificatie van drijvende genen mogelijk. Er worden aanvullende criteria gebruikt om mogelijke aan de ziekte gerelateerde SNV’s te selecteren, waaronder in silico-algoritmen, die het mogelijke belang van het gemuteerde aminozuur voorspellen op basis van evolutionaire conservatie, en op de voorspelde impact op de structuur en functie van het eiwit. De voorspelde functie van het gemuteerde eiwit en het weefselspecifieke expressiepatroon zijn ook criteria die worden gebruikt bij de selectie van vermoedelijke causatieve mutaties.

Tabel 3 Overzicht van de sequentievariatie tussen individuen

Enkele voorbeelden van dit soort studies zullen in een later hoofdstuk worden gegeven. Naarmate meer studies worden uitgevoerd, worden echter meer genvariaties geïdentificeerd als veroorzakers van erfelijke ziekten, waardoor het waarschijnlijk is dat sommige van de bij de patiënt gemuteerde genen reeds zouden zijn beschreven. Deze gemuteerde genen zijn te vinden in de literatuur en in gespecialiseerde databanken zoals de Online Mendelian Inheritance in Man database (http://www.omim.org). De mogelijke relevantie van de gevonden mutaties in verschillende genen kan ook worden opgezocht in de Genome Ensemble pagina (http://www.ensembl.org/) als ze al eerder zijn beschreven.

Kanker is waarschijnlijk de meest voorkomende groep van ziekten met een genetische basis. Veel studies zijn gericht op het bepalen van de “driver genes” voor verschillende vormen van kanker.30 De opkomende groep van kanker-driver genen kan worden geraadpleegd in databases zoals de Catalogue of Somatic Mutations In Cancer (COSMIC; http://cancer.sanger.ac.uk) of The Cancer Genome Atlas (http://cancergenome.nih.gov/). Verscheidene meer gedetailleerde voorbeelden zullen worden getoond in de sectie Voorbeelden van klinisch gebruik van exoomsequencing.

Vergelijking van exoomsequencing met andere massale sequencingbenaderingen

Genoomsequencing

Zoals in de inleiding is vermeld, wordt het sequencen van het volledige menselijke genoom steeds betaalbaarder. In vergelijking met exoom sequencing is whole-genome sequencing een veel complexer alternatief. Het aantal sequencingreacties dat moet worden uitgevoerd is veel groter, evenals het aantal nucleotide sequentiegegevens dat wordt gegenereerd. De computationele analyse neemt sterk toe. Bovendien worden er veel meer genetische varianten gevonden, zoals blijkt uit tabel 3, wat de identificatie van “driver genes” bemoeilijkt. Genoomsequencing geeft echter een volledig beeld van de genetische veranderingen die in de patiënt aanwezig zijn, met inbegrip van grote genoomherschikkingen. Short-read sequencing van een genoom op matige diepte zal echter structurele variaties missen, vooral in regio’s met een lage complexiteit. Deze informatie is samengevat in tabel 4, waarin exoomsequencing wordt vergeleken met andere sequencingbenaderingen.

Zoals eerder vermeld, maken eiwitcoderende genen slechts 3% van het genoom uit.16 Tot voor kort werd de rest van het genoom beschouwd als “bulk-DNA” zonder veel informatiewaarde. Recente studies hebben dit standpunt echter volledig veranderd. Een groot genoombreed project bestudeert de functie van alle regio’s van het genoom, het ENCODE-project (Encyclopedia of DNA Elements).31 Uit de momenteel beschikbare resultaten blijkt dat meer dan 70% van het genoom getranscribeerd is. Veel van de gegenereerde transcripten coderen niet voor eiwitten, maar lijken wel een regulerende rol te spelen bij de genexpressie. Daartoe behoren de reeds bekende miRNA’s, die de mRNA-stabiliteit en de translatie reguleren (figuur 1), maar ook meer dan 20.000 lange niet-coderende RNA’s die de transcriptie reguleren. Bovendien zijn veel DNA-gebieden die de genexpressie reguleren geïdentificeerd, waaronder veel voorheen onbekende promotor- en transcriptieregulerende gebieden (figuur 1). Deze informatie is van klinisch belang omdat mutaties in regulerende regio’s de expressie van specifieke genen kunnen beïnvloeden en pathologische gevolgen kunnen hebben. In feite heeft een groot deel van genoomwijde associatiestudies DNA-regio’s, waar geen eiwitcoderende mutaties zijn gevonden, in verband gebracht met pathologische aandoeningen.32 De gegevens die in het ENCODE-project zijn gegenereerd, hebben het mogelijk gemaakt een aantal gevallen te herzien, waarbij mutaties in regulatorische genexpressieregio’s verantwoordelijk bleken te zijn voor de ziekte.31,32 Ook hebben Weedon et al33 in een recent voorbeeld gemeld dat mutaties in een transcriptieregulatorische regio van het PTF1A-gen geïsoleerde pancreasabgenese veroorzaken. Mutaties in regulatorische regio’s kunnen niet worden gedetecteerd door exoomsequencing omdat zij geen invloed hebben op het gecodeerde eiwit, maar wel op de expressie ervan. Daarom levert whole-genome sequencing meer informatie op dan exome sequencing, maar dit gaat ten koste van de complexiteit en de economische kosten.

Tabel 4 Vergelijking van massale sequencingtechnieken
Afkortingen: RNA, ribonucleïnezuur; DNA, desoxyribonucleïnezuur.

RNA-sequencing

RNA-sequencingtechnieken bestaan uit de omzetting van RNA-populaties in complementair DNA (cDNA) door middel van omgekeerde transcriptie en de daaropvolgende sequencing.34,35 In het geval van mRNA-sequencing wordt de volledige populatie van mRNA’s die in een cellijn of weefselmonster tot expressie komen (bekend als transcriptoom) omgezet in cDNA en gesequenced. Het proces van mRNA-sequencing levert informatie op over de nucleotidenvolgorde van de genen die in het geanalyseerde monster worden getranscribeerd en derhalve over de aminozuurvolgorde van de corresponderende eiwitten. Bovendien kan het aantal sequenties dat voor elk mRNA wordt gegenereerd, worden geschat en is dit aantal evenredig met de abundantie ervan. Daarom kunnen genexpressieniveaus worden bepaald en vergeleken met die van andere monsters, met inbegrip van eventuele controlemonsters (tabel 4). Een ander specifiek voordeel van mRNA-sequencing is dat het de studie van alternatieve splicing events.36,37 Zoals eerder vermeld, worden primaire transcripten vaak verwerkt op meerdere manieren te geven aanleiding tot mRNA die verschillende exonen (figuur 1) bevatten. Deze mRNA’s kunnen worden geïdentificeerd door mRNA-sequencing en niet door exoom- of genoomsequencing, waarbij de sequencing van het getranscribeerde DNA wordt bepaald en niet die van het rijpe transcript. Voor het overige verschaffen mRNA- en exoomsequencing soortgelijke informatie over de eiwitcoderende regio van het genoom. Het verschil is dat exoomsequencing alle genen omvat en mRNA-sequencing beperkt is tot de genen die in het geanalyseerde monster tot expressie komen. In een recente mRNA-sequencingstudie van lymfoblastoïde cellijnen van 462 individuen werd bijvoorbeeld de coderende sequentie van ongeveer 13.000 genen van de 20.078 menselijke genen bepaald.38 In dit voorbeeld werden ongeveer 7.000 genen niet bestudeerd omdat zij niet tot expressie kwamen in lymfoblastoïde cellijnen. In gevallen waarin het celtype of weefsel dat door een bepaalde ziekte wordt getroffen, goed bekend is, zou mRNA-sequencing echter gelijkwaardig zijn aan exoomsequencing voor de bestudering van driver-mutaties. Een ander kenmerk van mRNA-sequencing is dat het de detectie mogelijk maakt van sequentievariaties die door RNA-editing ontstaan.39 Een aantal mRNA’s wordt zo bewerkt dat sommige nucleotiden worden veranderd, waarbij veranderingen van adenosine naar inosine het vaakst voorkomen. Deze veranderingen worden met mRNA-sequencing opgespoord, maar of zij door RNA-editing of als gevolg van genomische variaties zijn ontstaan, kan niet worden bepaald tenzij zowel de mRNA- als de genomische sequenties worden vergeleken.

Het bepalen van mRNA expressieniveaus kan in bepaalde gevallen zeer handig zijn, aangezien sommige ziekten kunnen worden veroorzaakt door de ontregelde expressie van één of meer genen. Veranderingen in expressieniveaus kunnen zeer informatief zijn over de genetische oorsprong van de ziekte. Veranderingen in de expressie van één of meer genen in een patiënt kunnen bijvoorbeeld wijzen op een disfunctie in de mechanismen die de expressie van die genen regelen. Dit disfunctioneren kan te wijten zijn aan mutaties in de gen-transcriptieregulerende regio’s, zoals besproken in het deel over genoomsequencing. Het kan ook te wijten zijn aan veranderingen in de expressie of de structuur van transcriptieregulerende factoren.40 Veranderingen in genexpressie zijn vaak te wijten aan veranderingen in epigenetische mechanismen van genexpressieregulatie, zoals DNA-methylering, die niet door genoom- of exoomsequencing kunnen worden opgespoord.41 Recent zijn methoden ontwikkeld voor de studie van genoombrede methylering die een gedetailleerde bestudering van deze epigenetische informatie mogelijk maken.42 Kanker is een van de ziekten waarbij meer onderzoek naar genexpressieniveaus is uitgevoerd. In een toenemend aantal gevallen worden veranderingen in de expressie van genen of een groep genen in verband gebracht met een kankerdiagnose, een prognose of een voorspelling van de reactie op geneesmiddelen tegen kanker.43 Deze veranderingen in genexpressie worden gebruikt als biomarkers. Veel van deze studies zijn beschikbaar via de databank van het Cancer Genome Anatomy Project (http://cgap.nci.nih.gov).

Een specifiek type RNA-sequencingproject is gericht op de bepaling van de nucleotidenvolgorde en de expressieniveaus van kleine regulerende RNA’s (miRNA’s). Kleine RNA’s reguleren de expressie van andere genen door de stabiliteit en/of translatie van hun mRNA’s te bepalen (figuur 1). Veranderingen in de expressiepatronen van miRNA’s kunnen daarom een duidelijke invloed hebben op het eiwitexpressieprofiel van cellen en weefsels. Er zijn protocollen ontwikkeld voor de zuivering en sequencing van de volledige populatie miRNA’s van een bepaald monster en voor de bepaling van hun expressieniveaus.44 De meeste exon-capture platforms omvatten ook tot 80% van de bekende miRNA-coderende regio’s.21

Sequencing selected sets of genes

Sommige ziekten zijn reeds zo gedetailleerd bestudeerd dat de meeste betrokken genen bekend zijn. Dit kan het geval zijn bij ziekten met een Mendeliaans overervingspatroon, waarbij alle bestudeerde gevallen te wijten zijn aan mutaties in een van een aantal bekende genen. Andere voorbeelden zijn sommige kankertypes die hoofdzakelijk te wijten zijn aan mutaties in een beperkt aantal genen. In dergelijke gevallen zou de meer directe benadering om het monster van een patiënt te karakteriseren erin bestaan de sequentie te bepalen van de genen waarvan eerder is vastgesteld dat zij de ziekte veroorzaken. De klassieke aanpak zou erin bestaan alle exonen van deze genen te amplificeren en de nucleotidesequentie van elk gen te bepalen. De alternatieve massale sequencing-benadering zou erin bestaan alle vermoedelijke betrokken genomische regio’s te zuiveren en tegelijkertijd hun nucleotidenvolgorde in één enkele run te bepalen.45-47 Voor de zuivering van de kandidaat-DNA-regio’s worden over het algemeen twee methoden gebruikt. De eerste is amplificatie door polymerase-kettingreacties met een reeks specifieke oligonucleotiden als primers. De tweede methode bestaat uit fragmentatie van het DNA van het monster en de zuivering van de relevante fragmenten door hybridisatie aan specifieke oligonucleotiden, hetzij in oplossing, hetzij gefixeerd op een vaste drager, zoals eerder beschreven voor de zuivering van exonen.48 De geselecteerde regio’s kunnen eiwancoderende exonen bevatten en ook andere DNA-regio’s, zoals transcriptieregulerende regio’s. Deze regio’s komen gewoonlijk overeen met een paar honderd genen en daarom is de analyse van de gegenereerde sequentiegegevens veel gemakkelijker dan bij andere massale sequencingbenaderingen. De belangrijkste beperking is dat dit een hypothesegestuurde aanpak is die het niet mogelijk maakt mutaties op te sporen in genen die niet eerder met de bestudeerde ziekte in verband zijn gebracht (tabel 4).

Voorbeelden van het klinische gebruik van exoomsequencing

Het meest voorkomende gebruik van exoomsequencing is waarschijnlijk voor de diagnose van monogene ziekten. Meer dan 3.000 monogene aandoeningen zijn beschreven, hoewel de moleculair genetische oorzaken van de meeste nog onbekend zijn.1 Exoomsequencing kan worden gebruikt om deze mutaties te identificeren, zoals besproken door Kuhlenbäumer et al1 in een recente review. In enkele van de eerste studies werd exoomsequencing gebruikt om genetische mutaties te identificeren die verantwoordelijk zijn voor bekende ziekten zoals de Kabuki’s,49 Schinzel-Giedion,50 Joubert,51 en hyperfosfatasie mentale retardatiesyndromen,52 ernstige hersenmalformaties,53 of bekende amyotrofische laterale sclerose.54 Exoomsequencing is ook gebruikt om nieuwe mutaties te ontdekken die aanwezig zijn in een sporadisch geval van mentale retardatie.29 Daarnaast is deze techniek gebruikt voor de diagnose van bijvoorbeeld congenitale chloordiarree,55 inflammatoire darmziekte,56 de ziekte van Charcot-Marie-Tooth,57 neonatale diabetes mellitus,58 of het Brown-Vialetto-van Laere-syndroom.59 De studie van Worthey et al56 is een relevant voorbeeld van de klinische toepassing van exome sequencing. Een mannelijk kind presenteerde zich met een ziekte van Crohn-achtige ziekte zonder een definitieve diagnose, ondanks een uitgebreide klinische evaluatie. De auteurs besloten een exoom sequencing aanpak te gebruiken om de oorzakelijke mutatie(s) te identificeren. Analyse van de sequentiegegevens leverde 16.124 varianten op in de patiënt. Door de gegevens te filteren en daarbij rekening te houden met nieuwe varianten die aanwezig zijn in homozygositeit, hemizygositeit of samengestelde heterozygositeit, en die invloed hebben op sterk geconserveerde aminozuurresiduen waarvan voorspeld wordt dat ze schadelijk zijn voor de eiwitfunctie, konden de auteurs een mutatie selecteren in het X-gebonden inhibitor van apoptose gen (XIAP). Functionele studies toonden de relevantie van deze mutatie aan in de pro-inflammatoire respons die bij de patiënt werd waargenomen. Op basis van de identificatie van deze mutatie werd een allogene hematopoietische progenitor transplantatie van cellen uitgevoerd. Daarom maakte exoomsequencing de identificatie van een ongekarakteriseerde mutatie mogelijk om een moleculaire diagnose te stellen voor een individuele patiënt, in de setting van een nieuwe ziekte, wat resulteerde in een beheersplan. Het gebruik van exoomsequencing bij de ontdekking van nieuwe oorzakelijke mutaties en bij de diagnose is onlangs geëvalueerd.60,61

De studie van veel voorkomende en complexe ziekten is ook benaderd met behulp van exoomsequencing. Genoomwijde associatiestudies hebben aangetoond dat sommige genetische varianten risico’s inhouden voor een aantal ziekten. Goed gekarakteriseerde voorbeelden zijn apolipoproteïne E bij de ziekte van Alzheimer, complementfactor H bij maculadegeneratie, of glucocerebrosidase/leucine rich repeat kinase 2 bij de ziekte van Parkinson.62-64 Het mogelijke gebruik van exoomsequencing voor de studie van complexe ziekten is besproken.2,28 Een beperking van het gebruik van exoomsequencing in deze studies is dat de meeste fenotype-geassocieerde varianten distaal van eiwit-coderende regio’s liggen, waardoor whole-genome sequencing een betere benadering zou zijn.32 Sommige van deze genetische varianten kunnen de functionaliteit van transcriptieregulerende regio’s die genexpressie controleren beïnvloeden. Het ENCODE-project31,65 heeft een genoombrede analyse van deze regulerende regio’s uitgevoerd en daarbij is gebleken dat verschillende genetische varianten in specifieke regio’s van chromosoom 5 (bijvoorbeeld) bindingsplaatsen zijn voor de transcriptiefactor GATA2, die sterk geassocieerd zijn met de ziekte van Crohn en andere ontstekingsziekten.

Kankers zijn ziekten die worden veroorzaakt door de accumulatie van genomische veranderingen die resulteren in de wijziging van meerdere biologische processen.19 In tegenstelling tot de eerder besproken monogene genetische veranderingen zijn de meeste kankeraanjagende mutaties niet aanwezig in het normale weefsel van de patiënt; een groot deel van deze mutaties bevindt zich in eiwitcoderende regio’s en kan met behulp van exoomsequencing worden opgespoord.19 Een andere belangrijke groep van genetische veranderingen zijn echter grote genomische reorganisaties zoals deleties, inversies of translocaties, die niet door exoomsequencing kunnen worden gedetecteerd.66 Ondanks deze beperking is exoomsequencing toegepast voor de ontdekking van kanker-drivergenen met behulp van twee algemene strategieën: de vergelijking van het exoom van de tumoren met dat van gezond weefsel van dezelfde patiënt; of de vergelijking van het exoom van een aantal niet-verwante patiënten met dat van een vergelijkbaar aantal gezonde controles.67-70 Momenteel worden uitgebreide studies uitgevoerd waarbij het exoom of genoom van een groot cohort kankerpatiënten en controles wordt gesequencet om alle kanker-drivergenen te identificeren.19,71,72 Het 5.000 cancer genomes project is daar een voorbeeld van,73 aangezien het de bedoeling is het genoom van 50 van de meest voorkomende kankertypes te sequencen. De beschikbare gegevens hebben al een algemeen genoomlandschap van de meest voorkomende vormen van kanker opgeleverd, zoals besproken door Vogelstein et al.3 Er zijn ongeveer 140 genen geïdentificeerd die bij verandering tumorigenese bevorderen, en deze zijn te vinden in de eerder genoemde COSMIC-database.3 Het opsporen van de mutatie van een van deze genen in het exoom van een kankermonster kan een belangrijke stap zijn in de richting van de juiste diagnose en behandeling van de patiënt. De huidige gegevens geven ook een idee van de complexiteit van het kankergenoom.3 Veel voorkomende solide tumoren vertonen gemiddeld 33 tot 66 niet-silente somatische mutaties.3 Dit aantal loopt op tot meer dan 200 in door mutagene agentia geïnduceerde tumoren, zoals longkanker en melanoom, en zelfs tot meer dan 1000 in tumoren die deficiënt zijn in DNA-reparatiemechanismen of in het DNA-polymerase E.3 Vloeibare en pediatrische tumoren daarentegen vertonen minder dan tien somatische mutaties.3 Een belangrijk kenmerk van tumoren is dat zij snel evolueren en heterogeen worden, zodat verschillende mutaties kunnen worden gevonden in monsters van dezelfde patiënt die in verschillende regio’s of in verschillende perioden van de behandeling zijn verzameld, zoals onlangs is aangetoond met exoomsequencing.74,75 Ondanks deze complexiteit komen er enkele unificerende concepten naar voren, en de meeste bekende kanker-drivergenen nemen deel aan een of meer van de 12 pathways die de overleving van cellen, het lot van cellen en het onderhoud van het genoom reguleren.3,19 In dit scenario begint exoomsequencing te worden gebruikt voor kankerdiagnose door de identificatie van drivermutaties, bijvoorbeeld bij prostaatkanker.76

Exoomsequencing kan ook nuttig zijn voor de behandeling van kanker. De aanwezigheid van bepaalde genmutaties kan leiden tot gevoeligheid voor of resistentie tegen een bepaald geneesmiddel, wat pharmacogenomics wordt genoemd. Zo is het gebruik van proteïne tyrosine kinase remmers bij kankers die de Abelson murine leukemie virale oncogene homolog 1 (ABL) of epidermale groeifactor receptor (EGFR) eiwitten overexpresseren al enkele jaren bekend. Met behulp van exoom- en genoomsequencing-benaderingen komen echter veel meer mutatiereacties op behandelingsassociaties aan het licht (zoals in één review wordt benadrukt77). Een informatief voorbeeld is de recente publicatie van het exoom van het NCI-60 panel van cellen.78 Dit panel bevat 60 goed gekarakteriseerde cellijnen van negen kankertypes en is gebruikt in een breed scala van biologische en farmacologische studies.79 De nucleotidenvolgorde van het exoom van deze cellen is bepaald om vast te stellen welke kankerbepalende genen in elk van deze cellen zijn gemuteerd. De auteurs leverden niet alleen een lijst van vermoedelijke nieuwe kanker-drivergenen op, maar bestudeerden ook de mogelijke correlatie tussen het genotype van elke cellijn en de eerder vastgestelde respons op een groot aantal antikankermiddelen. Er werd een correlatie gevonden tussen specifieke genmutaties en de respons op verschillende geneesmiddelen, wat het mogelijke belang van exoomsequencing bij de selectie van een gepersonaliseerde behandeling aantoont. Exoomsequencing kan ook worden gebruikt om de aanleg voor kanker te voorspellen. Enkele voorbeelden zijn te vinden in een recente review die is gecentreerd op colorectale kanker en waarbij whole-genome sequencing wordt gebruikt.72

Medische uitdagingen van exome sequencing

Exome sequencing belooft aanzienlijke verbeteringen in de diagnoses, prognoses en gepersonaliseerde behandelingen van patiënten. De uitgebreide toepassing van deze technologie vereist echter nog een aantal verbeteringen, evenals de definitie van belangrijke ethische en medische overwegingen, zoals is besproken in recente reviews.23,27,60,61,71,77 Technische uitdagingen omvatten de ontwikkeling van efficiëntere technieken van exon capture, sequencing, en alignment om een volledige en gelijkmatige representatie van alle exonen in de sequentie te verkrijgen. Verbeteringen in de data-analyse software tools voor snelle en accurate detectie van pathologische varianten zijn ook nodig. Uitgebreide exoomsequencing zal de implementatie van gespecialiseerde apparatuur vereisen en het inhuren van teams van specialisten met voldoende expertise om de sequenties te genereren en de verkregen gegevens te analyseren en te interpreteren.

Het gebruik van exoomsequencing voor diagnose zal ook de implementatie van technische richtsnoeren en voorschriften vereisen. Parameters zoals sequencing-diepte, exon-dekking, kwaliteitsmaatstaven voor nucleotide-sequentiegegevens, of alignment calling zullen moeten worden genormaliseerd. Ook de opslag van gegevens moet worden gereguleerd.

Er zijn ook een aantal complexe ethische vraagstukken. Een belangrijke kwestie houdt verband met de informatie die aan de patiënt moet worden verstrekt. Exoomsequencing kan genetische variaties aan het licht brengen die geen verband houden met de gediagnosticeerde ziekte. De patiënt kan genetische varianten vertonen die risicofactoren vertegenwoordigen of die de oorzaak van andere ziekten kunnen zijn. Welke informatie moet aan de patiënt worden teruggegeven? Welk bewijsmateriaal is nodig om een genetische variant als verband houdend met een ziekte te beschouwen? Eigendom, toegang en opslag van de gegevens zijn andere relevante kwesties. Moeten de gegenereerde gegevens worden bewaard voor eventueel toekomstig gebruik tijdens het leven van de patiënt? Deze en andere ethische overwegingen zullen waarschijnlijk tot aanzienlijke controverses leiden80 en een uitgebreide discussie vergen om overeenstemming te bereiken over de criteria die in de klinische praktijk moeten worden gebruikt.

Conclusie

Exome sequencing is nu al een krachtig instrument dat wordt gebruikt om de moleculaire basis van genetische ziekten te bepalen. De diepte van de genetische analyse is minder dan die van whole-genome sequencing omdat genetische variaties in niet-eiwitcoderende regio’s niet worden opgespoord. Het verminderde aantal sequenties en sequentie-analyses dat voor exoomsequencing vereist is, maakt het echter een meer betaalbare aanpak in de klinische praktijk. Daarom zal exoomsequencing waarschijnlijk de techniek bij uitstek zijn voor de initiële analyse van patiënten, althans totdat de prijs van whole-genome sequencing daalt en de aanzienlijke data-analyseprocedure wordt verbeterd. Een belangrijke beperking van de toepassing van exoom sequencing in de klinische praktijk is dat de functionele betekenis van de meeste van de verwachte genetische varianten nog onbekend is. Deze situatie verandert snel, aangezien een toenemend aantal ziektegeassocieerde genetische varianten wordt bepaald en in openbare gegevensbanken beschikbaar wordt gesteld. Het is aannemelijk dat binnen enkele jaren de meeste genetische variaties die verband houden met het risico een ziekte te krijgen, bekend zullen zijn, met nauwkeurige moleculaire diagnostiek, een voorspelling van de evolutie van de ziekte, en een farmacologische respons. De precieze kennis van het exoom, of genoom, van de patiënt zal dan een bepalende factor zijn in de medische praktijk.

Acknowledgments

Ik dank Rosario Perona en Juliette Siegfried (ServingEdit.com) hartelijk voor de kritische beoordeling van het manuscript.

Disclosure

De auteur meldt geen belangenconflicten bij dit werk.

Kuhlenbäumer G, Hullmann J, Appenzeller S. Novel genomic techniques open new avenues in the analysis of monogenic disorders. Hum Mutat. 2011;32(2):144-151.

Kiezun A, Garimella K, Do R, et al. Exome sequencing and the genetic basis of complex traits. Nat Genet. 2012;44(6):623-630.

Vogelstein B, Papadopoulos N, Velculescu VE, Zhou S, Diaz LA Jr, Kinzler KW. Cancer genome landscapes. Science. 2013;339(6127):1546-1558.

Kirwan M, Dokal I. Dyskeratosis congenita: een genetische aandoening met vele gezichten. Clin Genet. 2008;73(2):103-112.

Walne AJ, Dokal I. Vooruitgang in het begrijpen van dyskeratosis congenita. Br J Haematol. 2009;145(2):164-172.

Brady PD, Vermeesch JR. Genomische microarrays: een overzicht van de technologie. Prenat Diagn. 2012;32(4):336-343.

Hehir-Kwa JY, Pfundt R, Veltman JA, de Leeuw N. Pathogeen of niet? Assessing the clinical relevance of copy number variants. Clin Genet. 2013;84(5):415-421.

Simons A, Sikkema-Raddatz B, de Leeuw N, Konrad NC, Hastings RJ, Schoumans J. Genome-wide arrays in routine diagnostiek van hematologische maligniteiten. Hum Mutat. 2012;33(6):941-948.

Metzker ML. Sequencing-technologieën – de volgende generatie. Nat Rev Genet. 2010;11(1):31-46.

Sastre L. New DNA sequencing technologies open a promising era for cancer research and treatment. Clin Transl Oncol. 2011;13(5):301-306.

Lander ES, Linton LM, Birren B, et al. International Human Genome Sequencing Consortium. Eerste sequentiebepaling en analyse van het menselijk genoom. Nature. 2001;409(6822):860-921.

Abecasis GR, Auton A, Brooks LD, et al. 1000 Genomes Project Consortium. Een geïntegreerde kaart van genetische variatie van 1.092 menselijke genomen. Nature. 2012;491(7422):56-65.

Yang Y, Liu R, Xie H, et al. Advances in nanopore sequencing technology. J Nanosci Nanotechnol. 2013;13(7):4521-4538.

Chen YS, Lee CH, Hung MY, Pan HA, Chiou JC, Huang GS. DNA sequencing using electrical conductance measurements of a DNA polymerase. Nat Nanotechnol. 2013;8(6):452-458.

Lu ZX, Jiang P, Xing Y. Genetische variatie van pre-mRNA alternatieve splicing in menselijke populaties. Wiley Interdiscip Rev RNA. 2012;3(4):581-592.

Pruitt KD, Harrow J, Harte RA, et al. The consensus coding sequence (CCDS) project: Identification a common protein-coding gene set for the human and mouse genomes. Genome Res. 2009;19(7):1316-1323.

Harrow J, Frankish A, Gonzalez JM, et al. GENCODE: the reference human genome annotation for The ENCODE Project. Genome Res. 2012;22(9):1760-1774.

Teer JK, Mullikin JC. Exome sequencing: the sweet spot before whole genomes. Hum Mol Genet. 2010;19(R2):R145-R151.

Liu X, Wang J, Chen L. Whole-exome sequencing reveals recurrent somatic mutation networks in cancer. Cancer Lett. 2013;340(2):270-276.

Parla JS, Iossifov I, Grabill I, Spector MS, Kramer M, McCombie WR. Een vergelijkende analyse van het vastleggen van exomen. Genome Biol. 2011; 12(9):R97.

Sulonen AM, Ellonen P, Almusa H, et al. Comparison of solution-based exome capture methods for next generation sequencing. Genome Biol. 2011;12(9):R94.

Clark MJ, Chen R, Lam HY, et al. Prestatievergelijking van exoom-DNA-sequencingtechnologieën. Nat Biotechnol. 2011;29(10):908-914.

Gullapalli RR, Desai KV, Santana-Santos L, Kant JA, Becich MJ. Next generation sequencing in de klinische geneeskunde: Uitdagingen en lessen voor de pathologie en biomedische informatica. J Pathol Inform. 2012;3:40.

Samuels DC, Han L, Li J, et al. Finding the lost treasures in exome sequencing data. Trends Genet. 2013;29(10):593-599.

Taneri B, Asilmaz E, Gaasterland T. Biomedical impact of splicing mutations revealed through exome sequencing. Mol Med. 2012;18:314-319.

Fu W, O’Connor TD, Jun G, et al; NHLBI Exome Sequencing Project. Analyse van 6.515 exomen onthult de recente oorsprong van de meeste menselijke eiwitcoderende varianten. Nature. 2013;493(7431):216-220.

Marian AJ. Challenges in medical applications of whole exome/genome sequencing discoveries. Trends Cardiovasc Med. 2012;22(8):219-223.

Singleton AB. Exome sequencing: een transformatieve technologie. Lancet Neurol. 2011;10(10):942-946.

Vissers LE, de Ligt J, Gilissen C, et al. A de novo paradigm for mental retardation. Nat Genet. 2010;42(12):1109-1112.

Gonzalez-Perez A, Perez-Llamas C, Deu-Pons J, et al. IntOGen-mutations identifies cancer drivers across tumor types. Nat Methoden. 2013;10(11):1081-1082.

Bernstein BE, Birney E, Dunham I, Green ED, Gunter C, Snyder M; ENCODE Project Consortium. Een geïntegreerde encyclopedie van DNA-elementen in het menselijk genoom. Nature. 2012;489(7414):57-74.

Hardison RC. Genome-wide epigenetic data facilitate understanding of disease susceptibility association studies. J Biol Chem. 2012;287(37):30932-30940.

Weedon MN, Cebola I, Patch AM, et al. International Pancreatic Agenesis Consortium. Recessieve mutaties in een distale PTF1A enhancer veroorzaken geïsoleerde pancreatische agenese. Nat Genet. 2014;46(1):61-64.

Wang Z, Gerstein M, Snyder M. RNA-Seq: a revolutionary tool for transcriptomics. Nat Rev Genet. 2009;10(1):57-63.

Mutz KO, Heilkenbrinker A, Lönne M, Walter JG, Stahl F. Transcriptome analysis using next-generation sequencing. Curr Opin Biotechnol. 2013;24(1):22-30.

Hitzemann R, Bottomly D, Darakjian P, et al. Genes, behavior and next-generation RNA sequencing. Genen Hersenen Gedrag. 2013;12(1):1-12.

Costa V, Aprile M, Esposito R, Ciccodicola A. RNA-Seq and human complex diseases: recent accomplishments and future perspectives. Eur J Hum Genet. 2013;21(2):134-142.

Lappalainen T, Sammeth M, Friedländer MR, et al; Geuvadis Consortium; Geuvadis Consortium. Transcriptoom- en genoomsequencing brengt functionele variatie bij mensen aan het licht. Nature. 2013; 501(7468):506-511.

Slotkin W, Nishikura K. Adenosine-to-inosine RNA editing and human disease. Genome Med. 2013;5:105.

Lee TI, Young RA. Transcriptionele regulatie en de misregulatie ervan in ziekte. Cell. 2013;152(6):1237-1251.

Suvà ML, Riggi N, Bernstein BE. Epigenetische herprogrammering in kanker. Science. 2013;339(6127):1567-1570.

Li P, Demirci F, Mahalingam G, Demirci C, Nakano M, Meyers BC. Een geïntegreerde workflow voor DNA-methyleringsanalyse. J Genet Genomics. 2013;40(5):249-260.

Chibon F. Cancer gene expression signatures – the rise and fall? Eur J Cancer. 2013;49:2000-2009.

Dedeoğlu BG. High-throughput benaderingen voor microRNA expressie analyse. Methods Mol Biol. 2014;1107:91-103.

Ni T, Wu H, Song S, Jelley M, Zhu J. Selectieve genamplificatie voor high-throughput sequencing. Recent Pat DNA Gene Seq. 2009; 3(1):29-38.

Barretina J, Caponigro G, Stransky N, et al. The Cancer Cell Line Encyclopedia enables predictive modelling of anticancer drug sensitivity. Nature. 2012;483(7391):603-607.

Garnett MJ, Edelman EJ, Heidorn SJ, et al. Systematic identification of genomic markers of drug sensitivity in cancer cells. Nature. 2012;483(7391):570-575.

Hoischen A, Gilissen C, Arts P, et al. Massively parallel sequencing of ataxia genes after array-based enrichment. Hum Mutat. 2010;31(4):494-499.

Ng SB, Bigham AW, Buckingham KJ, et al. Exome sequencing identificeert MLL2-mutaties als een oorzaak van Kabuki syndroom. Nat Genet. 2010;42(9):790-793.

Hoischen A, van Bon BW, Gilissen C, et al. De novo mutaties van SETBP1 veroorzaken het Schinzel-Giedion syndroom. Nat Genet. 2010;42(6):483-485.

Edvardson S, Shaag A, Zenvirt S, et al. Joubert syndrome 2 (JBTS2) in Ashkenazi Jews is geassocieerd met een TMEM216 mutatie. Am J Hum Genet. 2010;86(1):93-97.

Krawitz PM, Schweiger MR, Rödelsperger C, et al. Identity-by-descent filtering of exome sequence data identifies PIGV mutations in hyperphosphatasia mental retardation syndrome. Nat Genet. 2010;42(10):827-829.

Bilgüvar K, Oztürk AK, Louvi A, et al. Whole-exome sequencing identifies recessive WDR62 mutations in severe brain malformations. Nature. 2010;467(7312):207-210.

Johnson JO, Mandrioli J, Benatar M, et al. ITALSGEN Consortium. Exoomsequencing onthult VCP-mutaties als oorzaak van familiaire ALS. Neuron. 2010;68(5):857-864.

Choi M, Scholl UI, Ji W, et al. Genetische diagnose door whole exome capture en massively parallel DNA sequencing. Proc Natl Acad Sci U S A. 2009;106(45):19096-19101.

Worthey EA, Mayer AN, Syverson GD, et al. Making a definitive diagnosis: successful clinical application of whole exome sequencing in a child with intractable inflammatory bowel disease. Genet Med. 2011;13(3):255-262.

Montenegro G, Powell E, Huang J, et al. Exome sequencing maakt snelle genidentificatie mogelijk in een Charcot-Marie-Tooth-familie. Ann Neurol. 2011;69(3):464-470.

Bonnefond A, Durand E, Sand O, et al. Moleculaire diagnose van neonatale diabetes mellitus met behulp van next-generation sequencing van het volledige exoom. PLoS One. 2010;5(10):e13630.

Johnson JO, Gibbs JR, Van Maldergem L, Houlden H, Singleton AB. Exome sequencing in Brown-Vialetto-van Laere syndrome. Am J Hum Genet. 2010;87(4):567-9; author reply 569.

Bras JM, Singleton AB. Exome sequencing bij de ziekte van Parkinson. Clin Genet. 2011;80(2):104-109.

Topper S, Ober C, Das S. Exome sequencing and the genetics of intellectual disability. Clin Genet. 2011;80(2):117-126.

Corder EH, Saunders AM, Strittmatter WJ, et al. Genendosis van apolipoproteïne E type 4 allel en het risico van de ziekte van Alzheimer in late onset families. Science. 1993;261(5123):921-923.

Klein RJ, Zeiss C, Chew EY, et al. Complement factor H polymorfisme in leeftijdsgebonden maculaire degeneratie. Science. 2005;308(5720):385-389.

Tan EK. Identificatie van een gemeenschappelijke genetische risicovariant (LRRK2 Gly2385Arg) bij de ziekte van Parkinson. Ann Acad Med Singapore. 2006;35(11):840-842.

Libioulle C, Louis E, Hansoul S, et al. Novel Crohn disease locus identified by genome-wide association maps to a gene desert on 5p13.1 and modulates expression of PTGER4. PLoS Genet. 2007;3(4):e58.

Stephens PJ, Greenman CD, Fu B, et al. Massive genomic rearrangement acquired in a single catastrophic event during cancer development. Cell. 2011;144(1):27-40.

Jones S, Zhang X, Parsons DW, et al. Core signaling pathways in human pancreatic cancers revealed by global genomic analyses. Science. 2008;321(5897):1801-1806.

Parsons DW, Jones S, Zhang X, et al. An integrated genomic analysis of human glioblastoma multiforme. Science. 2008;321(5897):1807-1812.

Timmermann B, Kerick M, Roehr C, et al. Somatische mutatieprofielen van MSI- en MSS-kanker van de dikke darm die zijn geïdentificeerd door middel van next generation sequencing van het volledige genoom en bioinformatica-analyse. PLoS One. 2010;5(12):e15661.

Varela I, Tarpey P, Raine K, et al. Exome sequencing identificeert frequente mutatie van het SWI/SNF complex gen PBRM1 in niercarcinoom. Nature. 2011;469(7331):539-542.

Ku CS, Cooper DN, Roukos DH. Clinical relevance of cancer genome sequencing. World J Gastroenterol. 2013;19(13):2011–2018.

Kilpivaara O, Aaltonen LA. Diagnostic cancer genome sequencing and the contribution of germline variants. Science. 2013;339(6127):1559-1562.

Hudson TJ, Anderson W, Artez A, et al; International Cancer Genome Consortium. Internationaal netwerk van kankergenoomprojecten. Nature. 2010;464(7291):993-998.

Gerlinger M, Rowan AJ, Horswell S, et al. Intratumor heterogeneity and branched evolution revealed by multiregion sequencing. N Engl J Med. 2012;366(10):883-892.

Ren SC, Qu M, Sun YH. Investigating intratumor heterogeneity by single-cell sequencing. Asian J Androl. 2013;15(6):729-734.

Hieronymus H, Sawyers CL. Traversing the genomic landscape of prostate cancer from diagnosis to death. Nat Genet. 2012;44(6):613-614.

McLeod HL. Cancer pharmacogenomics: vroege belofte, maar gezamenlijke inspanning nodig. Science. 2013;339(6127):1563-1566.

Abaan OD, Polley EC, Davis SR, et al. The exomes of the NCI-60 panel: a genomic resource for cancer biology and systems pharmacology. Cancer Res. 2013;73(14):4372-4382.

Weinstein JN. Ontdekking van geneesmiddelen: Cellijnen gaan de strijd aan met kanker. Nature. 2012;483:544-545.

Shahmirzadi L, Chao EC, Palmaer E, Parra MC, Tang S, Gonzalez KD. Patient decisions for disclosure of secondary findings among the first 200 individuals undergoing clinical diagnostic exome sequencing. Genet Med. Epub October 10, 2013.

Flicek P, Amode MR, Barrell D, et al. Ensembl 2011. Nucleic Acids Res. 2011;39:D800-D806.

Pruitt KD, Tatusova T, Klimke W, Maglott DR. NCBI Reference Sequences: huidige status, beleid en nieuwe initiatieven. Nucleic Acids Res. 2009;37:D32-D36.

Geef een antwoord

Het e-mailadres wordt niet gepubliceerd.