Introduktion

Flera sjukdomar har en genetisk grund. Vissa är följden av att ett visst protein saknas eller fungerar dåligt på grund av mutationer i den kodande genen. Detta är fallet med sjukdomar med mendelsk nedärvning, såsom Huntingtons sjukdom, thalassemi och cirka 1 000 andra ärftliga sällsynta sjukdomar.1 Många sjukdomar har en genetisk grund, även om de inte uteslutande beror på mutationer i en enskild gen, och ett ökande antal genetiska varianter och polymorfismer identifieras som riskfaktorer för komplexa sjukdomar.2 Cancer är en genetisk sjukdom som orsakas av mutationer i en eller flera gener som antingen ökar risken för cancer (t.ex. könslinjemutationer), eller som främjar cancer (onkogener), eller som försämrar de cellulära mekanismerna som kontrollerar cellproliferation (suppressorgener), vilket sker med somatiska mutationer.3

Identifieringen av den genetiska grunden för dessa sjukdomar har varit ett arbetskrävande och utmanande projekt, fram till för ett par år sedan. Dessa projekt inleddes ofta med identifiering av en genomregion som eventuellt är involverad i överföringen av sjukdomen genom genetiska associationsstudier.1 Analys av stora familjer med flera drabbade medlemmar krävs vanligtvis för att definiera en genomregion som är starkt relaterad till överföringen av sjukdomen. I allmänhet innehåller denna region flera gener som måste sekvenseras för att identifiera en genmutation som förekommer hos alla drabbade individer och inte hos deras friska släktingar, i händelse av dominant nedärvning. Vid recessiv överföring ska mutationen finnas i båda allelerna hos de drabbade medlemmarna och i en, eller ingen, av allelerna hos de opåverkade släktingarna.

Diagnostisering av genetiska sjukdomar var, och är i de flesta fall fortfarande, lika mödosam. I bästa fall kan sjukdomen ha sitt ursprung i en mutation i endast en gen. Diagnosen skulle kräva att man fastställer nukleotidsekvensen för endast den genen. Vanligtvis amplifieras genen i flera fragment genom polymeraskedjereaktioner och nukleotidsekvensen för varje fragment bestäms. Ofta kan sjukdomen orsakas av mutationer i någon av flera gener, och alla måste amplifieras och sekvenseras för att man ska kunna hitta det genetiska ursprunget till sjukdomen hos de drabbade patienterna. Vid dyskeratosis congenita kan till exempel mutationer hittas i någon av generna dkc, tert, terc, NOP10, NH2 eller TINF2, och antalet drabbade gener kan vara ännu större eftersom det finns en fraktion av patienter hos vilka den orsakande mutationen inte har identifierats.4,5 Nukleotidsekvensen för alla dessa gener måste bestämmas för den molekylära diagnosen av varje patient. Vi finner flera muterade gener i olika typer av cancer.3 Den molekylära diagnosen kräver att nukleotidsekvensen för flera av dessa gener bestäms. För närvarande är detta en mödosam och dyr process som inte kan användas för en stor patientpopulation. I praktiken sekvenseras endast ett fåtal gener som är muterade hos en betydande andel av de patienter som drabbas av vissa cancertyper för diagnos och behandling.

Det är först under de senaste åren som man har utvecklat tekniker för samtidig upptäckt av flera sekvensvarianter i ett visst prov. Många av dem är baserade på mikroarrayteknik för desoxyribonukleinsyra (DNA). I genotypningsarrayerna prickas oligonukleotider som innehåller de aktivt identifierade mutationer som är relaterade till en viss sjukdom på ett objektglas. Patientens DNA-prov läggs ovanpå objektglaset och de hybridiserande oligonukleotiderna identifieras. Miljontals kända mutationer kan testas i en enda mikroarrayhybridisering.6 Variationer i antalet kopior kan också analyseras med hjälp av DNA-mikroarrays som är utformade för att upptäcka förekomsten av DNA-regioner som är duplicerade eller borttagna i patientens DNA.7 Dessa tekniker används ofta inom medicinsk forskning och för klinisk diagnostik.8

Ett stort steg inom den molekylära medicinen har emellertid varit den senaste utvecklingen av massiv sekvenseringsteknik som gör det möjligt att bestämma nukleotidsekvensen i en patients DNA på kort tid och till ett överkomligt pris.9,10 Dessa metoder har använts sedan 2005 och bygger på samtidig bestämning av nukleotidsekvensen i miljontals DNA-fragment. De har benämnts som andra generationens sekvensering, nästa generations sekvensering, djup sekvensering eller massivt parallell sekvensering. Tusentals miljoner miljoner nukleotidsekvenser bestäms på högst två veckor med hjälp av dessa maskiner. Som ett exempel på kapaciteten hos dessa nya sekvenseringssystem kan man notera att milstolpen sekvensering av det första mänskliga genomet, som offentliggjordes 200111 , krävde ett samordnat arbete av 23 laboratorier, vilket tog 13 år, med en total kostnad på cirka 3 miljarder US-dollar. Med de nya metoderna tar sekvenseringen av ett mänskligt genom ett laboratorium och cirka 2 veckor, med en uppskattad kostnad på 4 000 US-dollar.

Tillgången till moderna sekvenseringsmetoder ger upphov till en exponentiell ökning av vår kunskap om det mänskliga genomet, variabiliteten mellan individer och identifiering av genetiska varianter i sjukdomar. Dessa metoder ligger till exempel till grund för ett pågående 1000 Genomes-projekt12 som syftar till att bestämma den fullständiga nukleotidsekvensen hos cirka 1 000 personer med olika geografiskt och etniskt ursprung för att fastställa den genomsnittliga sekvensvariationen mellan individer och identifiera de mest frekventa polymorfismerna.

Massiva sekvenseringstekniker utvecklas för närvarande i snabb takt. Mindre och snabbare maskiner utvecklas och nya sekvenseringsmetoder introduceras. Ett viktigt mål är till exempel att sekvensera en enda DNA-molekyl från en enskild cell.13,14 Bortsett från de tekniska utmaningarna minskar framstegen stadigt priset på DNA-sekvensering så att målet att sekvensera ett enskilt mänskligt genom för 1 000 US-dollar verkar vara inom räckhåll inom några år. För närvarande är det komplicerat, dyrt och tidskrävande att sekvensera ett helt mänskligt genom och analysera alla sekvensdata som genereras, och många studier utförs på en mindre del av genomet. Särskilt mycket uppmärksamhet ägnas för närvarande åt sekvensering av den proteinkodande delen av genomet, som kallas exomet. Exomsekvensering är mycket billigare än sekvensering av hela genomet, och möjligheterna, fördelarna och begränsningarna med denna teknik kommer att diskuteras i denna översikt.

Vad är ett exom?

Nästan alla mänskliga proteinkodande gener har en diskontinuerlig struktur. Den proteinkodande regionen är uppdelad i flera delar som kallas exoner. Exonerna är sammankopplade med icke-proteinkodande DNA-fragment, eller introner, som schematiskt visas i figur 1. Generna transkriberas från promotorregionen under kontroll av flera regulatoriska regioner, som finns på olika platser i förhållande till genen, uppströms, nedströms eller till och med inuti genen. Transkriptionen skapar ett primärt transkript som innehåller exoner och introner. Efterföljande ribonukleinsyra (RNA)-spliceringsprocesser raderar intronerna och förenar exonerna för att generera det mogna messenger RNA (mRNA) som endast innehåller en kontinuerlig proteinkodande region. Nya studier visar att de primära transkriptionerna av de flesta gener kan splicas på flera olika sätt, vilket ger upphov till olika mogna mRNA som innehåller specifika kombinationer av exoner, så kallade alternativa splicingvarianter (figur 1). Dessa mRNA kodar för proteinisoformer som har vissa gemensamma regioner, men som också skiljer sig från andra, beroende på vilka exoner som ingår.15

En analys av den mänskliga arvsmassan har visat att de proteinkodande generna utgör en liten del av DNA:t, endast cirka 3 %.16 Exonerna utgör en ännu mindre del, 1 % av arvsmassan.16 En sammanfattning av dessa uppgifter visas i tabell 1. Det mänskliga genomet består av 3,3 ×109 baspar (bp) och innehåller 20 078 proteinkodande gener.17 Varje gen är uppdelad i ett genomsnittligt antal åtta exoner, var och en cirka 170 bp lång. Alla exoner som helhet innehåller cirka 3 ×107 bp. Sekvensering av alla exoner ger dock samma information om aminosyrasekvensen hos de kodade proteinerna som sekvensering av hela genomet, med undantag för mutationer som ändrar mRNA-splicing, vilket kommer att diskuteras i avsnittet Exomsekvensering och dataanalys. Detta system med sekvensering av alla exoner har fått namnet exomsekvensering och har blivit en giltig metod för att upptäcka variationer i aminosyrasekvensen hos alla mänskliga proteiner18 . Den mycket markanta storleksskillnaden gör exomsekvensering mycket billigare än genomsekvensering, vilket underlättar beräkningsmässiga och funktionella analyser av de sekvensdata som genereras.

Figur 1 Schematisk framställning av geners uppbyggnad och uttryck.
Anteckningar: Proteinkodande gener består av exoner som innehåller proteinkodande information (rutor), åtskilda av icke-kodande introner (linjer). Grå rutor anger exonproteinkodande regioner och vita rutor anger mRNA:s 5′ och 3′ otranslaterade regioner. Generna transkriberas från promotorområdena, omedelbart uppströms exon 1. Transkriptionens startpunkt anges med en pil. Genuttrycket styrs av ett antal TR-regioner som kan ligga uppströms eller nedströms från genen, på varierande avstånd eller inuti genen (oftast i introner). Stabiliteten och översättningen av mRNA kan regleras genom att mikroRNA binder till specifika platser i den 3′ otranslaterade regionen (anges med asterisker). Generna transkriberas till primära RNA som innehåller introner och exoner. Efterföljande splicingprocesser eliminerar intronerna för att generera mogna mRNA:er. Alternativa splicingprocesser kan ge upphov till olika mRNA, beroende på vilka exoner de innehåller (mRNA1, mRNA2), som kodar för olika proteinisoformer.
Abkortningar: TR, transkriptionsreglerande region; RNA, ribonukleinsyra; mRNA, budbärarribonukleinsyra.

Tabell 1 Allmänna kännetecken för människans genom och exom

Tekniker för fångst av exom

Det första och mest kritiska steget vid sekvensering av exom är isolering eller fångst av exoner. De metoder som används är baserade på DNA-hybridisering. Analysen av det mänskliga genomet har gjort det möjligt att identifiera alla genens exoner och underlättar utformningen av oligonukleotidprober som är specifika för var och en av dem. Proberna används för att rena exonerna från DNA:t.19 Fragmentering av DNA:t i bitar som inte är större än 500 bp är det första steget. DNA:t hybridiseras sedan till de exonspecifika oligonukleotidproberna och de hybridiserade fragmenten renas. Hybridiseringen kan utföras i vätskefas. I detta fall märks oligonukleotiderna så att DNA-oligonukletidkomplex kan separeras från huvuddelen av icke-hybridiserat DNA. I ett vanligt exempel är oligonukleotider kovalent bundna till biotin så att DNA-oligonukleotidhybrider kan isoleras med hjälp av den biotinbindande molekylen, streptavidin, kopplad till magnetpärlor. DNA-fragment som inte innehåller exoner kommer inte att binda till streptavidinpärlorna och kan avlägsnas effektivt efter flera tvättsteg. De fragment som innehåller exoner och som är bundna till pärlorna kan återvinnas efter dissociation av DNA-oligonukleotidhybriderna under förhållanden med låg jonisk styrka.

Exoner kan också isoleras genom hybridisering till ett fast underlag där de exonspecifika oligonukleotiderna har spottats, som med DNA-mikroarrays. I detta fall sprids det fragmenterade DNA:t över oligonukleotiderna för att möjliggöra hybridisering. Senare tvättas icke-hybridiserat DNA bort och det exonberikade DNA:t elueras under lågjoniska förhållanden.

Flera kommersiella leverantörer erbjuder kit för exomisolering med hjälp av hybridiseringsprotokoll i vätskefas, däribland Agilent Technologies (Santa Clara, CA, USA), Roche NimbelGen, Inc. (Madison, WI, USA), Illumina, Inc. (San Diego, CA, USA) och Life Technologies (Carlsbad, CA, USA). Dessa kit gör det möjligt att isolera över 90 % av exonerna i genomet, med över 90 % specificitet och till ett ungefärligt pris av 150 US-dollar per exom. Flera författare har jämfört dessa plattformar för exomfångst,20-22 och de uppgifter som Clark et al22 har erhållit genom att jämföra SureSelect Human All Exon 50 Mb (Agilent Technologies), Roche NimbleGen, Inc.’s SeqCap EZ Exome Library v2.0 och Illumina, Inc.’s TruSeq Exome Enrichment kit sammanfattas i tabell 2. Vissa av dessa kit täcker de otranslaterade regionerna av mRNA, utöver de proteinkodande regionerna, vilket gör det möjligt att analysera regulatoriska regioner, t.ex. bindningsställen för mikroRNA (miRNA). Genom att inkludera de 5′ otranslaterade regionerna är det också möjligt att analysera de proximala promotorregionerna.22 Dessutom täcker de flesta kit upp till 80 % av de miRNA-kodande regionerna.21 Nyligen har förbättrade kit utvecklats av dessa och andra leverantörer, så att de uppgifter som visas i tabell 2 endast bör betraktas som en indikation. Det är viktigt att notera att exonrening är ett kritiskt steg. Det är svårt att återvinna 100 % av exonerna, och exonerna går ofta förlorade eller är underrepresenterade i det isolerade exomet. Om t.ex. en patients exom analyseras och 10 % av exonerna går förlorade under reningen, är sannolikheten för att en relevant mutation saknas ca 10 % på grund av detta tekniska fel. Därför är användningen av mycket effektiva förfaranden för exonfångst av avgörande betydelse vid exomsekvensering.

Tabell 2 Jämförelse av tre stora exomfångstplattformar
Anteckningar: aFör jämförelse av databaserna Ensemble81 respektive RefSeq82; bProcentuell andel av de utvalda regionerna som sekvenseras av varje plattform minst tio gånger efter analyserna av 80 mega reads av DNA-sekvensen. Agilent Technologies (Santa Clara, CA, USA), Roche NimbelGen, Inc. (Madison, WI, USA), Illumina, Inc. (San Diego, CA, USA).
Abkortningar: mRNA, messenger ribonukleinsyra; miRNA, mikro ribonukleinsyra; DNA, desoxyribonukleinsyra.

Exomsekvensering och dataanalys

Exon-innehållande fragment sekvenseras med hjälp av något av de system eller tekniker för massiv sekvenseringsutrustning som för närvarande finns tillgängliga. Som nämns i inledningen bestämmer dessa plattformar nukleotidsekvensen för miljontals DNA-fragment samtidigt. Den bestämda längden på sekvensen för varje fragment vid exomsekvensering är inte lång, vanligtvis mellan 35 bp och 100 bp. Men eftersom DNA ursprungligen fragmenterades slumpmässigt kommer varje enskild nukleotid att finnas i många överlappande fragment. Om ett tillräckligt stort antal sekvenser erhålls, även om de är korta, kommer varje bas att sekvenseras oberoende av varandra i flera DNA-fragment. Antalet gånger som varje bas sekvenseras kallas täckning eller sekvenseringsdjup. Täckningen är direkt relaterad till kvaliteten på och förtroendet för den genererade nukleotidsekvensen. I allmänhet anses en täckning på 20×-30× vara nödvändig för att få tillförlitliga resultat vid exomsekvensering.59 Detta sekvenseringsdjup innebär att en möjlig sekvensvariation skulle ha sekvenserats oberoende av varandra i 20-30 olika DNA-fragment.

Dataanalysen är det sista steget i exomsekvenseringsprojekt (figur 2). Som nämnts ovan genereras data från miljontals sekvenser, och analyserna av dem kräver specifika och komplexa datorprogram och expertis.19,23 Ett inledande steg är en analys av kvaliteten på den genererade sekvensen. Noggrannheten i sekvensavläsningen vid olika sekvenslängder, den genomsnittliga längden på avläsningarna samt andra parametrar testas. Om kvaliteten är tillräckligt bra jämförs varje sekvens med en referenssekvens, som vanligtvis är den senast tillgängliga versionen av den mänskliga genomsekvensen. Vanligtvis kan över 80 % av de genererade sekvenserna anpassas till referensgenomet.22 Detta steg tillåter en liten grad av nukleotidvariation i förhållande till referensgenomet. Nästa steg i analysen är att identifiera sekvensvariationer mellan referenssekvensen och den exomsekvens som erhållits i vår studie. De efterföljande analyserna av dessa varianter kan ge önskad information om det medicinska problem som studeras.

Figur 2 Analys av exomsekvenseringsdata.
Anteckningar: De steg som krävs för exomisolering, sekvensering och dataanalys är schematiskt framställda. Denna process driver identifieringen av genvarianter som är involverade i sjukdomarnas uppkomst (drivgener) eller som på annat sätt är relaterade till sjukdomens mottaglighet, utveckling eller läkemedelsrespons. Dessa uppgifter ger värdefull information för diagnos och prognos, för genetisk rådgivning och för utformning av personliga behandlingar.
Abkortning: DNA, deoxyribonukleinsyra.

Exomsekvensering kan upptäcka flera typer av genetiska variationer. En av de vanligaste skillnaderna är en förändring av en nukleotid till en annan, till exempel A för G (ATA-kodon till ATG). Dessa variationer kallas single nucleotide variants (SNV), även om de betraktas som single nucleotide polymorphisms (SNP) när deras frekvens i befolkningen är större än 1-5 % och det inte finns någon stark effekt på risken för någon sjukdom. De flesta SNV:er är tysta, eller kallas också synonyma, eftersom båda sekvensvarianterna kodar för samma aminosyra (t.ex. en variation från GCA till GCC, eftersom båda är alaninkodoner). De flesta av dessa polymorfismer utgör ingen skillnad för det kodade proteinet, är inte föremål för evolutionärt urval och utgör de vanligaste variationerna i det mänskliga exomet. Undantaget är vissa tysta mutationer som påverkar splicing-regulatoriska signaler, eller till och med transkriptionsreglerande platser, och som ändrar mRNA-splicing eller -uttryck även om de inte ändrar de kodade aminosyrorna. I andra fall har nukleotidvariationen en konsekvens i det kodade proteinet och dessa är icke-silenta eller icke-synonyma varianter. Dessa förändringar kan resultera i variationer i den kodade aminosyran (till exempel ändrar GAT till GAG asparaginsyra till glutaminsyra) och kallas missense-mutationer. Mer drastiska förändringar uppstår när nukleotidvariationen skapar en översättningsstoppkodon (t.ex. TGC till TGA ändrar en cysteinkodon till en stoppkodon), vilket kallas för en nonsensmutation. Det finns också en typ av SNV som kan upptäckas genom exomsekvensering även om den inte påverkar proteinkodonerna. Eftersom exoner väljs ut efter slumpmässig fragmentering av DNA kan de också innehålla sammanhängande DNA-regioner, inklusive angränsande intronsekvenser och till och med genpromotorer om otranslaterade regioner fångades in.24 Intronregioner innehåller de reglerande signaler som krävs för mRNA-splicing. SNV:er i dessa regioner kan förändra splicingen på olika sätt.15 Till exempel kan det påverkade intronet behållas i det mogna mRNA:t, eller så kan det angränsande exonet splicas ut (exon skipping). Dessa förändringar ändrar nukleotidsekvensen i det mogna mRNA:t och därmed det kodade proteinet nedströms från SNV:t.25 Exomsekvensering kan också upptäcka sekvensvariationer på grund av små insättningar eller deletioner (indels).22 Dessa variationer kan resultera i en ramförskjutning, utom när de påverkar tre eller en multipel av tre nukleotider. I det fallet skulle små deletioner eller insättningar av aminosyror produceras.

Identifiering av orsakande mutationer

Den funktionella relevansen av de sekvensvarianter som upptäcks måste bestämmas i nästa dataanalyssteg. Även om alla människor är nästan identiska ur genetisk synvinkel är antalet nukleotidsekvensskillnader mellan individer betydande.26 Denna heterogenitet försvårar tolkningen av de data som erhållits i enskilda sekvenseringsprojekt. Några allmänna uppgifter om individuella sekvensvariationer visas i tabell 3. När man betraktar hela genomet har antalet sekvensskillnader mellan individer uppskattats till 4 × 106, enligt de uppgifter som erhållits i 1000 Genomes Project och mindre projekt för sekvensering av hela genomet.27 Exomer uppvisar ett mindre, men fortfarande betydande, antal sekvensvariationer, som uppgår till cirka 20 000-25 000 mellan två obesläktade individer.27,28 De flesta av dessa genetiska variationer är tysta, vilket diskuterats tidigare. Antalet icke-stumma sekvensskillnader mellan individer har uppskattats till 10 000. De flesta av dessa varianter finns i den allmänna befolkningen och överförs i generationer. Det har uppskattats att mindre än en icke-silent SNV uppträder de novo hos varje individ.29

Data som erhålls i exomsekvenseringsprojekt filtreras ofta för att identifiera alla SNP:er som finns hos andra individer och som därför inte är relaterade till den sjukdom som undersöks.2,19,23 Denna process kan göras genom att jämföra med offentliga databaser där de SNP:er som hittas i sekvenseringsprojekten är sammanställda. En invändning som måste beaktas är att alla stora databaser innehåller ett antal bevisade mutationer som orsakar relativt vanliga sjukdomar. Ungefär 400-700 nya och eventuellt relevanta SNV kvarstår efter detta filtreringssteg (tabell 3).28 Nästa utmaning är att fastställa vilka av de SNV som inte förekommer i den globala populationen, om några, som ligger till grund för den sjukdom som studeras. Många av de observerade skillnaderna kommer inte att vara förknippade med någon incidens av sjukdomen, och dessa kallas passagerarförändringar.23 Däremot kan en eller ett fåtal förändringar ha en orsakande roll och de kallas drivande förändringar. Det tillvägagångssätt som används för att identifiera dessa drivande förändringar beror på de särskilda omständigheterna i studien. Vid sjukdomar med ett mendelskt arvsmönster är det vanligtvis nödvändigt att analysera ett antal drabbade och icke drabbade individer för att hitta genvarianter som är perfekt segregerade med sjukdomen. Denna jämförelse är mer informativ i stora familjer med väl karakteriserade stamtavlor. I avsaknad av tillräckligt stora drabbade familjer gör jämförelsen av ett antal obesläktade patienter och kontroller det också möjligt att identifiera drivgener. Ytterligare kriterier används för att välja ut möjliga SNV:er som är relaterade till sjukdomen, bland annat in silico-algoritmer som förutsäger den muterade aminosyrans eventuella betydelse på grundval av evolutionärt bevarande och på grundval av den förutspådda effekten på proteinets struktur och funktion. Den förutspådda funktionen hos det muterade proteinet och dess vävnadsspecifika uttrycksmönster är också kriterier som används för att välja ut förmodat orsakande mutationer.

Tabell 3 Sammanfattning av sekvensvariationen bland individer

Några exempel på denna typ av studier kommer att ges i ett senare avsnitt. I takt med att fler studier genomförs identifieras dock fler genvariationer som orsak till ärftliga sjukdomar, vilket gör det troligt att en del av de gener som muterats hos patienten redan skulle ha beskrivits. Dessa muterade gener kan hittas i litteraturen och i specialiserade databaser som Online Mendelian Inheritance in Man-databasen (http://www.omim.org). Den eventuella relevansen av de mutationer som hittats i olika gener kan också sökas på sidan Genome Ensemble (http://www.ensembl.org/) om de har beskrivits tidigare.

Cancer är troligen den mest utbredda gruppen av sjukdomar som har en genetisk grund. Många studier har inriktats på att fastställa drivgener för olika typer av cancer.30 Den framväxande gruppen av drivgener för cancer kan konsulteras i databaser som Catalogue of Somatic Mutations In Cancer (COSMIC; http://cancer.sanger.ac.uk) eller The Cancer Genome Atlas (http://cancergenome.nih.gov/). Flera mer detaljerade exempel kommer att visas i avsnittet Exempel på klinisk användning av exomsekvensering.

Bjämförelse av exomsekvensering med andra massiva sekvenseringsmetoder

Genomsekvensering

Som nämndes i inledningen blir sekvensering av hela människans arvsmassa mer och mer överkomligt. Jämfört med exomsekvensering är sekvensering av hela genomet ett mycket mer komplicerat alternativ. Antalet sekvenseringsreaktioner som måste utföras är mycket högre, liksom antalet nukleotidsekvensdata som genereras. Den beräkningsmässiga analysen ökar kraftigt. Dessutom hittas många fler genetiska varianter, vilket framgår av tabell 3, vilket gör det svårare att identifiera drivgener. Genomsekvensering ger dock en fullständig bild av de genetiska förändringar som finns hos patienten, inklusive stora omorganiseringar av genomet. Kortläst sekvensering av ett genom på måttligt djup kommer dock att missa strukturella variationer, särskilt i regioner med låg komplexitet. Denna information sammanfattas i tabell 4, där exomsekvensering jämförs med andra sekvenseringsmetoder.

Som tidigare nämnts utgör de proteinkodande generna endast 3 % av genomet.16 Fram till nyligen ansågs resten av genomet vara ”bulk-DNA” utan något större informationsvärde. Nyligen genomförda studier har dock helt ändrat denna synpunkt. I ett stort projekt som omfattar hela genomet studeras funktionen hos alla regioner i genomet, ENCODE-projektet (Encyclopedia of DNA Elements).31 De nu tillgängliga resultaten visar att över 70 % av genomet är transkriberat. Många av de transkript som genereras kodar inte för proteiner, men de verkar ha en reglerande roll i genuttrycket. Bland dem finns de redan kända miRNA:erna, som reglerar mRNA:s stabilitet och översättning (figur 1), men också över 20 000 långa icke-kodande RNA:er som reglerar transkriptionen. Dessutom har många DNA-regioner som reglerar genuttryck identifierats, inklusive många tidigare okända promotor- och transkriptionsreglerande regioner (figur 1). Denna information är av klinisk relevans eftersom mutationer i regulatoriska regioner kan påverka uttrycket av specifika gener och kan få patologiska resultat. Faktum är att en stor andel av genomövergripande associationsstudier har relaterat DNA-regioner, där inga proteinkodande mutationer har hittats, till patologiska tillstånd.32 De data som genererats inom ENCODE-projektet har gjort det möjligt att revidera vissa fall, där man funnit att mutationer i reglerande regioner för genuttryck är ansvariga för sjukdomen.31,32 I ett aktuellt exempel rapporterade också Weedon et al33 att mutationer i en transkriptionsspecifik reglerande region i PTF1A-genen orsakar isolerad pancreas agenesi. Mutationer i regulatoriska regioner kan inte upptäckas genom exomsekvensering eftersom de inte påverkar det kodade proteinet, utan i stället dess uttryck. Därför ger helgenomsekvensering mer information än exomsekvensering på bekostnad av ökad komplexitet och ekonomisk kostnad.

Tabell 4 Jämförelse av massiva sekvenseringstekniker
Förkortningar: RNA, ribonukleinsyra; DNA, desoxyribonukleinsyra.

RNA-sekvensering

RNA-sekvenseringstekniker består av omvandling av RNA-populationer till komplementärt DNA (cDNA) genom omvänd transkription och efterföljande sekvensering av dessa.34,35 Vid sekvensering av mRNA omvandlas hela populationen av mRNA som uttrycks i en cellinje eller ett vävnadsprov (det så kallade transkriptomet) till cDNA och sekvenseras. Processen för mRNA-sekvensering ger information om nukleotidsekvensen hos de gener som transkriberas i det analyserade provet och därmed om aminosyrasekvensen hos motsvarande proteiner. Dessutom kan antalet genererade sekvenser för varje mRNA uppskattas och står i proportion till dess abundans. Därför kan genuttrycksnivåerna bestämmas och jämföras med andra prover, inklusive eventuella kontrollprover (tabell 4). En annan specifik fördel med sekvensering av mRNA är att den gör det möjligt att studera alternativa splicinghändelser.36,37 Som tidigare nämnts bearbetas primära transkript ofta på flera olika sätt för att ge upphov till mRNA som innehåller olika exoner (figur 1). Dessa mRNA kan identifieras genom mRNA-sekvensering och inte genom exom- eller genomsekvensering, som bestämmer sekvenseringen av det DNA som transkriberas och inte sekvenseringen av det mogna transkriptet. Annars ger mRNA- och exomsekvensering liknande information om den proteinkodande regionen i genomet. Skillnaden är att exomsekvensering omfattar alla gener och mRNA-sekvensering är begränsad till de gener som uttrycks i det analyserade provet. I en nyligen genomförd studie av mRNA-sekvensering av lymfoblastoida cellinjer från 462 individer fastställdes till exempel den kodande sekvensen för cirka 13 000 gener av de 20 078 mänskliga generna.38 I det här exemplet undersöktes inte cirka 7 000 gener eftersom de inte uttrycktes i lymfoblastoida cellinjer. I de fall där den celltyp eller vävnad som påverkas av en viss sjukdom är väl känd skulle mRNA-sekvensering dock vara likvärdig med exomsekvensering för att studera drivande mutationer. En annan egenskap hos mRNA-sekvensering är att den gör det möjligt att upptäcka sekvensvariationer som produceras av RNA-redigering.39 Ett antal mRNA bearbetas så att vissa nukleotider ändras, och förändringar från adenosin till inosin är de mest frekventa som produceras. Dessa förändringar upptäcks genom mRNA-sekvensering, men om de produceras av RNA-redigering eller som en följd av genomiska variationer kan inte bestämmas om inte både mRNA- och genomiska sekvenser jämförs.

Det kan vara mycket praktiskt att bestämma mRNA-uttrycksnivåer i vissa fall, eftersom vissa sjukdomar kan orsakas av ett oreglerat uttryck av en eller flera gener. Förändringar i uttrycksnivåer kan vara mycket informativa om sjukdomens genetiska ursprung. Exempelvis kan förändringar i uttrycket av en eller flera gener hos en patient tyda på en dysfunktion i de mekanismer som reglerar deras uttryck. Denna dysfunktion kan bero på mutationer i genernas reglerande regioner för transkription, vilket diskuteras i avsnittet om genomsekvensering. Det kan också bero på förändringar i uttrycket eller strukturen hos transkriptionsreglerande faktorer.40 Förändringar i genuttrycket beror ofta på förändringar i epigenetiska mekanismer för reglering av genuttrycket, t.ex. DNA-metylering, som inte kan detekteras med hjälp av genom- eller exomsekvensering.41 Metoder för att studera metylering i hela genomet som gör det möjligt att i detalj studera denna epigenetiska information har nyligen utvecklats.42 Cancer är en av de sjukdomar på vilka fler studier av genuttrycksnivåerna har utförts. I ett ökande antal fall är förändringar i uttrycket av gener eller en grupp av gener relaterade till en cancerdiagnos, prognos eller en förutsägelse av svaret på cancerläkemedel.43 Dessa förändringar i genuttrycket används som biomarkörer. Många av dessa studier är tillgängliga via databasen Cancer Genome Anatomy Project (http://cgap.nci.nih.gov).

En särskild typ av RNA-sekvenseringsprojekt syftar till att bestämma nukleotidsekvensen och uttrycksnivåerna för små reglerande RNA (miRNA). Små RNA reglerar uttrycket av andra gener genom att bestämma stabiliteten och/eller översättningen av deras mRNA (figur 1). Förändringar i miRNA-uttrycksmönstren kan därför ha en tydlig inverkan på proteinuttrycksprofilen i celler och vävnader. Protokoll har utvecklats för rening och sekvensering av hela populationen av miRNA i ett givet prov och för att bestämma deras uttrycksnivåer.44 De flesta plattformar för exonfångst omfattar också upp till 80 % av de kända miRNA-kodande regionerna.21

Sekvensering av utvalda uppsättningar av gener

Vissa sjukdomar har redan studerats så detaljerat att man känner till de flesta av de inblandade generna. Detta kan vara fallet med sjukdomar med ett mendelskt arvsmönster, där alla studerade fall beror på mutationer i någon av ett antal kända gener. Andra exempel är vissa cancertyper som huvudsakligen beror på mutationer i ett begränsat antal gener. I sådana fall skulle den mer direkta metoden för att karakterisera ett patientprov vara att bestämma sekvensen av de gener som tidigare identifierats som orsak till sjukdomen. Det klassiska tillvägagångssättet skulle vara att amplifiera alla exoner i dessa gener och bestämma nukleotidsekvensen för var och en av dem. Det alternativa tillvägagångssättet med massiv sekvensering skulle vara att rena alla tänkbara genomiska regioner som är involverade och samtidigt bestämma deras nukleotidsekvens i en enda körning.45-47 Två metoder används i allmänhet för rening av kandidat-DNA-regionerna. Den första är deras amplifiering genom polymeraskedjereaktioner med en uppsättning specifika oligonukleotider som primers. Den andra metoden består av fragmentering av provets DNA och rening av de relevanta fragmenten genom hybridisering till specifika oligonukleotider, antingen i lösning eller fixerade på ett fast underlag, såsom tidigare beskrivits för rening av exoner.48 De utvalda regionerna kan innehålla proteinkodande exoner och även andra DNA-regioner, t.ex. transkriptionsreglerande regioner. Dessa regioner motsvarar vanligtvis några hundra gener och därför är analysen av de sekvensdata som genereras mycket enklare än i andra massiva sekvenseringsmetoder. Den största begränsningen är att detta är en hypotesdriven metod som inte gör det möjligt att upptäcka mutationer i gener som inte tidigare varit relaterade till den studerade sjukdomen (tabell 4).

Exempel på klinisk användning av exomsekvensering

Den vanligaste användningen av exomsekvensering är troligen för diagnos av monogena sjukdomar. Över 3 000 monogena sjukdomar har beskrivits, även om de molekylärgenetiska orsakerna till de flesta av dem fortfarande är okända.1 Exomsekvensering kan användas för att identifiera dessa mutationer, vilket diskuteras av Kuhlenbäumer et al1 i en nyligen publicerad översikt. I några av de första studierna användes exomsekvensering för att identifiera genetiska mutationer som är ansvariga för välkända sjukdomar som Kabukis,49 Schinzel-Giedion,50 Joubert,51 och hyperfosfatasi mentala retardationssyndrom,52 allvarliga missbildningar i hjärnan,53 eller den välkända amyotrofa lateralskleros.54 Exomsekvensering har också använts för att upptäcka nya mutationer som finns i ett sporadiskt fall av mental retardation.29 Dessutom har denna teknik använts för att diagnostisera till exempel medfödd kloriddiarré,55 inflammatorisk tarmsjukdom,56 Charcot-Marie-Tooths sjukdom,57 neonatal diabetes mellitus,58 eller Brown-Vialetto-van Laere-syndromet.59 Den studie som rapporterats av Worthey et al56 utgör ett relevant exempel på den kliniska tillämpningen av exomsekvensering. Ett manligt barn presenterades med en Crohns sjukdomliknande sjukdom utan definitiv diagnos, trots en omfattande klinisk utvärdering. Författarna beslutade att använda en exomsekvensering för att identifiera den eller de orsakande mutationerna. Vid analys av sekvensdata upptäcktes 16 124 varianter hos patienten. Genom att filtrera data med hänsyn till nya varianter som förekommer i homozygositet, hemizygositet eller sammansatt heterozygositet och som påverkar högt konserverade aminosyrarester som förutspås vara skadliga för proteinfunktionen, kunde författarna välja ut en mutation i X-linked inhibitor of apoptosis-genen (XIAP). Funktionsstudier visade att denna mutation har betydelse för det proinflammatoriska svar som observerades hos patienten. På grundval av identifieringen av denna mutation utfördes en allogen hematopoetisk progenitortransplantation av celler. Därför gjorde exomsekvensering det möjligt att identifiera en okarakteriserad mutation för att ställa en molekylär diagnos för en enskild patient, i samband med en ny sjukdom, vilket resulterade i en behandlingsplan. Användningen av exomsekvensering vid upptäckt av nya orsakande mutationer och vid diagnostik har nyligen granskats.60,61

Studien av vanliga och komplexa sjukdomar har också angripits genom exomsekvensering. Genombredda associationsstudier har visat att vissa genetiska varianter ger risk för ett antal sjukdomar. Välkända exempel är apolipoprotein E vid Alzheimers sjukdom, komplementfaktor H vid makuladegeneration eller glukokerebrosidas/leucinrikt repeterande kinas 2 vid Parkinsons sjukdom.62-64 Den möjliga användningen av exomsekvensering för att studera komplexa sjukdomar har diskuterats2,28 . En begränsning av användningen av exomsekvensering i dessa studier är att de flesta av de fenotypassocierade varianterna ligger distalt från proteinkodande regioner, vilket skulle göra sekvensering av hela genomet till ett bättre tillvägagångssätt.32 En del av dessa genetiska varianter kan påverka funktionaliteten hos transkriptionsregulatoriska regioner som kontrollerar genuttryck. ENCODE-projektet31,65 har utfört en genomomfattande analys av dessa regulatoriska regioner, och man fann att flera genetiska varianter i specifika regioner på kromosom 5 (till exempel) är bindningsställen för transkriptionsfaktorn GATA2, som är starkt förknippade med Crohns sjukdom och andra inflammatoriska sjukdomar.

Cancer är en sjukdom som orsakas av ackumulering av genomiska förändringar som resulterar i en förändring av flera biologiska processer.19 Till skillnad från de monogena genetiska förändringar som diskuterats tidigare finns de flesta cancerdrivande mutationer inte i patientens normala vävnad; en stor del av dessa mutationer finns i proteinkodande regioner och kan upptäckas genom exomsekvensering.19 En annan viktig grupp av genetiska förändringar är dock stora genomiska omorganiseringar som deletioner, inversioner eller translokationer som inte kan upptäckas med hjälp av exomsekvensering.66 Trots denna begränsning har exomsekvensering tillämpats för att upptäcka drivgener för cancer med hjälp av två allmänna strategier: jämförelse mellan tumörernas exom och friska vävnader från samma patient, eller jämförelse mellan ett antal obesläktade patienters exom och ett liknande antal friska kontrollpersoner67 .-70 För närvarande genomförs omfattande studier som omfattar exom- eller genomsekvensering av en stor kohort av cancerpatienter och kontroller för att identifiera alla cancerdrivande gener.19,71,72 Projektet 5 000 cancergenom är ett exempel,73 eftersom det syftar till att sekvensera genomet för 50 av de vanligaste cancerformerna. De tillgängliga uppgifterna har redan gett ett allmänt genomiskt landskap för de vanligaste cancerformerna, vilket granskats av Vogelstein et al.3 Omkring 140 gener har identifierats som främjar tumörigenesen när de förändras, och detta finns i den tidigare nämnda COSMIC-databasen.3 Att upptäcka mutationen av en av dessa gener i exomet av ett cancerprov kan vara ett viktigt steg mot en korrekt diagnos och behandling av patienten. De aktuella uppgifterna ger också en uppfattning om cancergenomets komplexitet.3 Vanliga solida tumörer uppvisar i genomsnitt 33-66 icke-silenta somatiska mutationer.3 Detta antal ökar till över 200 i tumörer som inducerats av mutagena ämnen, t.ex. lungcancer och melanom, och till och med till över 1 000 i tumörer som har brister i DNA-reparationsmekanismerna eller i DNA-polymeraset E.3 Däremot uppvisar vätske- och barntumörer färre än tio somatiska mutationer.3 En viktig egenskap hos tumörer är att de utvecklas snabbt och blir heterogena, så att olika mutationer kan hittas i prover från samma patient som samlats in i olika regioner eller under olika tidsperioder under behandlingen, vilket nyligen visats med hjälp av exomsekvensering.74,75 Trots denna komplexitet framträder vissa förenande begrepp, och de flesta av de kända cancerdrivargenerna deltar i en eller flera av de 12 vägar som reglerar cellöverlevnad, cellöde och upprätthållande av genomet.3,19 I detta scenario börjar exomsekvensering användas för cancerdiagnostik genom identifiering av drivarmutationer, till exempel i prostatacancer.76

Exomsekvensering kan också vara användbar för cancerbehandling. Förekomsten av vissa genmutationer kan ge känslighet eller resistens för ett visst läkemedel, vilket har fått namnet farmakogenomik. Till exempel har man sedan flera år tillbaka känt till användningen av proteintyrosinkinashämmare i cancerformer som överuttrycker proteinerna Abelson murine leukemia viral oncogene homolog 1 (ABL) eller epidermal growth factor receptor (EGFR). Metoder för exom- och genomsekvensering avslöjar dock många fler mutationssvar på behandlingsassociationer (vilket lyfts fram i en översikt77). Ett informativt exempel är den senaste publiceringen av exomet från NCI-60-panelen av celler.78 Denna panel innehåller 60 välkaraktäriserade cellinjer från nio cancertyper och har använts i ett brett spektrum av biologiska och farmakologiska studier.79 Nukleotidsekvensen i exomet från dessa celler bestämdes för att fastställa vilka cancerdrivargener som muterats i var och en av dem. Förutom att tillhandahålla en lista över förmodade nya cancerdrivargener studerade författarna det möjliga sambandet mellan genotypen i varje cellinje och det tidigare fastställda svaret på ett stort antal cancerläkemedel. Man fann en korrelation mellan specifika genmutationer och svaret på flera läkemedel, vilket avslöjar den möjliga betydelsen av exomsekvensering i valet av en personlig behandling. Exomsekvensering kan också användas för att förutsäga predisposition för cancer. Några exempel finns i en nyligen publicerad översikt centrerad på kolorektalcancer och med hjälp av helgenomsekvensering.72

Medicinska utmaningar med exomsekvensering

Exomsekvensering utlovar betydande förbättringar av patienternas diagnoser, prognoser och personaliserade behandlingar. Den omfattande tillämpningen av denna teknik kräver dock fortfarande ett antal förbättringar, liksom definitionen av viktiga etiska och medicinska överväganden, vilket har diskuterats i nyligen gjorda översikter.23,27,60,61,71,77 Tekniska utmaningar omfattar utvecklingen av effektivare tekniker för exonfångst, sekvensering och anpassning för att få en fullständig och jämn representation av alla exoner i sekvensen. Det behövs också förbättringar av programvaruverktygen för dataanalys för snabb och noggrann upptäckt av patologiska varianter. Omfattande exomsekvensering kommer att kräva implementering av specialiserad utrustning och anställning av team av specialister med adekvat expertis för att generera sekvenserna och för att analysera och tolka de erhållna uppgifterna.

Användningen av exomsekvensering för diagnostik kommer också att kräva implementering av tekniska riktlinjer och bestämmelser. Parametrar som sekvenseringsdjup, exontäckning, kvalitetsmått för nukleotidsekvensdata eller alignment calling kommer att behöva normaliseras. Datalagring bör också regleras.

Det finns också ett antal komplexa etiska frågor. En viktig fråga har att göra med vilken information som bör ges till patienten. Exomsekvensering kan upptäcka genetiska variationer som inte är relaterade till den sjukdom som diagnostiseras. Patienten kan uppvisa genetiska varianter som utgör riskfaktorer eller kan vara orsak till andra sjukdomar. Vilken information bör lämnas tillbaka till patienten? Vilka bevis skulle krävas för att en genetisk variant ska anses vara kopplad till en sjukdom? Äganderätt, tillgång och lagring av uppgifter är andra relevanta frågor. Bör de genererade uppgifterna bevaras för eventuell framtida användning under patientens livstid? Dessa och andra etiska överväganden kommer förmodligen att ge upphov till betydande kontroverser80 och kommer att kräva omfattande diskussioner för att nå en överenskommelse om de kriterier som ska användas i klinisk praxis.

Slutsats

Exomsekvensering är redan ett kraftfullt verktyg som används för att fastställa den molekylära grunden för genetiska sjukdomar. Djupet i den genetiska analysen är mindre än vid sekvensering av hela genomet eftersom genetiska variationer i icke-proteinkodande regioner inte upptäcks. Det minskade antalet sekvenser och sekvensanalyser som krävs för exomsekvensering gör det dock till en mer prisvärd metod i klinisk praxis. Därför kommer exomsekvensering troligen att vara den teknik som väljs för den inledande analysen av patienter, åtminstone tills priset på helgenomsekvensering sjunker och det betydande dataanalysförfarandet förbättras. En viktig begränsning av tillämpningen av exomsekvensering i klinisk praxis är att den funktionella betydelsen av de flesta av de förväntade genetiska varianterna fortfarande är okänd. Denna situation håller snabbt på att förändras i takt med att allt fler sjukdomsassocierade genetiska varianter bestäms och görs tillgängliga i offentliga databaser. Det är troligt att man inom några år kommer att känna till de flesta genetiska variationer som är kopplade till risken att drabbas av en sjukdom, med exakt molekylär diagnostik, en förutsägelse av sjukdomsutvecklingen och ett farmakologiskt svar. Den exakta kunskapen om patientens exom, eller genom, kommer då att vara en avgörande faktor i medicinsk praxis.

Acknowledgments

Jag tackar Rosario Perona och Juliette Siegfried (ServingEdit.com) för kritisk granskning av manuskriptet.

Oppenbargörande

Författaren rapporterar inga intressekonflikter i detta arbete.

Kuhlenbäumer G, Hullmann J, Appenzeller S. Nya genomiska tekniker öppnar nya vägar i analysen av monogena sjukdomar. Hum Mutat. 2011;32(2):144-151.

Kiezun A, Garimella K, Do R, et al. Exome sequencing and the genetic basis of complex traits. Nat Genet. 2012;44(6):623-630.

Vogelstein B, Papadopoulos N, Velculescu VE, Zhou S, Diaz LA Jr, Kinzler KW. Cancergenomlandskap. Science. 2013;339(6127):1546-1558.

Kirwan M, Dokal I. Dyskeratosis congenita: a genetic disorder of many faces. Clin Genet. 2008;73(2):103-112.

Walne AJ, Dokal I. Advances in the understanding of dyskeratosis congenita. Br J Haematol. 2009;145(2):164-172.

Brady PD, Vermeesch JR. Genomiska mikroarrayer: en teknisk översikt. Prenat Diagn. 2012;32(4):336-343.

Hehir-Kwa JY, Pfundt R, Veltman JA, de Leeuw N. Pathogenic or not? Bedömning av den kliniska relevansen av varianter av kopianummer. Clin Genet. 2013;84(5):415-421.

Simons A, Sikkema-Raddatz B, de Leeuw N, Konrad NC, Hastings RJ, Schoumans J. Genome-wide arrays in routine diagnostics of hematological malignancies. Hum Mutat. 2012;33(6):941-948.

Metzker ML. Sekvenseringsteknik – nästa generation. Nat Rev Genet. 2010;11(1):31-46.

Sastre L. Ny teknik för DNA-sekvensering öppnar en lovande era för cancerforskning och cancerbehandling. Clin Transl Oncol. 2011;13(5):301-306.

Lander ES, Linton LM, Birren B, et al. International Human Genome Sequencing Consortium. Initial sekvensering och analys av det mänskliga genomet. Nature. 2001;409(6822):860-921.

Abecasis GR, Auton A, Brooks LD, et al. 1000 Genomes Project Consortium. En integrerad karta över genetisk variation från 1 092 mänskliga genomer. Nature. 2012;491(7422):56-65.

Yang Y, Liu R, Xie H, et al. Advances in nanopore sequencing technology. J Nanosci Nanotechnol. 2013;13(7):4521-4538.

Chen YS, Lee CH, Hung MY, Pan HA, Chiou JC, Huang GS. DNA-sekvensering med hjälp av elektriska konduktansmätningar av ett DNA-polymeras. Nat Nanotechnol. 2013;8(6):452-458.

Lu ZX, Jiang P, Xing Y. Genetisk variation av alternativ splicing av pre-mRNA i mänskliga populationer. Wiley Interdiscip Rev RNA. 2012;3(4):581-592.

Pruitt KD, Harrow J, Harte RA, et al. The consensus coding sequence (CCDS) project: Identifiering av en gemensam uppsättning proteinkodande gener för människans och musens genom. Genome Res. 2009;19(7):1316-1323.

Harrow J, Frankish A, Gonzalez JM, et al. GENCODE: the reference human genome annotation for The ENCODE Project. Genome Res. 2012;22(9):1760-1774.

Teer JK, Mullikin JC. Exomsekvensering: den perfekta platsen före hela genomer. Hum Mol Genet. 2010;19(R2):R145-R151.

Liu X, Wang J, Chen L. Whole-exome sequencing reveals recurrent somatic mutation networks in cancer. Cancer Lett. 2013;340(2):270-276.

Parla JS, Iossifov I, Grabill I, Spector MS, Kramer M, McCombie WR. En jämförande analys av exomfångst. Genome Biol. 2011; 12(9):R97.

Sulonen AM, Ellonen P, Almusa H, et al. Comparison of solution-based exome capture methods for next generation sequencing. Genome Biol. 2011;12(9):R94.

Clark MJ, Chen R, Lam HY, et al. Prestandajämförelse av tekniker för DNA-sekvensering av exom. Nat Biotechnol. 2011;29(10):908-914.

Gullapalli RR, Desai KV, Santana-Santos L, Kant JA, Becich MJ. Nästa generations sekvensering inom klinisk medicin: Utmaningar och lärdomar för patologi och biomedicinsk informatik. J Pathol Inform. 2012;3:40.

Samuels DC, Han L, Li J, et al. Finding the lost treasures in exome sequencing data. Trends Genet. 2013;29(10):593-599.

Taneri B, Asilmaz E, Gaasterland T. Biomedical impact of splicing mutions revealed through exome sequencing. Mol Med. 2012;18:314-319.

Fu W, O’Connor TD, Jun G, et al; NHLBI Exome Sequencing Project. Analys av 6 515 exomer avslöjar att de flesta mänskliga proteinkodande varianter har ett nytt ursprung. Nature. 2013;493(7431):216-220.

Marian AJ. Utmaningar i medicinska tillämpningar av upptäckter av sekvensering av hela exom/genom. Trends Cardiovasc Med. 2012;22(8):219-223.

Singleton AB. Exomsekvensering: en omvälvande teknik. Lancet Neurol. 2011;10(10):942-946.

Vissers LE, de Ligt J, Gilissen C, et al. A de novo paradigm for mental retardation. Nat Genet. 2010;42(12):1109-1112.

Gonzalez-Perez A, Perez-Llamas C, Deu-Pons J, et al. IntOGen-mutations identifierar cancerdrivare i olika tumörtyper. Nat Methods. 2013;10(11):1081-1082.

Bernstein BE, Birney E, Dunham I, Green ED, Gunter C, Snyder M; ENCODE Project Consortium. Ett integrerat uppslagsverk över DNA-element i det mänskliga genomet. Nature. 2012;489(7414):57-74.

Hardison RC. Epigenetiska data över hela arvsmassan underlättar förståelsen av studier om föreningar för sjukdomskänslighet. J Biol Chem. 2012;287(37):30932-30940.

Weedon MN, Cebola I, Patch AM, et al. International Pancreatic Agenesis Consortium. Recessiva mutationer i en distal PTF1A-förstärkare orsakar isolerad pankreasagenes. Nat Genet. 2014;46(1):61-64.

Wang Z, Gerstein M, Snyder M. RNA-Seq: a revolutionary tool for transcriptomics. Nat Rev Genet. 2009;10(1):57-63.

Mutz KO, Heilkenbrinker A, Lönne M, Walter JG, Stahl F. Transkriptomanalys med hjälp av nästa generations sekvensering. Curr Opin Biotechnol. 2013;24(1):22-30.

Hitzemann R, Bottomly D, Darakjian P, et al. Gener, beteende och nästa generations RNA-sekvensering. Genes Brain Behav. 2013;12(1):1-12.

Costa V, Aprile M, Esposito R, Ciccodicola A. RNA-Seq and human complex diseases: recent accomplishments and future perspectives. Eur J Hum Genet. 2013;21(2):134-142.

Lappalainen T, Sammeth M, Friedländer MR, et al; Geuvadis Consortium; Geuvadis Consortium. Transkriptom- och genomsekvensering avslöjar funktionell variation hos människor. Nature. 2013; 501(7468):506-511.

Slotkin W, Nishikura K. Adenosine-to-inosine RNA editing and human disease. Genome Med. 2013;5:105.

Lee TI, Young RA. Transkriptionsreglering och dess felreglering vid sjukdom. Cell. 2013;152(6):1237-1251.

Suvà ML, Riggi N, Bernstein BE. Epigenetisk omprogrammering i cancer. Science. 2013;339(6127):1567-1570.

Li P, Demirci F, Mahalingam G, Demirci C, Nakano M, Meyers BC. Ett integrerat arbetsflöde för analys av DNA-metylering. J Genet Genomics. 2013;40(5):249-260.

Chibon F. Cancer gene expression signatures – the rise and fall? Eur J Cancer. 2013;49:2000-2009.

Dedeoğlu BG. Metoder med hög genomströmning för analys av mikroRNA-uttryck. Methods Mol Biol. 2014;1107:91-103.

Ni T, Wu H, Song S, Jelley M, Zhu J. Selective gene amplification for high-throughput sequencing. Recent Pat DNA Gene Seq. 2009; 3(1):29-38.

Barretina J, Caponigro G, Stransky N, et al. The Cancer Cell Line Encyclopedia enables predictive modelling of anticancer drug sensitivity. Nature. 2012;483(7391):603-607.

Garnett MJ, Edelman EJ, Heidorn SJ, et al. Systematisk identifiering av genomiska markörer för läkemedelskänslighet i cancerceller. Nature. 2012;483(7391):570-575.

Hoischen A, Gilissen C, Arts P, et al. Massively parallel sequencing of ataxia genes after array-based enrichment. Hum Mutat. 2010;31(4):494-499.

Ng SB, Bigham AW, Buckingham KJ, et al. Exomsekvensering identifierar MLL2-mutationer som orsak till Kabukis syndrom. Nat Genet. 2010;42(9):790-793.

Hoischen A, van Bon BW, Gilissen C, et al. De novo mutationer i SETBP1 orsakar Schinzel-Giedions syndrom. Nat Genet. 2010;42(6):483-485.

Edvardson S, Shaag A, Zenvirt S, et al. Jouberts syndrom 2 (JBTS2) hos ashkenazi-judar är förknippat med en TMEM216-mutation. Am J Hum Genet. 2010;86(1):93-97.

Krawitz PM, Schweiger MR, Rödelsperger C, et al. Identity-by-descent filtrering av exomsekvensdata identifierar PIGV-mutationer i hyperfosfatasi mentalt retardationssyndrom. Nat Genet. 2010;42(10):827-829.

Bilgüvar K, Oztürk AK, Louvi A, et al. Whole-exome sequencing identifies recessive WDR62 mutations in severe brain malformations. Nature. 2010;467(7312):207-210.

Johnson JO, Mandrioli J, Benatar M, et al. ITALSGEN Consortium. Exomsekvensering avslöjar VCP-mutationer som orsak till familjär ALS. Neuron. 2010;68(5):857-864.

Choi M, Scholl UI, Ji W, et al. Genetisk diagnos genom hel exomfångst och massivt parallell DNA-sekvensering. Proc Natl Acad Sci U S A. 2009;106(45):19096-19101.

Worthey EA, Mayer AN, Syverson GD, et al. Making a definitive diagnosis: successful clinical application of whole exome sequencing in a child with intractable inflammatory bowel disease. Genet Med. 2011;13(3):255-262.

Montenegro G, Powell E, Huang J, et al. Exomsekvensering möjliggör snabb genidentifiering i en Charcot-Marie-Tooth-familj. Ann Neurol. 2011;69(3):464-470.

Bonnefond A, Durand E, Sand O, et al. Molekylär diagnos av neonatal diabetes mellitus med hjälp av nästa generations sekvensering av hela exomet. PLoS One. 2010;5(10):e13630.

Johnson JO, Gibbs JR, Van Maldergem L, Houlden H, Singleton AB. Exomsekvensering vid Brown-Vialetto-van Laeres syndrom. Am J Hum Genet. 2010;87(4):567-9; författarsvar 569.

Bras JM, Singleton AB. Exomsekvensering vid Parkinsons sjukdom. Clin Genet. 2011;80(2):104-109.

Topper S, Ober C, Das S. Exome sequencing and the genetics of intellectual disability. Clin Genet. 2011;80(2):117-126.

Corder EH, Saunders AM, Strittmatter WJ, et al. Gendosering av apolipoprotein E typ 4 allel och risken för Alzheimers sjukdom i familjer med sen debut. Science. 1993;261(5123):921-923.

Klein RJ, Zeiss C, Chew EY, et al. Komplementfaktor H polymorfism i åldersrelaterad makuladegeneration. Science. 2005;308(5720):385-389.

Tan EK. Identifiering av en gemensam genetisk riskvariant (LRRK2 Gly2385Arg) vid Parkinsons sjukdom. Ann Acad Med Singapore. 2006;35(11):840-842.

Libioulle C, Louis E, Hansoul S, et al. Novel Crohn disease locus identified by genome-wide association maps to a gene desert on 5p13.1 and modulates expression of PTGER4. PLoS Genet. 2007;3(4):e58.

Stephens PJ, Greenman CD, Fu B, et al. Massive genomic rearrangement acquired in a single catastrophic event during cancer development. Cell. 2011;144(1):27-40.

Jones S, Zhang X, Parsons DW, et al. Core signalvägar i mänsklig bukspottkörtelcancer avslöjade genom globala genomiska analyser. Science. 2008;321(5897):1801-1806.

Parsons DW, Jones S, Zhang X, et al. An integrated genomic analysis of human glioblastoma multiforme. Science. 2008;321(5897):1807-1812.

Timmermann B, Kerick M, Roehr C, et al. Somatiska mutationsprofiler av MSI- och MSS-kolorektalcancer som identifierats med hjälp av nästa generations sekvensering av hela exomer och bioinformatisk analys. PLoS One. 2010;5(12):e15661.

Varela I, Tarpey P, Raine K, et al. Exomsekvensering identifierar frekventa mutationer i SWI/SNF-komplexets gen PBRM1 i njurcancer. Nature. 2011;469(7331):539-542.

Ku CS, Cooper DN, Roukos DH. Klinisk relevans av sekvensering av cancergenom. World J Gastroenterol. 2013;19(13):2011–2018.

Kilpivaara O, Aaltonen LA. Diagnostisk cancergenomsekvensering och bidraget från germina varianter. Science. 2013;339(6127):1559-1562.

Hudson TJ, Anderson W, Artez A, et al; International Cancer Genome Consortium. Internationellt nätverk av cancergenomprojekt. Nature. 2010;464(7291):993-998.

Gerlinger M, Rowan AJ, Horswell S, et al. Intratumor heterogeneity and branched evolution revealed by multiregion sequencing. N Engl J Med. 2012;366(10):883-892.

Ren SC, Qu M, Sun YH. Undersökning av intratumörheterogenitet med hjälp av sekvensering av enstaka celler. Asian J Androl. 2013;15(6):729-734.

Hieronymus H, Sawyers CL. Att genomgå det genomiska landskapet för prostatacancer från diagnos till död. Nat Genet. 2012;44(6):613-614.

McLeod HL. Cancerfarmakogenomik: tidigt löfte, men samordnade insatser behövs. Science. 2013;339(6127):1563-1566.

Abaan OD, Polley EC, Davis SR, et al. The exomes of the NCI-60 panel: a genomic resource for cancer biology and systems pharmacology. Cancer Res. 2013;73(14):4372-4382.

Weinstein JN. Upptäckt av läkemedel: Cellinjer i kampen mot cancer. Nature. 2012;483:544-545.

Shahmirzadi L, Chao EC, Palmaer E, Parra MC, Tang S, Gonzalez KD. Patienternas beslut om offentliggörande av sekundära fynd bland de 200 första individerna som genomgått klinisk diagnostisk exomsekvensering. Genet Med. Epub October 10, 2013.

Flicek P, Amode MR, Barrell D, et al. Ensembl 2011. Nucleic Acids Res. 2011;39:D800-D806.

Pruitt KD, Tatusova T, Klimke W, Maglott DR. NCBI:s referenssekvenser: nuvarande status, politik och nya initiativ. Nucleic Acids Res. 2009;37:D32-D36.

Lämna ett svar

Din e-postadress kommer inte publiceras.