Indledning

Alle sygdomme har et genetisk grundlag. Nogle skyldes fravær eller dysfunktion af et bestemt protein som følge af mutationer i det gen, der koder for det. Dette er tilfældet med sygdomme med mendelsk arvelighed, såsom Huntingtons sygdom, thalassæmi og ca. 1 000 andre sjældne arvelige sygdomme.1 Mange sygdomme har et genetisk grundlag, selv om de ikke udelukkende skyldes mutationer i et enkelt gen, og et stigende antal genetiske varianter og polymorfismer identificeres som risikofaktorer for komplekse sygdomme.2 Kræft er en genetisk sygdom, der skyldes mutationer i et eller flere gener, som enten øger risikoen for kræft (f.eks. kimlinjemutationer), eller som fremmer kræft (onkogener), eller som forringer de cellulære mekanismer, der kontrollerer celleproliferation (suppressorgener), som det sker med somatiske mutationer.3

Den genetiske basis for disse sygdomme har indtil for få år siden været et arbejdskrævende og udfordrende projekt at identificere. Disse projekter startede ofte med identifikation af en genomregion, der muligvis er involveret i sygdomsoverførslen ved hjælp af genetiske associationsundersøgelser.1 Det er normalt nødvendigt at analysere store familier med flere berørte medlemmer for at definere en genomregion, der i høj grad er relateret til sygdomsoverførslen. Generelt indeholder denne region flere gener, som skal sekventeres for at identificere en genmutation, der er til stede hos alle de berørte personer og ikke hos deres raske slægtninge i tilfælde af dominant arv. I tilfælde af recessiv overførsel skal mutationen være til stede i begge alleler hos de ramte medlemmer og i en eller ingen af allelerne hos de ikkeramte slægtninge.

Diagnosticering af genetiske sygdomme var, og er i de fleste tilfælde stadig, lige så besværlig. I bedste fald kan sygdommen have sin oprindelse i en mutation i kun ét gen. Diagnosen vil kun kræve bestemmelse af nukleotidsekvensen af dette gen. Typisk forstærkes genet som flere fragmenter ved hjælp af polymerasekædereaktioner, og nukleotidsekvensen for hvert enkelt fragment bestemmes. Ofte kan sygdommen skyldes mutationer i et af flere gener, og alle disse gener skal forstærkes og sekventeres for at finde den genetiske oprindelse af sygdommen hos de berørte patienter. Ved dyskeratosis congenita kan der f.eks. findes mutationer i et af generne dkc, tert, terc, NOP10, NH2 eller TINF2, og antallet af berørte gener kan være endnu større, da der er en del patienter, hvor den forårsagende mutation ikke er blevet identificeret.4,5 Nukleotidsekvensen af alle disse gener skal bestemmes med henblik på den molekylære diagnose af hver enkelt patient. Vi finder flere muterede gener i forskellige typer kræftsygdomme.3 Den molekylære diagnose kræver bestemmelse af nukleotidsekvensen af flere af disse gener. På nuværende tidspunkt er dette en besværlig og dyr proces, som ikke kan anvendes til en stor patientpopulation. I praksis sekventeres kun nogle få gener, der er muteret hos en betydelig andel af de patienter, der er ramt af visse kræfttyper, med henblik på diagnose og behandling.

Det er kun i de sidste par år, at der er blevet udviklet teknikker til samtidig påvisning af flere sekvensvarianter i en given prøve. Mange af dem er baseret på desoxyribonukleinsyre (DNA)-mikroarray-teknologi. I genotyping arrays er oligonukleotider, der indeholder de aktivt identificerede mutationer, som er relateret til en given sygdom, plettet på et objektglas. En patientens DNA-prøve lægges oven på objektglasset, og de hybridiserende oligonukleotider identificeres. Millioner af kendte mutationer kan testes i en enkelt mikroarrayhybridisering.6 Copy number variationer kan også analyseres ved hjælp af DNA-mikroarrays, der er designet til at påvise tilstedeværelsen af DNA-regioner, der er duplikeret eller slettet i patientens DNA.7 Disse teknikker anvendes ofte inden for medicinsk forskning og til klinisk diagnose.8

Et stort skridt inden for molekylær medicin har imidlertid været den nylige udvikling af massive sekventeringsteknologier, der gør det muligt at bestemme nukleotidsekvensen af en patients DNA på kort tid og til en overkommelig pris.9,10 Disse metoder har været i brug siden 2005 og er baseret på den samtidige bestemmelse af nukleotidsekvensen af millioner af DNA-fragmenter. De er blevet kaldt anden generations sekventering, næste generations sekventering, dyb sekventering eller massivt parallel sekventering. Tusindvis af millioner af nukleotidsekvenser bestemmes på højst 2 uger ved hjælp af disse maskiner. Som et eksempel på kapaciteten af disse nye sekventeringssystemer kan det nævnes, at den milepæls-sekventering af det første menneskelige genom, der blev offentliggjort i 200111 , krævede et koordineret arbejde fra 23 laboratorier, som tog 13 år og kostede i alt ca. 3 milliarder USD. Med de nye metoder tager sekventering af et menneskeligt genom ét laboratorium og ca. 2 uger med en anslået omkostning på 4 000 USD.

Der er moderne sekventeringsmetoder til rådighed, og det giver en eksponentiel vækst i vores viden om det menneskelige genom, variabilitet mellem individer og identifikation af genetiske varianter i forbindelse med sygdomme. Disse metoder er f.eks. grundlaget for et igangværende 1000 Genomes-projekt12 , der har til formål at bestemme den fuldstændige nukleotidsekvens for ca. 1 000 personer af forskellig geografisk og etnisk oprindelse for at bestemme den gennemsnitlige sekvensvariation blandt individer og identificere de hyppigste polymorfismer.

Massive sekventeringsteknologier udvikler sig i øjeblikket i et hurtigt tempo. Der udvikles mindre og hurtigere maskiner, og der indføres nye sekventeringsmetoder. Et vigtigt mål er f.eks. at sekventere et enkelt DNA-molekyle fra en enkelt celle.13,14 Bortset fra de tekniske udfordringer falder prisen på DNA-sekventering støt, så målet om at sekventere et enkelt menneskeligt genom for 1.000 USD synes at være inden for rækkevidde om få år. På nuværende tidspunkt er det komplekst, dyrt og tidskrævende at sekventere et helt menneskeligt genom og analysere alle de genererede sekvensdata, og mange undersøgelser gennemføres på en mindre del af genomet. Især er man i øjeblikket meget opmærksom på at sekventere den proteinkodende del af genomet, som er kendt som exomet. Exomsekventering er langt billigere end sekventering af hele genomet, og mulighederne, fordelene og begrænsningerne ved denne teknik vil blive drøftet i denne gennemgang.

Hvad er et exom?

Næsten alle menneskelige protein-kodende gener har en diskontinuerlig struktur. Den proteinkodende region er fragmenteret i flere stykker, kaldet exoner. Exonerne er forbundet af ikke-proteinkodende DNA-fragmenter, eller introner, som skematisk vist i figur 1. Generne transskriberes fra promotorregionen under kontrol af flere regulatoriske regioner, som findes forskellige steder i forhold til genet, opstrøms, nedstrøms eller endog inde i genet. Transkriptionen skaber et primært transkript, der indeholder exoner og introner. Efterfølgende ribonukleinsyre (RNA)-splejsningsprocesser sletter intronerne og sammenføjer exonerne for at generere det modne messenger RNA (mRNA), som kun indeholder én sammenhængende proteinkodningsregion. Nyere undersøgelser viser, at de primære transkript af de fleste gener kan splejses på flere måder, hvilket giver anledning til forskellige modne mRNA’er, der indeholder specifikke kombinationer af exoner, kendt som alternative splejsningvarianter (figur 1). Disse mRNA’er koder for proteinisoformer, der har nogle fælles regioner, men som også adskiller sig fra andre, afhængigt af de indbyggede exons.15

Analyse af det menneskelige genom har vist, at de proteinkodende gener udgør en lille del af DNA’et, nemlig kun ca. 3 %.16 Exons udgør en endnu mindre del på 1 % af genomet.16 En oversigt over disse data er vist i tabel 1. Det menneskelige genom består af 3,3 × 109 basepar (bp) og indeholder 20 078 proteinkodende gener.17 Hvert gen er opdelt i et gennemsnitligt antal på otte exoner, der hver er ca. 170 bp lange. Alle exonerne som helhed indeholder ca. 3 ×107 bp. Sekventering af alle exonerne giver imidlertid de samme oplysninger om aminosyresekvensen af de kodede proteiner som sekventering af hele genomet, med undtagelse af mutationer, der ændrer mRNA-splejsning, som det vil blive diskuteret i afsnittet om sekventering af eksomet og dataanalyse. Dette system med sekventering af alle exonerne er blevet kaldt exomsekventering og er blevet en gyldig metode til påvisning af variationer i aminosyresekvensen for alle menneskelige proteiner18 . Den meget markante størrelsesforskel gør exomsekventering meget billigere end genomsekventering, og dette letter beregningsmæssige og funktionelle analyser af de genererede sekvensdata.

Figur 1 Skematisk fremstilling af genstruktur og -ekspression.
Noter: Protein-kodende gener består af exoner, der indeholder protein-kodende information (bokse), adskilt af ikke-kodende introner (linjer). Grå bokse angiver exonproteinkodende regioner, og hvide bokse angiver mRNA’s 5′ og 3′ utranslaterede regioner. Generne transskriberes fra promotorregionerne, umiddelbart opstrøms for exon 1. Transkriptionens startsted er angivet med en pil. Genekspressionen styres af en række TR-regioner, der kan være placeret opstrøms eller nedstrøms for genet, i forskellige afstande eller inde i genet (hyppigst i introner). Stabiliteten og translationen af mRNA’et kan reguleres ved at mikroRNA’er binder sig til specifikke steder i den 3′ u-translaterede region (angivet med asterisker). Generne transskriberes til primære RNA’er, der indeholder introner og exoner. Efterfølgende splejsningsprocesser fjerner intronerne for at generere modne mRNA’er. Alternative splejsningsprocesser kan give anledning til forskellige mRNA’er, afhængigt af hvilke exoner de indeholder (mRNA1, mRNA2), som koder for forskellige proteinisoformer.
Abkortninger: TR, transkription regulatorisk region; RNA, ribonukleinsyre; mRNA, messenger ribonukleinsyre.

Tabel 1 Generelle karakteristika ved det menneskelige genom og exom

Teknikker til indfangning af exomer

Det første og mest kritiske trin i sekventering af exomer er isolering eller indfangning af exonerne. De metoder, der anvendes, er baseret på DNA-hybridisering. Analysen af det menneskelige genom har gjort det muligt at identificere alle genets exoner, og det gør det lettere at designe oligonukleotidprober, der er specifikke for hver enkelt af dem. Sonderne anvendes til oprensning af exonerne fra DNA’et.19 Fragmentering af DNA’et i stykker på højst 500 bp er det første skridt. Derefter hybridiseres DNA’et til de exon-specifikke oligonukleotidprober, og de hybridiserede fragmenter oprenses. Hybridiseringen kan udføres i flydende fase. I dette tilfælde er oligonukleotiderne mærket, så DNA-oligonukletidkomplekser kan adskilles fra hovedparten af det ikkehybridiserede DNA. I et almindeligt eksempel er oligonukleotider kovalent bundet til biotin, således at DNA-oligonukleotidhybrider kan isoleres ved hjælp af det biotinbindende molekyle, streptavidin, der er koblet til magnetiske perler. DNA-fragmenter, der ikke indeholder exoner, vil ikke binde sig til streptavidin-perlerne og kan fjernes effektivt efter flere vasketrin. De fragmenter, der indeholder exoner, og som er bundet til perlerne, kan genfindes efter dissociation af DNA-oligonukleotidhybriderne under forhold med lav ionisk styrke.

Exoner kan også isoleres ved hybridisering til en fast substrat, hvor de exon-specifikke oligonukleotider er blevet spottet, som med DNA-mikroarrays. I dette tilfælde spredes det fragmenterede DNA over oligonukleotiderne for at muliggøre hybridisering. Senere vaskes det ikke-hybridiserede DNA væk, og det exonberigede DNA elueres under lav-ioniske forhold.

Flere kommercielle leverandører tilbyder kits til exomisolering ved hjælp af hybridiseringsprotokoller i flydende fase, herunder Agilent Technologies (Santa Clara, CA, USA), Roche NimbelGen, Inc. (Madison, WI, USA), Illumina, Inc. (San Diego, CA, USA) og Life Technologies (Carlsbad, CA, USA). Disse kits gør det muligt at isolere over 90 % af de exoner, der findes i genomet, med over 90 % specificitet til en pris på ca. 150 USD pr. exom. Flere forfattere har sammenlignet disse exomindsamlingsplatforme20-22 , og de data, som Clark et al22 har opnået ved at sammenligne SureSelect Human All Exon 50 Mb (Agilent Technologies), Roche NimbleGen, Inc.’s SeqCap EZ Exome Library v2.0 og Illumina, Inc.’s TruSeq Exome Enrichment kits, er opsummeret i tabel 2. Nogle af sættene dækker de utranslaterede regioner af mRNA ud over de proteinkodende regioner, hvilket gør det muligt at analysere regulatoriske regioner som f.eks. mikroRNA-bindingssteder (miRNA). Medtagelsen af 5′ utranslaterede regioner gør det også muligt at analysere de proximale promotorregioner.22 Desuden dækker de fleste kits op til 80 % af de miRNA-kodende regioner.21 Disse og andre leverandører har for nylig udviklet forbedrede kits, således at de data, der er vist i tabel 2, kun skal betragtes som en indikation. Det er vigtigt at bemærke, at exonrensning er et kritisk skridt. Det er vanskeligt at genvinde 100 % af exonerne, og exonerne går ofte tabt eller er underrepræsenteret i det isolerede exom. Hvis f.eks. eksomet fra en patient analyseres, og 10 % af exonerne går tabt under rensningen, vil sandsynligheden for at gå glip af en relevant mutation være ca. 10 % på grund af denne tekniske fejl. Derfor er brugen af meget effektive exon-capture-procedurer af afgørende betydning ved exom-sekventering.

Tabel 2 Sammenligning af tre store exom-capture-platforme
Noter: aSammenligning af henholdsvis Ensemble81 og RefSeq82 -databaser; bProcentdel af de udvalgte regioner, der er sekventeret af hver platform mindst ti gange efter analyser af 80 mega-reads af DNA-sekvensen. Agilent Technologies (Santa Clara, CA, USA); Roche NimbelGen, Inc. (Madison, WI, USA); Illumina, Inc. (San Diego, CA, USA).
Abkortelser: mRNA, messenger ribonukleinsyre; miRNA, mikro ribonukleinsyre; DNA, deoxyribonukleinsyre.

Exomsekventering og dataanalyse

Exon-holdige fragmenter sekventeres ved hjælp af et af de i øjeblikket tilgængelige systemer eller teknologier til massiv sekventering af udstyr til sekventering. Som nævnt i indledningen bestemmer disse platforme nukleotidsekvensen af millioner af DNA-fragmenter på samme tid. Den bestemte længde af sekvensen af hvert enkelt fragment ved exomsekventering er ikke lang, typisk mellem 35 bp og 100 bp. Men da DNA’et oprindeligt blev fragmenteret tilfældigt, vil hvert enkelt nukleotid være til stede i mange overlappende fragmenter. Hvis der opnås et tilstrækkeligt stort antal sekvenser, selv om de er korte, vil hver base derfor blive sekventeret uafhængigt af hinanden i flere DNA-fragmenter. Antallet af gange, som hver base sekventeres, kaldes dækning eller sekventeringsdybde. Dækningen er direkte forbundet med kvaliteten af og tilliden til den genererede nukleotidsekvens. Generelt anses en dækning på 20×-30× for nødvendig for at opnå pålidelige resultater ved exomsekventering.59 Denne sekventeringsdybde betyder, at en mulig sekvensvariation vil være blevet sekventeret uafhængigt af hinanden i 20-30 forskellige DNA-fragmenter.

Dataanalyse er det sidste trin i exomsekventeringsprojekter (figur 2). Som nævnt ovenfor genereres der data fra millioner af sekvenser, og analyserne heraf kræver specifikke og komplekse computerprogrammer og ekspertise.19,23 Et indledende skridt er en analyse af kvaliteten af den genererede sekvens. Nøjagtigheden af sekvenslæsningen ved forskellige sekvenslængder, den gennemsnitlige længde af læsningerne samt andre parametre testes. Hvis kvaliteten er god nok, sammenlignes hver sekvens med en referencesekvens, som normalt er den sidste tilgængelige version af den menneskelige genomsekvens. Typisk kan mere end 80 % af de genererede sekvenser tilpasses til referencegenomet.22 Dette trin tillader en lille grad af nukleotidvariation i forhold til referencegenomet. Det næste trin i analysen er at identificere sekvensvariationer mellem referencesekvensen og den exomsekvens, der er opnået i vores undersøgelse. De efterfølgende analyser af disse varianter kan give de ønskede oplysninger om det undersøgte medicinske problem.

Figur 2 Analyse af eksomsekvenseringsdata.
Notes: De trin, der er nødvendige for exomisolering, sekventering og dataanalyse, er skematisk fremstillet. Denne proces fremmer identifikationen af genvarianter, der er involveret i sygdommenes oprindelse (drivergener) eller på anden måde er relateret til sygdomsfølsomhed, evolution eller lægemiddelrespons. Disse data giver værdifulde oplysninger til diagnose og prognose, til genetisk rådgivning og til udformning af personlige behandlinger.
Abkortning: DNA, deoxyribonukleinsyre.

Eksomsekventering kan påvise flere typer af genetiske variationer. En af de hyppigst fundne forskelle er en ændring af et nukleotid til et andet, f.eks. A til G (ATA-kodon til ATG). Disse variationer kaldes single nucleotide variants (SNV’er), selv om de betragtes som single nucleotide polymorphisms (SNP’er), når deres frekvens i befolkningen er større end 1-5 %, og der ikke er nogen stærk effekt på risikoen for en sygdom. De fleste SNV’er er tavse, eller også kendt som synonyme, fordi begge sekvensvarianter koder for den samme aminosyre (f.eks. en variation fra GCA til GCC, da begge er alaninkodoner). De fleste af disse polymorfismer repræsenterer ikke nogen forskel for det kodede protein, er ikke under evolutionær selektion og repræsenterer de hyppigst forekommende variationer i det menneskelige exom. Undtagelsen er nogle tavse mutationer, der påvirker splejsningregulerende signaler eller endog transkriptionregulerende steder og ændrer mRNA-splejsning eller -ekspression, selv om de ikke ændrer de kodede aminosyrer. I andre tilfælde har nucleotidvariationen en konsekvens i det kodede protein, og disse er ikke-silente eller ikke-synonyme varianter. Disse ændringer kan resultere i variationer i den kodede aminosyre (f.eks. ændrer GAT til GAG asparaginsyre til glutaminsyre), og kaldes missense-mutationer. Mere drastiske ændringer opstår, når nukleotidvariationen skaber et oversættelsesstopkodon (f.eks. ændrer TGC til TGA et cystein-kodon til et stopkodon), hvilket kaldes en nonsense-mutation. Der findes også en type SNV, som kan påvises ved exomsekventering, selv om den ikke påvirker proteinkodonerne. Da exoner udvælges efter tilfældig fragmentering af DNA’et, kan de også indeholde sammenhængende DNA-regioner, herunder tilstødende intron-sekvenser og endda genpromotorer, hvis utranslaterede regioner blev fanget.24 Intron-regioner indeholder de regulatoriske signaler, der er nødvendige for mRNA-splejsning. SNV’er i disse regioner kan ændre splejsning på forskellige måder.15 For eksempel kan det berørte intron blive bevaret i det modne mRNA, eller det tilstødende exon kan blive splejset ud (exon skipping). Disse ændringer ændrer nukleotidsekvensen af det modne mRNA og dermed det kodede protein nedstrøms fra SNV’en.25 Eksomsekventering kan også påvise sekvensvariationer som følge af små insertioner eller deletioner (indels).22 Disse variationer kan resultere i et rammeskift, undtagen når de påvirker tre eller et multiplum af tre nukleotider. I så fald vil der blive produceret små deletioner eller insertioner af aminosyrer.

Identificering af forårsagende mutationer

Den funktionelle relevans af de påviste sekvensvarianter skal bestemmes i det næste dataanalysetrin. Selv om alle mennesker er næsten identiske ud fra et genetisk synspunkt, er antallet af nukleotidsekvensforskelle mellem individer betydeligt.26 Denne heterogenitet komplicerer fortolkningen af de data, der er opnået i individuelle sekventeringsprojekter. Nogle generelle data om individuelle sekvensvariationer er vist i tabel 3. Når man ser på hele genomet, er antallet af sekvensforskelle mellem individer blevet anslået til 4 × 106 i henhold til data fra 1000-genomprojektet og mindre projekter til sekventering af hele genomet.27 Exomer viser et mindre, men stadig betydeligt antal sekvensvariationer, nemlig omkring 20 000-25 000 mellem to ikke-relaterede individer.27,28 De fleste af disse genetiske variationer er tavse, som tidligere omtalt. Antallet af ikke-stumme sekvensforskelle mellem individer er blevet anslået til 10.000. De fleste af disse varianter findes i den almindelige befolkning og overføres i generationer. Det er blevet anslået, at mindre end én ikke-silent SNV forekommer de novo hos hvert individ.29

De data, der opnås i exomsekventeringsprojekter, filtreres ofte for at identificere alle de SNP’er, der findes hos andre individer, og som derfor ikke er relateret til den sygdom, der undersøges.2,19,23 Denne proces kan ske ved sammenligning med offentlige databaser, hvor de SNP’er, der er fundet i sekventeringsprojekterne, er samlet. Et forbehold, der skal tages i betragtning, er, at alle store databaser indeholder en række påviste mutationer, der forårsager relativt hyppige sygdomme. Der er ca. 400-700 nye og muligvis relevante SNV’er tilbage efter dette filtreringstrin (tabel 3).28 Den næste udfordring er at afgøre, hvilke af de SNV’er, der ikke findes i den globale befolkning, der i givet fald er årsag til den sygdom, der undersøges. Mange af de observerede forskelle vil ikke være forbundet med nogen forekomst af sygdommen, og disse er kendt som passagerændringer.23 I modsætning hertil kan en eller nogle få ændringer have en årsagsskabende rolle, og de kaldes driverændringer. Den fremgangsmåde, der anvendes til at identificere disse drivkraftændringer, afhænger af de særlige omstændigheder ved undersøgelsen. Ved sygdomme med et mendelsk arvemønster er det normalt nødvendigt at analysere et antal berørte og ikke-påvirkede individer for at finde genvariationer, der er perfekt segregeret med sygdommen. Denne sammenligning er mere informativ i store familier med velkarakteriserede stamtavler. I mangel af tilstrækkeligt store berørte familier giver sammenligningen af et antal ikke-relaterede patienter og kontroller også mulighed for at identificere drivergener. Der anvendes yderligere kriterier til at udvælge mulige SNV’er, der er relateret til sygdommen, herunder in silico-algoritmer, som forudsiger den muterede aminosyres mulige betydning på grundlag af evolutionær bevarelse og på grundlag af den forudsagte indvirkning på proteinets struktur og funktion. Den forudsagte funktion af det muterede protein og dets vævsspecifikke ekspressionsmønster er også kriterier, der anvendes til udvælgelse af putative forårsagende mutationer.

Tabel 3 Oversigt over sekvensvariationen blandt individer

Nogle eksempler på disse typer undersøgelser vil blive givet i et senere afsnit. I takt med, at der gennemføres flere undersøgelser, identificeres flere genvariationer som årsag til arvelige sygdomme, hvilket gør det sandsynligt, at nogle af de gener, der er muteret hos patienten, allerede ville være beskrevet. Disse muterede gener kan findes i litteraturen og i specialiserede databaser som f.eks. databasen Online Mendelian Inheritance in Man (http://www.omim.org). Den mulige relevans af de mutationer, der er fundet i forskellige gener, kan også søges på siden Genome Ensemble (http://www.ensembl.org/), hvis de tidligere er blevet beskrevet.

Kræft er sandsynligvis den mest udbredte gruppe af sygdomme med et genetisk grundlag. Mange undersøgelser har været rettet mod at bestemme drivergenerne for forskellige typer kræft.30 Den fremvoksende gruppe af drivergener for kræft kan konsulteres i databaser som Catalogue of Somatic Mutations In Cancer (COSMIC; http://cancer.sanger.ac.uk) eller The Cancer Genome Atlas (http://cancergenome.nih.gov/). Flere mere detaljerede eksempler vil blive vist i afsnittet Eksempler på klinisk brug af exomsekventering.

Sammenligning af exomsekventering med andre massive sekventeringsmetoder

Genomsekventering

Som nævnt i indledningen bliver sekventering af hele det menneskelige genom mere og mere overkommeligt. Sammenlignet med sekventering af eksom er sekventering af hele genomet et langt mere komplekst alternativ. Antallet af sekventeringsreaktioner, der skal udføres, er meget større, og det samme gælder antallet af genererede nukleotidsekvensdata. Den beregningsmæssige analyse er stærkt forøget. Desuden findes der langt flere genetiske varianter, som det fremgår af tabel 3, hvilket gør det vanskeligere at identificere drivergener. Genomsekventering giver imidlertid et fuldstændigt overblik over de genetiske ændringer, der er til stede hos patienten, herunder store omorganiseringer af genomet. Kortlæsningssekvensering af et genom med moderat dybde vil imidlertid gå glip af strukturelle variationer, især i regioner med lav kompleksitet. Disse oplysninger er opsummeret i tabel 4, som sammenligner exomsekventering med andre sekventeringsmetoder.

Som tidligere nævnt udgør de proteinkodende gener kun 3 % af genomet.16 Indtil for nylig blev resten af genomet anset for at være “bulk-DNA” uden stor informationsværdi. Nyere undersøgelser har imidlertid fuldstændig ændret dette synspunkt. Et stort genom-dækkende projekt undersøger funktionen af alle regioner i genomet, ENCODE-projektet (Encyclopedia of DNA Elements).31 De nuværende tilgængelige resultater viser, at over 70 % af genomet er transskriberet. Mange af de genererede transkripter koder ikke for proteiner, men de synes at have en regulerende rolle i genekspressionen. Blandt dem er de allerede kendte miRNA’er, som regulerer mRNA-stabilitet og translation (figur 1), men også over 20 000 lange ikke-kodende RNA’er, som regulerer transkriptionen. Desuden er der blevet identificeret mange DNA-regioner, der regulerer genekspressionen, herunder mange tidligere ukendte promotor- og transkriptionsregulerende regioner (figur 1). Disse oplysninger er af klinisk relevans, fordi mutationer i reguleringsregioner kan påvirke ekspressionen af specifikke gener og kan have patologiske konsekvenser. Faktisk har en stor del af genomdækkende associationsundersøgelser sat DNA-regioner, hvor der ikke er fundet proteinkodende mutationer, i forbindelse med patologiske tilstande.32 De data, der er genereret i ENCODE-projektet, har gjort det muligt at revidere nogle tilfælde, hvor man har fundet, at mutationer i reguleringsregioner for genudtryk er ansvarlige for sygdommen.31,32 I et nyligt eksempel har Weedon et al33 også rapporteret, at mutationer i en transkriptionsregulerende region i PTF1A-genet forårsager isoleret pancreas agenese. Mutationer i regulatoriske regioner kan ikke påvises ved hjælp af exomsekventering, da de ikke påvirker det kodede protein, men i stedet dets ekspression. Derfor giver helgenomsekventering flere oplysninger end exomsekventering på bekostning af øget kompleksitet og økonomiske omkostninger.

Tabel 4 Sammenligning af massive sekventeringsteknikker
Abkortninger: RNA, ribonukleinsyre; DNA, deoxyribonukleinsyre.

RNA-sekventering

RNA-sekventeringsteknikker består af konvertering af RNA-populationer til komplementært DNA (cDNA) ved omvendt transskription og efterfølgende sekventering af dem.34,35 I tilfælde af mRNA-sekventering konverteres den komplette population af mRNA’er, der udtrykkes i en cellelinje eller vævsprøve (kendt som transkriptom), til cDNA og sekventeres. Processen med mRNA-sekventering giver oplysninger om nukleotidsekvensen af de gener, der transskriberes i den analyserede prøve, og dermed om aminosyresekvensen for de tilsvarende proteiner. Desuden kan antallet af sekvenser, der genereres for hvert mRNA, vurderes og er proportionalt med dets hyppighed. Derfor kan genekspressionsniveauerne bestemmes og sammenlignes med niveauerne i andre prøver, herunder eventuelle kontrolprøver (tabel 4). En anden specifik fordel ved mRNA-sekventering er, at den gør det muligt at undersøge alternative splejsningsevents.36,37 Som tidligere nævnt behandles primære transskriptioner ofte på flere måder for at give anledning til mRNA, der indeholder forskellige exoner (figur 1). Disse mRNA’er kan identificeres ved mRNA-sekventering og ikke ved exom- eller genom-sekventering, som bestemmer sekventeringen af det DNA, der transskriberes, og ikke sekventeringen af det modne transkript. Ellers giver mRNA- og exom-sekventering samme oplysninger om genomets proteinkodningsregion. Forskellen er, at exomsekventering omfatter alle generne, mens mRNA-sekventering er begrænset til de gener, der udtrykkes i den analyserede prøve. I en nyere mRNA-sekventeringsundersøgelse af lymfoblasto-cellelinjer fra 462 personer blev der f.eks. fastlagt den kodende sekvens for ca. 13 000 gener ud af de 20 078 menneskelige gener.38 I dette eksempel blev ca. 7 000 gener ikke undersøgt, fordi de ikke blev udtrykt i lymfoblasto-cellelinjer. I de tilfælde, hvor den celletype eller det væv, der er påvirket af en given sygdom, er velkendt, vil mRNA-sekventering imidlertid svare til exom-sekventering til undersøgelse af drivermutationer. En anden egenskab ved mRNA-sekventering er, at den gør det muligt at påvise sekvensvariationer, der skyldes RNA-redigering.39 En række mRNA’er behandles således, at nogle nukleotider ændres, og ændringer fra adenosin til inosin er de hyppigst forekommende. Disse ændringer påvises ved mRNA-sekventering, men det kan ikke afgøres, om de er frembragt ved RNA-redigering eller som følge af genomiske variationer, medmindre både mRNA- og genomiske sekvenser sammenlignes.

Bestemmelse af mRNA-ekspressionsniveauer kan være meget praktisk i visse tilfælde, da nogle sygdomme kan være forårsaget af dereguleret ekspression af et eller flere gener. Ændringer i ekspressionsniveauer kan være meget oplysende om sygdommens genetiske oprindelse. Ændringer i ekspressionen af et eller flere gener hos en patient kan f.eks. være tegn på en dysfunktion i de mekanismer, der regulerer deres ekspression. Denne dysfunktion kan skyldes mutationer i de regulerende regioner for gen-transkription, som omtalt i afsnittet om genomsekventering. Den kan også skyldes ændringer i ekspressionen eller strukturen af transkriptionsregulerende faktorer.40 Ændringer i genekspressionen skyldes ofte ændringer i epigenetiske mekanismer til regulering af genekspressionen, f.eks. DNA-methylering, som ikke kan påvises ved genom- eller exomsekventering.41 Der er for nylig blevet udviklet metoder til undersøgelse af methylering af hele genomet, som muliggør en detaljeret undersøgelse af denne epigenetiske information.42 Kræft er en af de sygdomme, hvor der er foretaget flere undersøgelser af genekspressionsniveauer. I et stigende antal tilfælde er ændringer i ekspressionen af gener eller en gruppe af gener forbundet med en kræftdiagnose, prognose eller en forudsigelse af respons på kræftmedicin.43 Disse ændringer i genekspressionen anvendes som biomarkører. Mange af disse undersøgelser er tilgængelige via databasen Cancer Genome Anatomy Project (http://cgap.nci.nih.gov).

En særlig type RNA-sekventeringsprojekt har til formål at bestemme nukleotidsekvensen og ekspressionsniveauet for små regulerende RNA’er (miRNA’er). Små RNA’er regulerer ekspressionen af andre gener ved at bestemme stabiliteten og/eller oversættelsen af deres mRNA’er (figur 1). Ændringer i mønstrene for miRNA-ekspression kan derfor have en markant indvirkning på cellernes og vævenes proteinekspressionsprofil. Der er blevet udviklet protokoller til oprensning og sekventering af den komplette population af miRNA’er i en given prøve og til bestemmelse af deres ekspressionsniveauer.44 De fleste exon-capture-platforme omfatter også op til 80 % af de kendte miRNA-kodende regioner.21

Sekventering af udvalgte sæt af gener

Somme sygdomme er allerede blevet undersøgt så detaljeret, at de fleste af de involverede gener er kendt. Dette kan være tilfældet med sygdomme med et mendelsk arvemønster, hvor alle de undersøgte tilfælde skyldes mutationer i et af en række kendte gener. Andre eksempler er visse kræfttyper, som overvejende skyldes mutationer i et begrænset antal gener. I sådanne tilfælde vil den mere direkte metode til karakterisering af en patientprøve være at bestemme sekvensen af de gener, der tidligere er identificeret som sygdomsfremkaldende. Den klassiske fremgangsmåde ville være at amplificere alle exonerne i disse gener og bestemme nukleotidsekvensen for hvert enkelt af disse gener. Den alternative fremgangsmåde med massiv sekventering ville være at rense alle de pågældende formodede genomiske regioner og samtidig bestemme deres nukleotidsekvens i en enkelt kørsel.45-47 Der anvendes generelt to metoder til rensning af kandidat-DNA-regionerne. Den første er deres amplifikation ved hjælp af polymerasekædereaktioner ved hjælp af et sæt specifikke oligonukleotider som primere. Den anden metode består i fragmentering af prøvens DNA og oprensning af de relevante fragmenter ved hybridisering til specifikke oligonukleotider, enten i opløsning eller fastgjort til en fast substrat, som tidligere beskrevet for oprensning af exoner.48 De udvalgte regioner kan indeholde proteinkodende exoner og også andre DNA-regioner, f.eks. transkriptionsregulerende regioner. Disse regioner svarer normalt til nogle få hundrede gener, og derfor er analysen af de genererede sekvensdata meget lettere end ved andre massive sekventeringsmetoder. Den største begrænsning er, at der er tale om en hypotesedrevet tilgang, som ikke giver mulighed for at påvise mutationer i gener, der ikke tidligere har været relateret til den undersøgte sygdom (tabel 4).

Eksempler på den kliniske anvendelse af exomsekventering

Den mest almindelige anvendelse af exomsekventering er sandsynligvis til diagnosticering af monogene sygdomme. Der er beskrevet over 3 000 monogene sygdomme, selv om de molekylærgenetiske årsager til de fleste af dem stadig er ukendte.1 Exomsekventering kan bruges til at identificere disse mutationer, som Kuhlenbäumer et al1 diskuterer det i en nylig gennemgang. I nogle af de første undersøgelser blev exomsekventering anvendt til at identificere genetiske mutationer, der er ansvarlige for velkendte sygdomme såsom Kabuki’s,49 Schinzel-Giedion,50 Joubert,51 og hyperphosphatasia mental retardation syndromer,52 alvorlige hjernemalformationer,53 eller velkendt amyotrofisk lateralsklerose.54 Exomsekventering er også blevet anvendt til at opdage nye mutationer, der er til stede i et sporadisk tilfælde af mental retardering.29 Desuden er denne teknik blevet anvendt til diagnosticering af f.eks. medfødt kloriddiarré,55 inflammatorisk tarmsygdom,56 Charcot-Marie-Tooth-sygdom,57 neonatal diabetes mellitus,58 eller Brown-Vialetto-van Laere-syndromet.59 Undersøgelsen rapporteret af Worthey et al56 udgør et relevant eksempel på den kliniske anvendelse af exomsekventering. Et mandligt barn præsenterede sig med en Crohns sygdom-lignende sygdom uden en endelig diagnose på trods af en omfattende klinisk vurdering. Forfatterne besluttede at anvende en exomsekventering til at identificere den eller de forårsagende mutationer. Ved analyse af sekvensdataene blev der påvist 16 124 varianter hos patienten. Ved at filtrere dataene under hensyntagen til nye varianter, der er til stede i homozygotisk, hemizygotisk eller sammensat heterozygotisk tilstand, og som påvirker højt konserverede aminosyrerester, der forudsiges at være skadelige for proteinfunktionen, kunne forfatterne vælge en mutation i X-linked inhibitor of apoptosis-genet (XIAP). Funktionelle undersøgelser viste, at denne mutation har betydning for det proinflammatoriske respons, der blev observeret hos patienten. På baggrund af identifikationen af denne mutation blev der foretaget en allogen hæmatopoietisk stamcelletransplantation af hæmatopoietiske progenitorceller. Derfor gjorde exomsekventering det muligt at identificere en ukarakteriseret mutation for at stille en molekylær diagnose for en individuel patient i forbindelse med en ny sygdom, hvilket resulterede i en behandlingsplan. Brugen af exomsekventering til opdagelse af nye forårsagende mutationer og til diagnosticering er for nylig blevet gennemgået.60,61

Undersøgelsen af almindelige og komplekse sygdomme er også blevet grebet an ved hjælp af exomsekventering. Genombreddeassocieringsundersøgelser har vist, at nogle genetiske varianter giver risiko for en række sygdomme. Velkarakteriserede eksempler er apolipoprotein E i Alzheimers sygdom, komplementfaktor H i makuladegeneration eller glucocerebrosidase/leucinrig gentagelseskinase 2 i Parkinsons sygdom.62-64 Den mulige anvendelse af exomsekventering til undersøgelse af komplekse sygdomme er blevet drøftet2,28 . En begrænsning ved brugen af exomsekventering i disse undersøgelser er, at de fleste af de fænotype-associerede varianter ligger distalt fra de proteinkodende regioner, hvilket ville gøre sekventering af hele genomet til en bedre metode.32 Nogle af disse genetiske varianter kan påvirke funktionaliteten af transkriptionregulerende regioner, der styrer genekspressionen. ENCODE-projektet31,65 har foretaget genomdækkende analyser af disse reguleringsregioner, og det blev konstateret, at flere genetiske varianter i specifikke regioner på kromosom 5 (f.eks.) er bindingssteder for transkriptionsfaktoren GATA2, som er stærkt forbundet med Crohns sygdom og andre inflammatoriske sygdomme.

Kræft er sygdomme forårsaget af en akkumulering af genomiske ændringer, der resulterer i en ændring af flere biologiske processer.19 I modsætning til de tidligere omtalte monogene genetiske ændringer er de fleste kræftdrivermutationer ikke til stede i patientens normale væv; en stor del af disse mutationer befinder sig i protein-kodende regioner og kan påvises ved exom-sekventering19 . En anden vigtig gruppe af genetiske ændringer er imidlertid store genomiske reorganiseringer som f.eks. deletioner, inversioner eller translokationer, som ikke kan påvises ved exomsekventering.66 På trods af denne begrænsning er exomsekventering blevet anvendt til opdagelse af kræftdrivergener ved hjælp af to generelle strategier: sammenligning af tumorernes exom med det af raske væv fra den samme patient eller sammenligning af et antal ikke-relaterede patienters exomer med et tilsvarende antal raske kontrolpersoner.67-70 I øjeblikket gennemføres der omfattende undersøgelser, som omfatter sekventering af exomet eller genomet af en stor kohorte af kræftpatienter og kontroller med henblik på at identificere alle kræftdrivergener.19,71,72 Projektet 5.000 cancer genomes er et eksempel,73 da det har til formål at sekventere genomet af 50 af de mest almindelige kræfttyper. De tilgængelige data har allerede givet et generelt genomisk landskab for de mest almindelige kræftformer, som gennemgået af Vogelstein et al.3 Der er blevet identificeret omkring 140 gener, som fremmer tumorigenese, når de er ændret, og dette kan findes i den tidligere nævnte COSMIC-database.3 Påvisning af mutation af et af disse gener i eksomet af en kræftprøve kan være et vigtigt skridt i retning af korrekt diagnose og behandling af patienten. De foreliggende data giver også et indtryk af kræftgenomets kompleksitet.3 Almindelige solide tumorer har et gennemsnitligt antal på 33-66 ikke-silente somatiske mutationer.3 Dette antal stiger til over 200 i tumorer induceret af mutagene stoffer, såsom lungekræft og melanom, og endda til over 1 000 i tumorer med mangel på DNA-reparationsmekanismer eller DNA-polymerase E.3 I modsætning hertil har flydende og pædiatriske tumorer mindre end ti somatiske mutationer.3 Et vigtigt kendetegn ved tumorer er, at de udvikler sig hurtigt og bliver heterogene, således at der kan findes forskellige mutationer i prøver fra den samme patient, der er indsamlet i forskellige regioner eller i forskellige perioder under behandlingen, som det for nylig er blevet påvist ved exomsekventering.74,75 På trods af denne kompleksitet er der ved at opstå nogle forenende koncepter, og de fleste af de kendte kræftdrivergener deltager i en eller flere af de 12 veje, der regulerer celleoverlevelse, celleskæbne og vedligeholdelse af genomet.3,19 I dette scenarie er exomsekventering begyndt at blive anvendt til kræftdiagnostik gennem identifikation af drivermutationer, f.eks. i prostatakræft.76

Eksomsekventering kan også være nyttig til kræftbehandling. Tilstedeværelsen af visse genmutationer kan give følsomhed eller resistens over for et givet lægemiddel, hvilket er blevet kaldt farmakogenomik. F.eks. har man i flere år kendt til brugen af proteintyrosinkinasehæmmere i kræftformer, der overudtrykker proteinerne Abelson murine leukemia viral oncogene homolog 1 (ABL) eller epidermal vækstfaktorreceptor (EGFR). Imidlertid afslører exom- og genomsekventeringsmetoder mange flere mutationsresponser på behandlingsassociationer (som fremhævet i en gennemgang77). Et informativt eksempel er den nylige offentliggørelse af eksomet af NCI-60-panelet af celler.78 Dette panel indeholder 60 velkarakteriserede cellelinjer fra ni kræfttyper og er blevet anvendt i en bred vifte af biologiske og farmakologiske undersøgelser.79 Nukleotidsekvensen af eksomet af disse celler blev bestemt for at fastslå de kræftdrivergener, der er muteret i hver af dem. Ud over at tilvejebringe en liste over formodede nye kræftdrivergener undersøgte forfatterne den mulige sammenhæng mellem genotypen af hver cellelinje og den tidligere bestemte respons på et stort antal kræftbekæmpelsesmidler. Der blev fundet en korrelation mellem specifikke genmutationer og responsen på flere lægemidler, hvilket afslører den mulige betydning af exomsekventering i forbindelse med udvælgelsen af en personlig behandling. Exomsekventering kan også bruges til at forudsige prædisponering for kræft. Nogle eksempler kan findes i en nylig gennemgang centreret om kolorektal cancer og ved hjælp af helgenomsekventering.72

Medicinske udfordringer ved exomsekventering

Exomsekventering lover betydelige forbedringer i patienternes diagnoser, prognoser og personlige behandlinger. Den omfattende anvendelse af denne teknologi kræver imidlertid stadig en række forbedringer samt fastlæggelse af vigtige etiske og medicinske overvejelser, som det er blevet diskuteret i nyere oversigter.23,27,60,61,71,77 De tekniske udfordringer omfatter udvikling af mere effektive teknikker til exonindsamling, sekventering og justering for at opnå en fuldstændig og ensartet repræsentation af alle exonerne i sekvensen. Der er også behov for forbedringer af softwareværktøjerne til dataanalyse med henblik på hurtig og præcis påvisning af patologiske varianter. Omfattende exomsekventering vil kræve implementering af specialudstyr og ansættelse af hold af specialister med tilstrækkelig ekspertise til at generere sekvenserne og til at analysere og fortolke de opnåede data.

Anvendelsen af exomsekventering til diagnosticering vil også kræve implementering af tekniske retningslinjer og bestemmelser. Parametre som f.eks. sekventeringsdybde, exondækning, kvalitetsmetrikker for nukleotidsekvensdata eller alignment calling vil skulle normaliseres. Datalagring bør også reguleres.

Der er også en række komplekse etiske spørgsmål. Et vigtigt spørgsmål er relateret til de oplysninger, der bør gives til patienten. Exomsekventering kan afsløre genetiske variationer, der ikke er relateret til den sygdom, der er diagnosticeret. Patienten kan have genetiske varianter, som udgør risikofaktorer eller kan være årsag til andre sygdomme. Hvilke oplysninger bør patienten få tilbage? Hvilke beviser skal der til for at kunne betragte en genetisk variant som knyttet til en sygdom? Ejerskab, adgang og opbevaring af data er andre relevante spørgsmål. Skal de genererede data opbevares med henblik på eventuel fremtidig brug i patientens levetid? Disse og andre etiske overvejelser vil sandsynligvis give anledning til betydelige kontroverser80 og vil kræve omfattende drøftelser for at nå til enighed om de kriterier, der skal anvendes i klinisk praksis.

Slutning

Exomsekventering er allerede et effektivt redskab, der anvendes til at bestemme det molekylære grundlag for genetiske sygdomme. Dybden af den genetiske analyse er mindre end ved sekventering af hele genomet, da genetiske variationer i ikke-protein-kodende regioner ikke påvises. Det reducerede antal sekvenser og sekvensanalyser, der kræves ved exomsekventering, gør det imidlertid til en mere overkommelig metode i klinisk praksis. Derfor vil exomsekventering sandsynligvis være den foretrukne teknik til den indledende analyse af patienter, i det mindste indtil prisen på helgenomsekventering falder, og den betydelige dataanalyseprocedure forbedres. En vigtig begrænsning for anvendelsen af exomsekventering i klinisk praksis er, at den funktionelle betydning af de fleste af de forventede genetiske varianter stadig er ukendt. Denne situation er ved at ændre sig hurtigt i takt med, at et stigende antal sygdomsrelaterede genetiske varianter bestemmes og gøres tilgængelige i offentlige databaser. Det er sandsynligt, at man om få år vil kende de fleste genetiske variationer, der er forbundet med risikoen for at få en sygdom, med præcis molekylær diagnostik, en forudsigelse af sygdomsudviklingen og et farmakologisk svar, og at man om få år vil kende de fleste af de genetiske variationer, der er forbundet med risikoen for at få en sygdom. Den præcise viden om patientens exom, eller genom, vil da være en afgørende faktor i den medicinske praksis.

Anerkendelser

Jeg takker Rosario Perona og Juliette Siegfried (ServingEdit.com) for en kritisk gennemgang af manuskriptet.

Oplysning

Forfatteren rapporterer ingen interessekonflikter i forbindelse med dette arbejde.

Kuhlenbäumer G, Hullmann J, Appenzeller S. Novel genomic techniques open new avenues in the analysis of monogenic disorders. Hum Mutat. 2011;32(2):144-151.

Kiezun A, Garimella K, Do R, et al. Exome sequencing and the genetic basis of complex traits. Nat Genet. 2012;44(6):623-630.

Vogelstein B, Papadopoulos N, Velculescu VE, Zhou S, Diaz LA Jr, Kinzler KW. Kræftgenomlandskaber. Science. 2013;339(6127):1546-1558.

Kirwan M, Dokal I. Dyskeratosis congenita: en genetisk lidelse med mange ansigter. Clin Genet. 2008;73(2):103-112.

Walne AJ, Dokal I. Advances in the understanding of dyskeratosis congenita. Br J Haematol. 2009;145(2):164-172.

Brady PD, Vermeesch JR. Genomiske mikroarrays: en teknologioversigt. Prenat Diagn. 2012;32(4):336-343.

Hehir-Kwa JY, Pfundt R, Veltman JA, de Leeuw N. Patogen eller ej? Vurdering af den kliniske relevans af kopieringsnummervarianter. Clin Genet. 2013;84(5):415-421.

Simons A, Sikkema-Raddatz B, de Leeuw N, Konrad NC, Hastings RJ, Schoumans J. Genome-wide arrays in routine diagnostics of hematological malignancies. Hum Mutat. 2012;33(6):941-948.

Metzker ML. Sekventeringsteknologier – den næste generation. Nat Rev Genet. 2010;11(1):31-46.

Sastre L. Nye DNA-sekventeringsteknologier åbner en lovende æra for forskning og behandling af kræft. Clin Transl Oncol. 2011;13(5):301-306.

Lander ES, Linton LM, Birren B, et al. International Human Genome Sequencing Consortium. Indledende sekventering og analyse af det menneskelige genom. Nature. 2001;409(6822):860-921.

Abecasis GR, Auton A, Brooks LD, et al. 1000 Genomes Project Consortium. Et integreret kort over genetisk variation fra 1 092 menneskelige genomer. Nature. 2012;491(7422):56-65.

Yang Y, Liu R, Xie H, et al. Advances in nanopore sequencing technology. J Nanosci Nanotechnol. 2013;13(7):4521-4538.

Chen YS, Lee CH, Hung MY, Pan HA, Chiou JC, Huang GS. DNA-sekventering ved hjælp af elektriske konduktansmålinger af en DNA-polymerase. Nat Nanotechnol. 2013;8(6):452-458.

Lu ZX, Jiang P, Xing Y. Genetisk variation af alternativ splejsning af pre-mRNA i menneskelige populationer. Wiley Interdiscip Rev RNA. 2012;3(4):581-592.

Pruitt KD, Harrow J, Harte RA, et al. The consensus coding sequence (CCDS) project: Identificering af et fælles sæt proteinkodningsgener for menneskets og musens genomer. Genome Res. 2009;19(7):1316-1323.

Harrow J, Frankish A, Gonzalez JM, et al. GENCODE: The reference human genome annotation for The ENCODE Project. Genome Res. 2012;22(9):1760-1774.

Teer JK, Mullikin JC. Exomsekventering: det søde punkt før hele genomer. Hum Mol Genet. 2010;19(R2):R145-R151.

Liu X, Wang J, Chen L. Whole-exome sequencing reveals recurrent somatic mutation networks in cancer. Cancer Lett. 2013;340(2):270-276.

Parla JS, Iossifov I, Grabill I, Spector MS, Kramer M, McCombie WR. En sammenlignende analyse af exome capture. Genome Biol. 2011; 12(9):R97.

Sulonen AM, Ellonen P, Almusa H, et al. Comparison of solution-based exome capture methods for next generation sequencing. Genome Biol. 2011;12(9):R94.

Clark MJ, Chen R, Lam HY, et al. Performance comparison of exome DNA sequencing technologies. Nat Biotechnol. 2011;29(10):908-914.

Gullapalli RR, Desai KV, Santana-Santos L, Kant JA, Becich MJ. Næste generations sekventering i klinisk medicin: Udfordringer og erfaringer for patologi og biomedicinsk informatik. J Pathol Inform. 2012;3:40.

Samuels DC, Han L, Li J, et al. Finding the lost treasures in exome sequencing data. Trends Genet. 2013;29(10):593-599.

Taneri B, Asilmaz E, Gaasterland T. Biomedical impact of splicing mutations revealed through exome sequencing. Mol Med. 2012;18:314-319.

Fu W, O’Connor TD, Jun G, et al; NHLBI Exome Sequencing Project. Analyse af 6 515 exomer afslører den nyere oprindelse af de fleste menneskelige proteinkodningsvarianter. Nature. 2013;493(7431):216-220.

Marian AJ. Udfordringer i forbindelse med medicinske anvendelser af opdagelser i forbindelse med sekventering af hele eksomer/genomer. Trends Cardiovasc Med. 2012;22(8):219-223.

Singleton AB. Exomsekventering: en transformativ teknologi. Lancet Neurol. 2011;10(10):942-946.

Vissers LE, de Ligt J, Gilissen C, et al. A de novo paradigm for mental retardation. Nat Genet. 2010;42(12):1109-1112.

Gonzalez-Perez A, Perez-Llamas C, Deu-Pons J, et al. IntOGen-mutations identificerer kræftdrivere på tværs af tumortyper. Nat Methods. 2013;10(11):1081-1082.

Bernstein BE, Birney E, Dunham I, Green ED, Gunter C, Snyder M; ENCODE Project Consortium. En integreret encyklopædi over DNA-elementer i det menneskelige genom. Nature. 2012;489(7414):57-74.

Hardison RC. Epigenetiske data på tværs af genomet letter forståelsen af foreningsundersøgelser af sygdomsfølsomhed. J Biol Chem. 2012;287;287(37):30932-30940.

Weedon MN, Cebola I, Patch AM, et al. International Pancreatic Agenesis Consortium. Recessive mutationer i en distal PTF1A-forstærker forårsager isoleret pancreatisk agenese. Nat Genet. 2014;46(1):61-64.

Wang Z, Gerstein M, Snyder M. RNA-Seq: et revolutionerende værktøj til transkriptomik. Nat Rev Genet. 2009;10(1):57-63.

Mutz KO, Heilkenbrinker A, Lönne M, Walter JG, Stahl F. Transkriptomanalyse ved hjælp af næste-generations-sekventering. Curr Opin Biotechnol. 2013;24(1):22-30.

Hitzemann R, Bottomly D, Darakjian P, et al. Gener, adfærd og næste-generations RNA-sekventering. Genes Brain Behav. 2013;12(1):1-12.

Costa V, Aprile M, Esposito R, Ciccodicola A. RNA-Seq and human complex diseases: recent accomplishments and future perspectives. Eur J Hum Genet. 2013;21(2):134-142.

Lappalainen T, Sammeth M, Friedländer MR, et al; Geuvadis Consortium; Geuvadis Consortium. Transkriptom- og genomsekventering afdækker funktionel variation hos mennesker. Nature. 2013; 501(7468):506-511.

Slotkin W, Nishikura K. Adenosin-til-inosin RNA-redigering og menneskelig sygdom. Genome Med. 2013;5:105.

Lee TI, Young RA. Transkriptionel regulering og dens fejlregulering i sygdom. Cell. 2013;152(6):1237-1251.

Suvà ML, Riggi N, Bernstein BE. Epigenetisk omprogrammering i kræft. Science. 2013;339(6127):1567-1570.

Li P, Demirci F, Mahalingam G, Demirci C, Nakano M, Meyers BC. En integreret arbejdsgang til DNA-methyleringsanalyse. J Genet Genomics. 2013;40(5):249-260.

Chibon F. Cancer gene expression signatures – the rise and fall? Eur J Cancer. 2013;49:2000-2009.

Dedeoğlu BG. High-throughput-tilgange til mikroRNA-ekspressionsanalyse. Methods Mol Biol. 2014;1107:91-103.

Ni T, Wu H, Song S, Jelley M, Zhu J. Selective gene amplification for high-throughput sequencing. Recent Pat DNA Gene Seq. 2009; 3(1):29-38.

Barretina J, Caponigro G, Stransky N, et al. The Cancer Cell Line Encyclopedia enables predictive modelling of anticancer drug sensitivity. Nature. 2012;483(7391):603-607.

Garnett MJ, Edelman EJ, Heidorn SJ, et al. Systematisk identifikation af genomiske markører for lægemiddelfølsomhed i kræftceller. Nature. 2012;483(7391):570-575.

Hoischen A, Gilissen C, Arts P, et al. Massively parallel sequencing of ataxia genees after array-based enrichment. Hum Mutat. 2010;31(4):494-499.

Ng SB, Bigham AW, Buckingham KJ, et al. Exome sequencing identifies MLL2-mutationer som årsag til Kabuki-syndromet. Nat Genet. 2010;42(9):790-793.

Hoischen A, van Bon BW, Gilissen C, et al. De novo mutationer af SETBP1 forårsager Schinzel-Giedions syndrom. Nat Genet. 2010;42(6):483-485.

Edvardson S, Shaag A, Zenvirt S, et al. Joubert syndrom 2 (JBTS2) hos Ashkenazi-jøder er forbundet med en TMEM216-mutation. Am J Hum Genet. 2010;86(1):93-97.

Krawitz PM, Schweiger MR, Rödelsperger C, et al. Identity-by-descent-filtrering af exomsekvensdata identificerer PIGV-mutationer i hyperphosphatasia mental retardation syndrome. Nat Genet. 2010;42(10):827-829.

Bilgüvar K, Oztürk AK, Louvi A, et al. Whole-exome sequencing identifies recessive WDR62-mutationer i alvorlige hjernemalformationer. Nature. 2010;467(7312):207-210.

Johnson JO, Mandrioli J, Benatar M, et al. ITALSGEN Consortium. Exomsekventering afslører VCP-mutationer som årsag til familiær ALS. Neuron. 2010;68(5):857-864.

Choi M, Scholl UI, Ji W, et al. Genetisk diagnose ved hjælp af hel eksomopsamling og massivt parallel DNA-sekventering. Proc Natl Acad Sci U S A. 2009;106(45):19096-19101.

Worthey EA, Mayer AN, Syverson GD, et al. Making a definitive diagnosis: successful clinical application of whole exome sequencing in a child with intractable inflammatory bowel disease (at stille en endelig diagnose: vellykket klinisk anvendelse af whole exome sequencing hos et barn med en hårdfør inflammatorisk tarmsygdom). Genet Med. 2011;13(3):255-262.

Montenegro G, Powell E, Huang J, et al. Exomsekventering giver mulighed for hurtig genidentifikation i en Charcot-Marie-Tooth-familie. Ann Neurol. 2011;69(3):464-470.

Bonnefond A, Durand E, Sand O, et al. Molekylær diagnose af neonatal diabetes mellitus ved hjælp af næste generations sekventering af det hele exom. PLoS One. 2010;5(10):e13630.

Johnson JO, Gibbs JR, Van Maldergem L, Houlden H, Singleton AB. Exomsekventering i forbindelse med Brown-Vialetto-van Laere-syndromet. Am J Hum Genet. 2010;87(4):567-9; forfatterbesvarelse 569.

Bras JM, Singleton AB. Exomsekventering ved Parkinsons sygdom. Clin Genet. 2011;80(2):104-109.

Topper S, Ober C, Das S. Exome sequencing and the genetics of intellectual disability. Clin Genet. 2011;80(2):117-126.

Corder EH, Saunders AM, Strittmatter WJ, et al. Gendosis af apolipoprotein E type 4 allel og risikoen for Alzheimers sygdom i familier med sen debut. Science. 1993;261(5123):921-923.

Klein RJ, Zeiss C, Chew EY, et al. Komplementfaktor H-polymorfi i aldersrelateret makuladegeneration. Science. 2005;308(5720):385-389.

Tan EK. Identifikation af en fælles genetisk risikovariant (LRRK2 Gly2385Arg) i Parkinsons sygdom. Ann Acad Med Singapore. 2006;35(11):840-842.

Libioulle C, Louis E, Hansoul S, et al. Novel Crohn disease locus identified by genome-wide association maps to a gene desert on 5p13.1 and modulates expression of PTGER4. PLoS Genet. 2007;3(4):e58.

Stephens PJ, Greenman CD, Fu B, et al. Massive genomiske omlægninger erhvervet i en enkelt katastrofal begivenhed under kræftudvikling. Cell. 2011;144(1):27-40.

Jones S, Zhang X, Parsons DW, et al. Core signaling pathways in human pancreatic cancers revealed by global genomic analyses. Science. 2008;321(5897):1801-1806.

Parsons DW, Jones S, Zhang X, et al. En integreret genomisk analyse af menneskelig glioblastoma multiforme. Science. 2008;321(5897):1807-1812.

Timmermann B, Kerick M, Roehr C, et al. Somatiske mutationsprofiler af MSI- og MSS-kolorektal cancer identificeret ved næste generations sekventering og bioinformatisk analyse af hele eksomet og bioinformatik. PLoS One. 2010;5(12):e15661.

Varela I, Tarpey P, Raine K, et al. Exomsekventering identificerer hyppig mutation af SWI/SNF-kompleksgenet PBRM1 i nyrekarcinom. Nature. 2011;469(7331):539-542.

Ku CS, Cooper DN, Roukos DH. Klinisk relevans af kræftgenomsekventering. World J Gastroenterol. 2013;19(13):2011–2018.

Kilpivaara O, Aaltonen LA. Diagnostisk cancergenomsekventering og bidraget fra germlinevarianter. Science. 2013;339(6127):1559-1562.

Hudson TJ, Anderson W, Artez A, et al; International Cancer Genome Consortium. Internationalt netværk af kræftgenomprojekter. Nature. 2010;464(7291):993-998.

Gerlinger M, Rowan AJ, Horswell S, et al. Intratumor heterogeneity and branched evolution revealed by multiregion sequencing. N Engl J Med. 2012;366(10):883-892.

Ren SC, Qu M, Sun YH. Undersøgelse af intratumor-heterogenitet ved hjælp af sekventering af enkeltceller. Asian J Androl. 2013;15(6):729-734.

Hieronymus H, Sawyers CL. Gennemgang af det genomiske landskab for prostatakræft fra diagnose til død. Nat Genet. 2012;44(6):613-614.

McLeod HL. Cancerfarmakogenomik: tidligt løfte, men der er behov for en samordnet indsats. Science. 2013;339(6127):1563-1566.

Abaan OD, Polley EC, Davis SR, et al. The exomes of the NCI-60 panel: a genomic resource for cancer biology and systems pharmacology. Cancer Res. 2013;73(14):4372-4382.

Weinstein JN. Medicinopdagelse: Cellelinjer kæmper mod kræft. Nature. 2012;483;544:544-545.

Shahmirzadi L, Chao EC, Palmaer E, Parra MC, Tang S, Gonzalez KD. Patientbeslutninger vedrørende offentliggørelse af sekundære fund blandt de første 200 personer, der gennemgik klinisk diagnostisk exomsekventering. Genet Med. Epub October 10, 2013.

Flicek P, Amode MR, Barrell D, et al. Ensembl 2011. Nucleic Acids Res. 2011;39:D800-D806.

Pruitt KD, Tatusova T, Klimke W, Maglott DR. NCBI-referencesekvenser: nuværende status, politik og nye initiativer. Nucleic Acids Res. 2009;37:D32-D36.

Skriv et svar

Din e-mailadresse vil ikke blive publiceret.