Einführung

Zahlreiche Krankheiten haben eine genetische Grundlage. Einige sind die Folge des Fehlens oder der Funktionsstörung eines bestimmten Proteins aufgrund von Mutationen im kodierenden Gen. Dies ist der Fall bei Krankheiten mit Mendelschem Erbgang, wie der Huntington-Krankheit, der Thalassämie und etwa 1.000 anderen seltenen Erbkrankheiten.1 Viele Krankheiten haben eine genetische Grundlage, auch wenn sie nicht ausschließlich auf die Mutation eines einzigen Gens zurückzuführen sind, und immer mehr genetische Varianten und Polymorphismen werden als Risikofaktoren für komplexe Krankheiten identifiziert.2 Krebs ist eine genetische Krankheit, die durch die Mutation eines oder mehrerer Gene verursacht wird, die entweder das Krebsrisiko erhöhen (z. B. Keimbahnmutationen), Krebs fördern (Onkogene) oder die zellulären Mechanismen zur Kontrolle der Zellvermehrung beeinträchtigen (Suppressorgene), wie dies bei somatischen Mutationen der Fall ist.3

Die Identifizierung der genetischen Grundlagen dieser Krankheiten war bis vor einigen Jahren ein arbeitsintensives und anspruchsvolles Projekt. Diese Projekte begannen oft mit der Identifizierung einer Genomregion, die möglicherweise an der Übertragung der Krankheit beteiligt ist, durch genetische Assoziationsstudien.1 Die Analyse großer Familien mit mehreren betroffenen Mitgliedern ist in der Regel erforderlich, um eine Genomregion zu definieren, die in hohem Maße mit der Krankheitsübertragung verbunden ist. In der Regel enthält diese Region mehrere Gene, die sequenziert werden müssen, um eine Genmutation zu identifizieren, die im Falle eines dominanten Erbgangs bei allen betroffenen Personen und nicht bei ihren gesunden Verwandten auftritt. Bei rezessiver Vererbung sollte die Mutation in beiden Allelen der betroffenen Mitglieder und in einem oder keinem der Allele der nicht betroffenen Verwandten vorhanden sein.

Die Diagnose genetisch bedingter Krankheiten war und ist in den meisten Fällen immer noch gleichermaßen mühsam. Im günstigsten Fall kann die Krankheit auf eine Mutation in nur einem Gen zurückgehen. Für die Diagnose müsste dann nur die Nukleotidsequenz dieses Gens bestimmt werden. In der Regel wird das Gen in Form mehrerer Fragmente durch Polymerase-Kettenreaktionen vervielfältigt, und die Nukleotidsequenz jedes einzelnen wird bestimmt. Häufig kann die Krankheit durch Mutationen in einem von mehreren Genen verursacht werden, die alle amplifiziert und sequenziert werden müssen, um den genetischen Ursprung der Krankheit bei den betroffenen Patienten zu ermitteln. Bei der Dyskeratosis congenita beispielsweise können Mutationen in einem der Gene dkc, tert, terc, NOP10, NH2 oder TINF2 gefunden werden, und die Zahl der betroffenen Gene kann sogar noch größer sein, da es einen Teil der Patienten gibt, bei denen die ursächliche Mutation nicht identifiziert wurde.4,5 Für die molekulare Diagnose eines jeden Patienten muss die Nukleotidsequenz all dieser Gene bestimmt werden. Bei verschiedenen Krebsarten finden wir mehrere mutierte Gene.3 Die molekulare Diagnose erfordert die Bestimmung der Nukleotidsequenz mehrerer dieser Gene. Derzeit ist dies ein mühsames und teures Verfahren, das nicht für eine große Patientenpopulation eingesetzt werden kann. In der Praxis werden nur einige wenige Gene, die bei einem bedeutenden Anteil der von bestimmten Krebsarten betroffenen Patienten mutiert sind, für die Diagnose und Behandlung sequenziert.

Erst in den letzten Jahren wurden Techniken für den gleichzeitigen Nachweis mehrerer Sequenzvarianten in einer bestimmten Probe entwickelt. Viele von ihnen basieren auf der Desoxyribonukleinsäure (DNA)-Mikroarray-Technologie. Bei Genotypisierungsarrays werden Oligonukleotide, die die aktiv identifizierten Mutationen im Zusammenhang mit einer bestimmten Krankheit enthalten, auf einen Objektträger aufgebracht. Die DNA-Probe eines Patienten wird auf den Objektträger aufgetragen und die hybridisierenden Oligonukleotide werden identifiziert. Mit einer einzigen Microarray-Hybridisierung können Millionen bekannter Mutationen getestet werden.6 Auch Kopienzahlvariationen können mit Hilfe von DNA-Microarrays analysiert werden, die darauf ausgelegt sind, das Vorhandensein von DNA-Regionen nachzuweisen, die in der DNA des Patienten dupliziert oder gelöscht sind.7 Diese Techniken werden häufig in der medizinischen Forschung und für die klinische Diagnose eingesetzt.8

Ein wichtiger Schritt in der Molekularmedizin war jedoch die jüngste Entwicklung von Massensequenzierungstechnologien, die es ermöglichen, die Nukleotidsequenz der DNA eines Patienten in kurzer Zeit und zu einem erschwinglichen Preis zu bestimmen.9,10 Diese Methoden werden seit 2005 eingesetzt und beruhen auf der gleichzeitigen Bestimmung der Nukleotidsequenz von Millionen von DNA-Fragmenten. Sie werden als Sequenzierung der zweiten Generation, Next Generation Sequencing, Deep Sequencing oder Massively Parallel Sequencing bezeichnet. Mit diesen Geräten werden Tausende von Millionen von Nukleotidsequenzen in nicht mehr als 2 Wochen bestimmt. Als Beispiel für die Leistungsfähigkeit dieser neuen Sequenzierungssysteme sei darauf hingewiesen, dass die 2001 veröffentlichte Sequenzierung des ersten menschlichen Genoms11 die koordinierte Arbeit von 23 Labors erforderte, die 13 Jahre dauerte und insgesamt etwa 3 Milliarden US-Dollar kostete. Mit den neuen Methoden dauert die Sequenzierung eines menschlichen Genoms ein Labor und etwa 2 Wochen, bei geschätzten Kosten von 4.000 US-Dollar.

Die Verfügbarkeit moderner Sequenzierungsmethoden führt zu einem exponentiellen Wachstum unseres Wissens über das menschliche Genom, die Variabilität zwischen Individuen und die Identifizierung genetischer Varianten bei Krankheiten. Diese Methoden bilden beispielsweise die Grundlage des laufenden 1000-Genome-Projekts12 , das darauf abzielt, die vollständige Nukleotidsequenz von etwa 1.000 Personen unterschiedlicher geografischer und ethnischer Herkunft zu bestimmen, um die durchschnittliche Sequenzvariation zwischen den Individuen zu ermitteln und die häufigsten Polymorphismen zu identifizieren.

Massive Sequenzierungstechnologien entwickeln sich derzeit in rasantem Tempo weiter. Es werden kleinere, schnellere Geräte entwickelt und neue Sequenzierungsmethoden eingeführt. Ein wichtiges Ziel ist beispielsweise die Sequenzierung eines einzigen DNA-Moleküls aus einer einzelnen Zelle.13,14 Abgesehen von den technischen Herausforderungen sinken die Preise für die DNA-Sequenzierung stetig, so dass das Ziel, ein einzelnes menschliches Genom für 1.000 US-Dollar zu sequenzieren, in einigen Jahren in greifbare Nähe zu rücken scheint. Gegenwärtig ist die Sequenzierung des gesamten menschlichen Genoms und die Analyse aller erzeugten Sequenzdaten komplex, teuer und zeitaufwändig, und viele Studien werden an einem kleineren Teil des Genoms durchgeführt. Insbesondere der Sequenzierung der proteinkodierenden Region des Genoms, dem so genannten Exom, wird derzeit viel Aufmerksamkeit gewidmet. Die Exom-Sequenzierung ist weitaus erschwinglicher als die Sequenzierung des gesamten Genoms, und die Möglichkeiten, Vorteile und Grenzen dieser Technik werden in dieser Übersicht erörtert.

Was ist ein Exom?

Nahezu alle menschlichen proteinkodierenden Gene haben eine diskontinuierliche Struktur. Die proteinkodierende Region ist in mehrere Teile, sogenannte Exons, unterteilt. Die Exons sind durch nicht-proteincodierende DNA-Fragmente, so genannte Introns, verbunden, wie in Abbildung 1 schematisch dargestellt. Die Transkription von Genen erfolgt von der Promotorregion aus unter der Kontrolle mehrerer regulatorischer Regionen, die sich an verschiedenen Stellen in Bezug auf das Gen befinden, stromaufwärts, stromabwärts oder sogar innerhalb des Gens. Bei der Transkription entsteht ein primäres Transkript, das Exons und Introns enthält. Nachfolgende Ribonukleinsäure (RNA)-Spleißprozesse löschen die Introns und fügen die Exons zusammen, um die reife Boten-RNA (mRNA) zu erzeugen, die nur eine durchgehende proteinkodierende Region enthält. Jüngste Studien zeigen, dass die primären Transkripte der meisten Gene auf verschiedene Weise gespleißt werden können, so dass verschiedene reife mRNAs mit spezifischen Kombinationen von Exons entstehen, die als alternative Spleißvarianten bekannt sind (Abbildung 1). Diese mRNAs kodieren für Protein-Isoformen, die einige gemeinsame Regionen haben, sich aber auch von anderen unterscheiden, je nachdem, welche Exons eingebaut sind.15

Die Analyse des menschlichen Genoms hat gezeigt, dass proteinkodierende Gene nur einen kleinen Anteil der DNA ausmachen, nämlich nur etwa 3 %.16 Exons machen mit 1 % des Genoms einen noch kleineren Anteil aus.16 Eine Zusammenfassung dieser Daten ist in Tabelle 1 dargestellt. Das menschliche Genom besteht aus 3,3 ×109 Basenpaaren (bp) und enthält 20.078 proteinkodierende Gene.17 Jedes Gen ist in durchschnittlich acht Exons unterteilt, die jeweils etwa 170 bp lang sind. Alle Exons zusammengenommen enthalten etwa 3 ×107 bp. Die Sequenzierung aller Exons liefert jedoch dieselben Informationen über die Aminosäuresequenz der kodierten Proteine wie die Sequenzierung des gesamten Genoms, mit Ausnahme von Mutationen, die das mRNA-Spleißen verändern, wie im Abschnitt Exom-Sequenzierung und Datenanalyse erläutert wird. Dieses System der Sequenzierung aller Exons wurde als Exom-Sequenzierung bezeichnet und hat sich zu einer validen Methode zum Nachweis von Variationen in der Aminosäuresequenz aller menschlichen Proteine entwickelt.18 Aufgrund des sehr deutlichen Größenunterschieds ist die Exom-Sequenzierung wesentlich kostengünstiger als die Genom-Sequenzierung, was die rechnerische und funktionelle Analyse der erzeugten Sequenzdaten erleichtert.

Abbildung 1 Schematische Darstellung von Genstruktur und -expression.
Anmerkungen: Protein-kodierende Gene bestehen aus Exons, die protein-kodierende Informationen enthalten (Kästen), getrennt durch nicht-kodierende Introns (Linien). Graue Kästchen kennzeichnen die proteincodierenden Exon-Regionen und weiße Kästchen die mRNA 5′- und 3′-untranslatierten Regionen. Die Gene werden von den Promotorregionen unmittelbar stromaufwärts von Exon 1 transkribiert. Die Transkriptionsstartstelle ist durch einen Pfeil gekennzeichnet. Die Genexpression wird durch eine Reihe von TR-Regionen gesteuert, die sich stromaufwärts oder stromabwärts des Gens, in unterschiedlichen Abständen oder innerhalb des Gens (am häufigsten in Introns) befinden können. Die mRNA-Stabilität und -Translation kann durch die Bindung von microRNA an spezifische Stellen in der 3′ untranslatierten Region (durch Sternchen gekennzeichnet) reguliert werden. Gene werden in primäre RNAs transkribiert, die Introns und Exons enthalten. Nachfolgende Spleißprozesse eliminieren die Introns, um reife mRNAs zu erzeugen. Alternative Spleißprozesse können zu unterschiedlichen mRNAs führen, je nachdem, welche Exons sie enthalten (mRNA1, mRNA2), die für unterschiedliche Protein-Isoformen kodieren.
Abkürzungen: TR, transcription regulatory region; RNA, Ribonukleinsäure; mRNA, messenger ribonucleic acid.

Tabelle 1 Allgemeine Merkmale des menschlichen Genoms und Exoms

Exom-Capture-Techniken

Der erste und wichtigste Schritt bei der Exom-Sequenzierung ist die Isolierung oder das Capture der Exons. Die angewandten Methoden basieren auf der DNA-Hybridisierung. Die Analyse des menschlichen Genoms hat die Identifizierung aller Gen-Exons ermöglicht und erleichtert die Entwicklung von Oligonukleotid-Sonden, die für jedes Exon spezifisch sind. Die Sonden werden für die Reinigung der Exons aus der DNA verwendet.19 Der erste Schritt ist die Fragmentierung der DNA in Stücke, die nicht größer als 500 bp sind. Die DNA wird dann mit den exonspezifischen Oligonukleotid-Sonden hybridisiert und die hybridisierten Fragmente werden gereinigt. Die Hybridisierung kann in der Flüssigphase durchgeführt werden. In diesem Fall werden die Oligonukleotide markiert, so dass die DNA-Oligonukleotid-Komplexe von der Masse der nicht hybridisierten DNA getrennt werden können. In einem gängigen Beispiel werden Oligonukleotide kovalent an Biotin gebunden, so dass DNA-Oligonukleotid-Hybride mit Hilfe des biotinbindenden Moleküls Streptavidin, das an Magnetkügelchen gekoppelt ist, isoliert werden können. DNA-Fragmente, die keine Exons enthalten, binden nicht an die Streptavidin-Beads und können nach mehreren Waschschritten effizient entfernt werden. Die an die Beads gebundenen Fragmente, die Exons enthalten, können nach Dissoziation der DNA-Oligonukleotid-Hybride unter Bedingungen mit geringer Ionenstärke wiedergewonnen werden.

Exons können auch durch Hybridisierung auf einen festen Träger isoliert werden, auf den die Exon-spezifischen Oligonukleotide aufgetragen wurden, wie bei DNA-Mikroarrays. In diesem Fall wird die fragmentierte DNA über die Oligonukleotide verteilt, um die Hybridisierung zu ermöglichen. Später wird die nicht hybridisierte DNA weggewaschen und die mit Exonen angereicherte DNA unter niedrig-ionischen Bedingungen eluiert.

Verschiedene kommerzielle Anbieter bieten Kits für die Exom-Isolierung mit Flüssigphasen-Hybridisierungsprotokollen an, darunter Agilent Technologies (Santa Clara, CA, USA), Roche NimbelGen, Inc. (Madison, WI, USA), Illumina, Inc. (San Diego, CA, USA), und Life Technologies (Carlsbad, CA, USA). Diese Kits ermöglichen die Isolierung von über 90 % der im Genom vorhandenen Exons mit einer Spezifität von über 90 % zu einem Preis von ca. 150 US-Dollar pro Exom. Mehrere Autoren haben diese Exom-Capture-Plattformen miteinander verglichen,20-22 und die von Clark et al22 erhaltenen Daten zum Vergleich des SureSelect Human All Exon 50 Mb (Agilent Technologies), der SeqCap EZ Exome Library v2.0 von Roche NimbleGen, Inc. und der TruSeq Exome Enrichment Kits von Illumina, Inc. sind in Tabelle 2 zusammengefasst. Einige der Kits decken zusätzlich zu den proteinkodierenden Regionen auch die nichttranslatierten Regionen der mRNA ab, was die Analyse von regulatorischen Regionen wie microRNA (miRNA)-Bindungsstellen ermöglicht. Die Einbeziehung der untranslatierten 5′-Regionen ermöglicht auch die Analyse der proximalen Promotorregionen.22 Darüber hinaus decken die meisten Kits bis zu 80 % der miRNA-kodierenden Regionen ab.21 In letzter Zeit wurden von diesen und anderen Anbietern verbesserte Kits entwickelt, so dass die in Tabelle 2 aufgeführten Daten nur als Anhaltspunkt betrachtet werden sollten. Es ist wichtig zu beachten, dass die Exon-Reinigung ein kritischer Schritt ist. Es ist schwierig, 100 % der Exons zu gewinnen, und häufig gehen Exons im isolierten Exom verloren oder sind unterrepräsentiert. Wenn beispielsweise das Exom eines Patienten analysiert wird und 10 % der Exons während der Aufreinigung verloren gehen, beträgt die Wahrscheinlichkeit, dass eine relevante Mutation aufgrund dieses technischen Fehlers übersehen wird, etwa 10 %. Daher ist die Verwendung hocheffizienter Exon-Capture-Verfahren bei der Exom-Sequenzierung von entscheidender Bedeutung.

Tabelle 2 Vergleich der drei wichtigsten Exom-Capture-Plattformen
Anmerkungen: aVergleich der Datenbanken Ensemble81 bzw. RefSeq82; bProzentsatz der ausgewählten Regionen, die von jeder Plattform nach der Analyse von 80 Megareads der DNA-Sequenz mindestens zehnmal sequenziert wurden. Agilent Technologies (Santa Clara, CA, USA); Roche NimbelGen, Inc. (Madison, WI, USA); Illumina, Inc. (San Diego, CA, USA).
Abkürzungen: mRNA, Boten-Ribonukleinsäure; miRNA, Mikro-Ribonukleinsäure; DNA, Desoxyribonukleinsäure.

Exom-Sequenzierung und Datenanalyse

Exonhaltige Fragmente werden mit einem der derzeit verfügbaren massiven Sequenzierungssysteme oder -technologien sequenziert. Wie in der Einleitung erwähnt, bestimmen diese Plattformen die Nukleotidsequenz von Millionen von DNA-Fragmenten gleichzeitig. Die bei der Exom-Sequenzierung ermittelte Sequenzlänge der einzelnen Fragmente ist nicht lang und liegt in der Regel zwischen 35 bp und 100 bp. Da die DNA jedoch ursprünglich zufällig fragmentiert wurde, ist jedes einzelne Nukleotid in vielen sich überlappenden Fragmenten vorhanden. Wenn also eine ausreichend große Anzahl von Sequenzen erhalten wird, auch wenn sie kurz sind, wird jede Base in mehreren DNA-Fragmenten unabhängig voneinander sequenziert. Wie oft jede Base sequenziert wird, nennt man Abdeckung oder Sequenzierungstiefe. Die Abdeckungsrate steht in direktem Zusammenhang mit der Qualität und Zuverlässigkeit der erzeugten Nukleotidsequenz. Im Allgemeinen wird eine Abdeckung von 20×-30× als notwendig erachtet, um zuverlässige Ergebnisse bei der Exom-Sequenzierung zu erhalten.59 Diese Sequenzierungstiefe bedeutet, dass eine mögliche Sequenzvariation unabhängig in 20-30 verschiedenen DNA-Fragmenten sequenziert worden wäre.

Die Datenanalyse ist der letzte Schritt bei Exom-Sequenzierungsprojekten (Abbildung 2). Wie bereits erwähnt, werden Daten von Millionen von Sequenzen generiert, deren Analyse spezifische und komplexe Computerprogramme und Fachwissen erfordert.19,23 Ein erster Schritt ist die Analyse der Qualität der generierten Sequenz. Dabei werden die Genauigkeit der Sequenzlesung bei verschiedenen Sequenzlängen, die durchschnittliche Länge der Reads sowie andere Parameter getestet. Wenn die Qualität gut genug ist, wird jede Sequenz mit einer Referenzsequenz verglichen, bei der es sich in der Regel um die letzte verfügbare Version der menschlichen Genomsequenz handelt. In der Regel können über 80 % der erzeugten Sequenzen mit dem Referenzgenom abgeglichen werden.22 Bei diesem Schritt ist ein geringes Maß an Nukleotidvariationen gegenüber dem Referenzgenom zulässig. Der nächste Schritt der Analyse besteht darin, Sequenzvariationen zwischen der Referenzsequenz und der in unserer Studie gewonnenen Exomsequenz zu identifizieren. Die anschließende Analyse dieser Varianten könnte die gewünschten Informationen über das untersuchte medizinische Problem liefern.

Abbildung 2 Analyse der Exom-Sequenzierungsdaten.
Anmerkungen: Die für die Exom-Isolierung, die Sequenzierung und die Datenanalyse erforderlichen Schritte sind schematisch dargestellt. Dieser Prozess dient der Identifizierung von Genvarianten, die an der Entstehung von Krankheiten beteiligt sind (Treibergene) oder anderweitig mit der Krankheitsanfälligkeit, der Evolution oder dem Ansprechen auf Arzneimittel zusammenhängen. Diese Daten liefern wertvolle Informationen für Diagnose und Prognose, für die genetische Beratung und für die Entwicklung personalisierter Behandlungen.
Abkürzung: DNA, Desoxyribonukleinsäure.

Die Exom-Sequenzierung kann verschiedene Arten von genetischen Variationen nachweisen. Einer der am häufigsten gefundenen Unterschiede ist der Austausch eines Nukleotids gegen ein anderes, zum Beispiel A gegen G (ATA-Codon gegen ATG). Diese Variationen werden als Einzelnukleotid-Varianten (SNVs) bezeichnet, obwohl sie als Einzelnukleotid-Polymorphismen (SNPs) gelten, wenn ihre Häufigkeit in der Bevölkerung mehr als 1 % bis 5 % beträgt und keine starke Auswirkung auf das Risiko einer bestimmten Krankheit besteht. Die meisten SNVs sind stumm oder auch als synonym bekannt, da beide Sequenzvarianten für dieselbe Aminosäure kodieren (z. B. eine Variation von GCA zu GCC, da es sich bei beiden um Alanin-Codons handelt). Die meisten dieser Polymorphismen stellen keinen Unterschied für das kodierte Protein dar, stehen nicht unter evolutionärer Selektion und stellen die am häufigsten gefundenen Variationen im menschlichen Exom dar. Eine Ausnahme bilden einige stille Mutationen, die spleißregulatorische Signale oder sogar transkriptionsregulatorische Stellen betreffen und das Spleißen oder die Expression der mRNA verändern, auch wenn sie die kodierten Aminosäuren nicht verändern. In anderen Fällen hat die Nukleotidvariation eine Auswirkung auf das kodierte Protein, und dies sind nicht-silente oder nicht-synonyme Varianten. Diese Veränderungen können zu Variationen in der kodierten Aminosäure führen (z. B. wird durch GAT zu GAG Asparaginsäure zu Glutaminsäure) und werden als Missense-Mutationen bezeichnet. Drastischere Veränderungen entstehen, wenn die Nukleotidvariation ein Translationsstoppcodon erzeugt (z. B. TGC zu TGA ändert ein Cysteincodon in ein Stoppcodon), was als Nonsense-Mutation bezeichnet wird. Es gibt auch eine Art von SNV, die durch Exom-Sequenzierung nachgewiesen werden kann, auch wenn sie die Protein-Codons nicht beeinflusst. Da Exons nach einer zufälligen Fragmentierung der DNA ausgewählt werden, können sie auch zusammenhängende DNA-Regionen enthalten, einschließlich benachbarter Intron-Sequenzen und sogar Genpromotoren, wenn untranslatierte Regionen erfasst wurden.24 Intron-Regionen enthalten die für das mRNA-Spleißen erforderlichen regulatorischen Signale. SNVs in diesen Regionen können das Spleißen auf verschiedene Weise verändern.15 Beispielsweise kann das betroffene Intron in der reifen mRNA erhalten bleiben, oder das angrenzende Exon kann ausgespleißt werden (Exon-Skipping). Diese Veränderungen verändern die Nukleotidsequenz der reifen mRNA und damit das kodierte Protein stromabwärts der SNV.25 Mit der Exom-Sequenzierung können auch Sequenzvariationen aufgrund kleiner Insertionen oder Deletionen (Indels) nachgewiesen werden.22 Diese Variationen können zu einer Rahmenverschiebung führen, außer wenn sie drei oder ein Vielfaches von drei Nukleotiden betreffen. In diesem Fall würden kleine Deletionen oder Insertionen von Aminosäuren entstehen.

Identifizierung von ursächlichen Mutationen

Die funktionelle Bedeutung der entdeckten Sequenzvarianten muss im nächsten Schritt der Datenanalyse bestimmt werden. Auch wenn alle Menschen aus genetischer Sicht nahezu identisch sind, ist die Zahl der Nukleotidsequenzunterschiede zwischen den Individuen beträchtlich.26 Diese Heterogenität erschwert die Interpretation der in einzelnen Sequenzierprojekten gewonnenen Daten. Einige allgemeine Daten zu individuellen Sequenzvariationen sind in Tabelle 3 aufgeführt. Betrachtet man das gesamte Genom, so wird die Anzahl der Sequenzunterschiede zwischen Individuen auf 4 × 106 geschätzt, entsprechend den Daten, die im Rahmen des 1000-Genome-Projekts und kleinerer Ganzgenom-Sequenzierungsprojekte gewonnen wurden.27 Exome weisen eine geringere, aber immer noch beträchtliche Anzahl von Sequenzvariationen auf, die zwischen zwei nicht verwandten Individuen etwa 20 000 bis 25 000 beträgt.27,28 Die meisten dieser genetischen Variationen sind stumm, wie bereits erwähnt. Die Zahl der nicht stummen Sequenzunterschiede zwischen Individuen wurde auf 10.000 geschätzt. Die meisten dieser Varianten kommen in der Allgemeinbevölkerung vor und werden über Generationen weitergegeben. Man schätzt, dass bei jedem Individuum weniger als eine stumme SNV de novo auftritt.29

Die im Rahmen von Exom-Sequenzierungsprojekten gewonnenen Daten werden häufig gefiltert, um alle SNPs zu identifizieren, die auch bei anderen Individuen vorhanden sind und daher nicht mit der untersuchten Krankheit in Zusammenhang stehen.2,19,23 Dieser Prozess kann durch einen Vergleich mit öffentlichen Datenbanken erfolgen, in denen die SNPs, die in den Sequenzierungsprojekten gefunden wurden, zusammengestellt sind. Dabei ist zu bedenken, dass alle großen Datenbanken eine Reihe von nachgewiesenen Mutationen enthalten, die relativ häufig Krankheiten verursachen. Nach diesem Filterungsschritt verbleiben etwa 400-700 neue und möglicherweise relevante SNVs (Tabelle 3).28 Die nächste Herausforderung besteht darin, festzustellen, welche der SNVs, die in der Weltbevölkerung nicht vorhanden sind, wenn überhaupt, die Ursache für die untersuchte Krankheit sind. Viele der beobachteten Unterschiede werden nicht mit dem Auftreten der Krankheit in Verbindung gebracht, und diese werden als Passagierveränderungen bezeichnet.23 Im Gegensatz dazu könnten eine oder einige wenige Veränderungen eine ursächliche Rolle spielen, und diese werden als Treiberveränderungen bezeichnet. Welcher Ansatz zur Identifizierung dieser treibenden Veränderungen verwendet wird, hängt von den besonderen Umständen der Studie ab. Bei Krankheiten mit einem Mendelschen Vererbungsmuster ist es in der Regel erforderlich, eine Reihe von betroffenen und nicht betroffenen Personen zu analysieren, um Genvariationen zu finden, die perfekt mit der Krankheit segregieren. Dieser Vergleich ist in großen Familien mit gut charakterisierten Stammbäumen aufschlussreicher. Sind keine ausreichend großen betroffenen Familien vorhanden, ermöglicht der Vergleich einer Reihe von nicht verwandten Patienten und Kontrollen ebenfalls die Identifizierung von Treibergenen. Zur Auswahl möglicher SNVs, die mit der Krankheit in Verbindung stehen, werden zusätzliche Kriterien herangezogen, einschließlich In-silico-Algorithmen, die die mögliche Bedeutung der mutierten Aminosäure auf der Grundlage der evolutionären Erhaltung und der voraussichtlichen Auswirkungen auf die Struktur und Funktion des Proteins vorhersagen. Die vorhergesagte Funktion des mutierten Proteins und sein gewebespezifisches Expressionsmuster sind ebenfalls Kriterien, die bei der Auswahl der mutmaßlich ursächlichen Mutationen verwendet werden.

Tabelle 3 Zusammenfassung der Sequenzvariation zwischen Individuen

Einige Beispiele für diese Art von Studien werden in einem späteren Abschnitt vorgestellt. Da jedoch immer mehr Studien durchgeführt werden, werden immer mehr Genvariationen als Ursache für Erbkrankheiten identifiziert, so dass es wahrscheinlich ist, dass einige der bei den Patienten mutierten Gene bereits beschrieben wurden. Diese mutierten Gene sind in der Literatur und in spezialisierten Datenbanken wie der Online-Datenbank Mendelian Inheritance in Man (http://www.omim.org) zu finden. Die mögliche Relevanz der in verschiedenen Genen gefundenen Mutationen kann auch auf der Seite Genome Ensemble (http://www.ensembl.org/) gesucht werden, wenn sie zuvor beschrieben wurden.

Krebs ist wahrscheinlich die häufigste Gruppe von Krankheiten mit einer genetischen Grundlage. Viele Studien wurden durchgeführt, um die treibenden Gene für verschiedene Krebsarten zu bestimmen.30 Die entstehende Gruppe von Krebs-Treibergenen kann in Datenbanken wie dem Catalogue of Somatic Mutations In Cancer (COSMIC; http://cancer.sanger.ac.uk) oder dem Cancer Genome Atlas (http://cancergenome.nih.gov/) eingesehen werden. Mehrere detailliertere Beispiele werden im Abschnitt Beispiele für den klinischen Einsatz der Exom-Sequenzierung gezeigt.

Vergleich der Exom-Sequenzierung mit anderen massiven Sequenzierungsansätzen

Genom-Sequenzierung

Wie in der Einleitung erwähnt, wird die Sequenzierung des gesamten menschlichen Genoms immer erschwinglicher. Im Vergleich zur Exom-Sequenzierung ist die Ganzgenom-Sequenzierung eine wesentlich komplexere Alternative. Die Anzahl der durchzuführenden Sequenzierreaktionen ist wesentlich höher, ebenso die Anzahl der erzeugten Nukleotidsequenzdaten. Die rechnergestützte Analyse ist wesentlich umfangreicher. Außerdem werden viel mehr genetische Varianten gefunden, wie in Tabelle 3 dargestellt, was die Identifizierung von Treibergenen erschwert. Die Genomsequenzierung bietet jedoch einen vollständigen Überblick über die im Patienten vorhandenen genetischen Veränderungen, einschließlich großer Genomumstrukturierungen. Bei der Short-Read-Sequenzierung eines Genoms mit mäßiger Tiefe werden jedoch strukturelle Veränderungen übersehen, insbesondere in Regionen mit geringer Komplexität. Diese Informationen sind in Tabelle 4 zusammengefasst, in der die Exom-Sequenzierung mit anderen Sequenzierungsverfahren verglichen wird.

Wie bereits erwähnt, machen proteinkodierende Gene nur 3 % des Genoms aus.16 Bis vor kurzem wurde der Rest des Genoms als „Massen-DNA“ ohne großen Informationswert betrachtet. Jüngste Studien haben diese Sichtweise jedoch völlig verändert. Ein großes genomweites Projekt untersucht die Funktion aller Regionen des Genoms, das Projekt Encyclopedia of DNA Elements (ENCODE).31 Die derzeit vorliegenden Ergebnisse zeigen, dass über 70 % des Genoms transkribiert werden. Viele der erzeugten Transkripte kodieren nicht für Proteine, aber sie scheinen eine regulierende Rolle bei der Genexpression zu spielen. Dazu gehören die bereits bekannten miRNAs, die die mRNA-Stabilität und -Übersetzung regulieren (Abbildung 1), aber auch über 20 000 lange nichtkodierende RNAs, die die Transkription regulieren. Darüber hinaus wurden viele DNA-Regionen identifiziert, die die Genexpression regulieren, darunter viele bisher unbekannte Promotor- und Transkriptionsregulationsregionen (Abbildung 1). Diese Informationen sind von klinischer Relevanz, da Mutationen in regulatorischen Regionen die Expression bestimmter Gene beeinflussen und pathologische Folgen haben können. In der Tat hat ein großer Teil der genomweiten Assoziationsstudien DNA-Regionen, in denen keine proteinkodierenden Mutationen gefunden wurden, mit pathologischen Zuständen in Verbindung gebracht.32 Die im Rahmen des ENCODE-Projekts gewonnenen Daten haben die Überprüfung einiger Fälle ermöglicht, bei denen festgestellt wurde, dass Mutationen in regulatorischen Regionen der Genexpression für die Krankheit verantwortlich sind.31,32 In einem aktuellen Beispiel berichteten Weedon et al33 , dass Mutationen in einer transkriptionsregulatorischen Region des PTF1A-Gens eine isolierte Pankreasagenese verursachen. Mutationen in regulatorischen Regionen können durch Exom-Sequenzierung nicht nachgewiesen werden, da sie nicht das kodierte Protein, sondern dessen Expression betreffen. Daher liefert die Ganzgenomsequenzierung mehr Informationen als die Exomsequenzierung, allerdings auf Kosten der erhöhten Komplexität und der wirtschaftlichen Kosten.

Tabelle 4 Vergleich von Massensequenzierungstechniken
Abkürzungen: RNA, Ribonukleinsäure; DNA, Desoxyribonukleinsäure.

RNA-Sequenzierung

RNA-Sequenzierungstechniken bestehen aus der Umwandlung von RNA-Populationen in komplementäre DNA (cDNA) durch reverse Transkription und deren anschließender Sequenzierung.34,35 Bei der mRNA-Sequenzierung wird die gesamte Population der in einer Zelllinie oder Gewebeprobe exprimierten mRNAs (das so genannte Transkriptom) in cDNA umgewandelt und sequenziert. Der Prozess der mRNA-Sequenzierung liefert Informationen über die Nukleotidsequenz der Gene, die in der untersuchten Probe transkribiert werden, und damit über die Aminosäuresequenz der entsprechenden Proteine. Darüber hinaus kann die Anzahl der für jede mRNA erzeugten Sequenzen geschätzt werden und ist proportional zu ihrer Häufigkeit. Daher können die Genexpressionswerte bestimmt und mit denen anderer Proben, einschließlich möglicher Kontrollproben, verglichen werden (Tabelle 4). Ein weiterer spezifischer Vorteil der mRNA-Sequenzierung besteht darin, dass sie die Untersuchung alternativer Spleißereignisse ermöglicht.36,37 Wie bereits erwähnt, werden primäre Transkripte oft auf mehrere Arten verarbeitet, so dass mRNA entsteht, die verschiedene Exons enthalten (Abbildung 1). Diese mRNAs können durch mRNA-Sequenzierung und nicht durch Exom- oder Genom-Sequenzierung identifiziert werden, bei der die Sequenzierung der transkribierten DNA und nicht die des reifen Transkripts bestimmt wird. Ansonsten liefern mRNA- und Exom-Sequenzierung ähnliche Informationen über die proteinkodierende Region des Genoms. Der Unterschied besteht darin, dass die Exom-Sequenzierung alle Gene umfasst, während die mRNA-Sequenzierung auf die in der untersuchten Probe exprimierten Gene beschränkt ist. In einer kürzlich durchgeführten mRNA-Sequenzierungsstudie an Lymphoblastoid-Zelllinien von 462 Personen wurde beispielsweise die kodierende Sequenz von etwa 13.000 der 20.078 menschlichen Gene bestimmt.38 In diesem Beispiel wurden etwa 7.000 Gene nicht untersucht, da sie in Lymphoblastoid-Zelllinien nicht exprimiert wurden. In den Fällen jedoch, in denen der Zelltyp oder das Gewebe, das von einer bestimmten Krankheit betroffen ist, gut bekannt ist, wäre die mRNA-Sequenzierung für die Untersuchung von Treibermutationen gleichwertig mit der Exom-Sequenzierung. Ein weiteres Merkmal der mRNA-Sequenzierung ist, dass sie den Nachweis von Sequenzvariationen ermöglicht, die durch RNA-Editierung entstehen.39 Eine Reihe von mRNAs werden so bearbeitet, dass einige Nukleotide verändert werden, wobei Adenosin-zu-Inosin-Veränderungen am häufigsten vorkommen. Diese Veränderungen werden durch die mRNA-Sequenzierung nachgewiesen, aber ob sie durch RNA-Editing oder als Folge genomischer Variationen entstanden sind, lässt sich nur feststellen, wenn sowohl die mRNA- als auch die genomischen Sequenzen verglichen werden.

Die Bestimmung des mRNA-Expressionsniveaus kann in bestimmten Fällen sehr nützlich sein, da einige Krankheiten durch die deregulierte Expression eines oder mehrerer Gene verursacht werden können. Veränderungen im Expressionsniveau können sehr aufschlussreich über den genetischen Ursprung der Krankheit sein. So könnten Veränderungen in der Expression eines oder mehrerer Gene bei einem Patienten auf eine Funktionsstörung in den Mechanismen hinweisen, die ihre Expression regulieren. Diese Funktionsstörung könnte auf Mutationen in den Gen-Transkriptionsregulationsregionen zurückzuführen sein, wie im Abschnitt über die Genomsequenzierung erläutert. Sie könnte auch auf Veränderungen in der Expression oder Struktur von Transkriptionsregulationsfaktoren zurückzuführen sein.40 Veränderungen in der Genexpression sind häufig auf Veränderungen in den epigenetischen Mechanismen der Genexpressionsregulation zurückzuführen, wie z. B. die DNA-Methylierung, die durch Genom- oder Exom-Sequenzierung nicht nachgewiesen werden kann.41 In jüngster Zeit wurden Methoden für die Untersuchung der Methylierung des gesamten Genoms entwickelt, die eine detaillierte Untersuchung dieser epigenetischen Informationen ermöglichen.42 Krebs ist eine der Krankheiten, bei denen mehr Studien zum Niveau der Genexpression durchgeführt wurden. In immer mehr Fällen werden Veränderungen in der Expression von Genen oder einer Gruppe von Genen mit der Krebsdiagnose, der Prognose oder der Vorhersage des Ansprechens auf Krebsmedikamente in Verbindung gebracht.43 Diese Veränderungen der Genexpression werden als Biomarker verwendet. Viele dieser Studien sind über die Datenbank des Cancer Genome Anatomy Project (http://cgap.nci.nih.gov) verfügbar.

Eine spezielle Art von RNA-Sequenzierungsprojekten zielt auf die Bestimmung der Nukleotidsequenz und des Expressionsniveaus von kleinen regulatorischen RNAs (miRNAs) ab. Kleine RNAs regulieren die Expression anderer Gene, indem sie die Stabilität und/oder Translation ihrer mRNAs bestimmen (Abbildung 1). Veränderungen in den Mustern der miRNA-Expression können daher einen deutlichen Einfluss auf das Proteinexpressionsprofil von Zellen und Geweben haben. Es wurden Protokolle für die Reinigung und Sequenzierung der gesamten miRNA-Population einer bestimmten Probe und für die Bestimmung ihrer Expressionsniveaus entwickelt.44 Die meisten Exon-Capture-Plattformen umfassen auch bis zu 80 % der bekannten miRNA-kodierenden Regionen.21

Sequenzierung ausgewählter Gensätze

Einige Krankheiten wurden bereits so detailliert untersucht, dass die meisten der beteiligten Gene bekannt sind. Dies kann bei Krankheiten mit einem Mendelschen Vererbungsmuster der Fall sein, bei denen alle untersuchten Fälle auf Mutationen in einem der bekannten Gene zurückzuführen sind. Andere Beispiele sind einige Krebsarten, die überwiegend auf Mutationen in einer geringeren Anzahl von Genen zurückzuführen sind. In solchen Fällen bestünde der direktere Ansatz zur Charakterisierung einer Patientenprobe darin, die Sequenz der Gene zu bestimmen, die zuvor als ursächlich für die Krankheit identifiziert wurden. Der klassische Ansatz bestünde darin, alle Exons dieser Gene zu amplifizieren und die Nukleotidsequenz jedes einzelnen zu bestimmen. Der alternative Ansatz der Massensequenzierung bestünde darin, alle mutmaßlich betroffenen Genomregionen zu reinigen und gleichzeitig ihre Nukleotidsequenz in einem einzigen Durchgang zu bestimmen.45-47 Für die Reinigung der Kandidaten-DNA-Regionen werden im Allgemeinen zwei Methoden verwendet. Die erste ist ihre Amplifikation durch Polymerase-Kettenreaktionen unter Verwendung einer Reihe spezifischer Oligonukleotide als Primer. Die zweite Methode besteht in der Fragmentierung der DNA der Probe und der Reinigung der relevanten Fragmente durch Hybridisierung mit spezifischen Oligonukleotiden, entweder in Lösung oder auf einem festen Träger fixiert, wie dies bereits für die Reinigung von Exons beschrieben wurde.48 Die ausgewählten Regionen können proteinkodierende Exons und auch andere DNA-Regionen wie Transkriptionsregulationsregionen enthalten. Diese Regionen entsprechen in der Regel einigen hundert Genen, so dass die Analyse der erzeugten Sequenzdaten viel einfacher ist als bei anderen Massensequenzierungsverfahren. Die wichtigste Einschränkung besteht darin, dass es sich um einen hypothesengesteuerten Ansatz handelt, der es nicht erlaubt, Mutationen in Genen zu entdecken, die bisher nicht mit der untersuchten Krankheit in Verbindung gebracht wurden (Tabelle 4).

Beispiele für den klinischen Einsatz der Exom-Sequenzierung

Die häufigste Anwendung der Exom-Sequenzierung ist wahrscheinlich die Diagnose monogener Krankheiten. Über 3.000 monogenetische Erkrankungen wurden beschrieben, obwohl die molekulargenetischen Ursachen der meisten von ihnen noch unbekannt sind.1 Die Exom-Sequenzierung kann zur Identifizierung dieser Mutationen verwendet werden, wie Kuhlenbäumer et al1 in einer kürzlich erschienenen Übersichtsarbeit erörtert haben. In einigen der ersten Studien wurde die Exom-Sequenzierung eingesetzt, um genetische Mutationen zu identifizieren, die für bekannte Krankheiten wie das Kabuki-Syndrom,49 das Schinzel-Giedion-Syndrom,50 das Joubert-Syndrom,51 das Hyperphosphatasie-Syndrom, das Syndrom der mentalen Retardierung,52 schwere Hirnfehlbildungen,53 oder die bekannte amyotrophe Lateralsklerose verantwortlich sind.54 Die Exom-Sequenzierung wurde auch eingesetzt, um neue Mutationen zu entdecken, die in einem sporadischen Fall von mentaler Retardierung vorhanden waren.29 Darüber hinaus wurde diese Technik beispielsweise zur Diagnose von kongenitaler Chloriddiarrhöe,55 entzündlichen Darmerkrankungen,56 der Charcot-Marie-Tooth-Krankheit,57 neonatalem Diabetes mellitus,58 oder dem Brown-Vialetto-van-Laere-Syndrom eingesetzt.59 Die von Worthey et al56 berichtete Studie ist ein wichtiges Beispiel für die klinische Anwendung der Exom-Sequenzierung. Ein männliches Kind stellte sich mit einer Morbus-Crohn-ähnlichen Erkrankung vor, ohne dass trotz einer umfassenden klinischen Untersuchung eine endgültige Diagnose gestellt werden konnte. Die Autoren entschieden sich für einen Exom-Sequenzierungsansatz, um die ursächliche(n) Mutation(en) zu identifizieren. Bei der Analyse der Sequenzdaten wurden bei dem Patienten 16.124 Varianten festgestellt. Durch Filtern der Daten unter Berücksichtigung neuartiger Varianten, die in Homozygotie, Hemizygotie oder zusammengesetzter Heterozygotie vorliegen und hochkonservierte Aminosäurereste betreffen, von denen man annimmt, dass sie die Proteinfunktion beeinträchtigen, konnten die Autoren eine Mutation im X-chromosomalen Inhibitor der Apoptose-Gen (XIAP) auswählen. Funktionelle Studien zeigten die Bedeutung dieser Mutation für die bei dem Patienten beobachtete proinflammatorische Reaktion. Aufgrund der Identifizierung dieser Mutation wurde eine allogene hämatopoetische Vorläuferzelltransplantation durchgeführt. Die Exom-Sequenzierung ermöglichte also die Identifizierung einer uncharakterisierten Mutation, um eine molekulare Diagnose für einen einzelnen Patienten im Rahmen einer neuartigen Krankheit zu stellen, die zu einem Behandlungsplan führte. Der Einsatz der Exom-Sequenzierung bei der Entdeckung neuer ursächlicher Mutationen und bei der Diagnose wurde kürzlich überprüft.60,61

Die Untersuchung häufiger und komplexer Krankheiten wurde ebenfalls durch Exom-Sequenzierung angegangen. Genomweite Assoziationsstudien haben gezeigt, dass einige genetische Varianten das Risiko für eine Reihe von Krankheiten erhöhen. Gut charakterisierte Beispiele sind Apolipoprotein E bei der Alzheimer-Krankheit, Komplementfaktor H bei Makuladegeneration oder Glukozerebrosidase/Leucin-reiche Repeat-Kinase 2 bei der Parkinson-Krankheit.62-64 Der mögliche Einsatz der Exom-Sequenzierung für die Untersuchung komplexer Krankheiten wurde diskutiert.2,28 Eine Einschränkung bei der Verwendung der Exom-Sequenzierung in diesen Studien besteht darin, dass die meisten der phänotyp-assoziierten Varianten distal zu den proteinkodierenden Regionen liegen, so dass die Sequenzierung des gesamten Genoms ein besserer Ansatz wäre.32 Einige dieser genetischen Varianten können die Funktionalität der transkriptionsregulatorischen Regionen beeinflussen, die die Genexpression steuern. Im Rahmen des ENCODE-Projekts31,65 wurde eine genomweite Analyse dieser regulatorischen Regionen durchgeführt, und es wurde festgestellt, dass mehrere genetische Varianten in bestimmten Regionen von Chromosom 5 (zum Beispiel) Bindungsstellen für den Transkriptionsfaktor GATA2 sind, die stark mit Morbus Crohn und anderen Entzündungskrankheiten assoziiert sind.

Krebs sind Krankheiten, die durch die Anhäufung von Genomveränderungen verursacht werden, die zu einer Veränderung mehrerer biologischer Prozesse führen.19 Im Gegensatz zu den zuvor besprochenen monogenen genetischen Veränderungen sind die meisten krebsauslösenden Mutationen nicht im normalen Gewebe des Patienten vorhanden; ein großer Teil dieser Mutationen befindet sich in proteinkodierenden Regionen und kann durch Exom-Sequenzierung nachgewiesen werden.19 Eine weitere wichtige Gruppe genetischer Veränderungen sind jedoch große genomische Umstrukturierungen wie Deletionen, Inversionen oder Translokationen, die mit der Exom-Sequenzierung nicht nachgewiesen werden können.66 Trotz dieser Einschränkung wurde die Exom-Sequenzierung zur Entdeckung von Krebstreibergenen mit Hilfe von zwei allgemeinen Strategien angewandt: dem Vergleich des Exoms des Tumors mit dem von gesundem Gewebe desselben Patienten oder dem Vergleich einer Reihe von Exomen nicht verwandter Patienten mit denen einer ähnlichen Anzahl gesunder Kontrollen.6770 Derzeit werden umfangreiche Studien durchgeführt, bei denen das Exom oder das Genom einer großen Kohorte von Krebspatienten und Kontrollpersonen sequenziert wird, um alle krebsauslösenden Gene zu identifizieren.19,71,72 Ein Beispiel dafür ist das 5.000-Krebsgenome-Projekt,73 bei dem das Genom von 50 der häufigsten Krebsarten sequenziert werden soll. Die verfügbaren Daten haben bereits eine allgemeine genomische Landschaft der häufigsten Krebsarten geliefert, wie von Vogelstein et al. untersucht.3 Es wurden etwa 140 Gene identifiziert, die die Tumorentstehung fördern, wenn sie verändert sind, und diese sind in der bereits erwähnten COSMIC-Datenbank zu finden.3 Der Nachweis der Mutation eines dieser Gene im Exom einer Krebsprobe kann ein wichtiger Schritt zur richtigen Diagnose und Behandlung des Patienten sein. Die vorliegenden Daten vermitteln auch eine Vorstellung von der Komplexität des Krebsgenoms.3 Bei gewöhnlichen soliden Tumoren treten im Durchschnitt 33 bis 66 nicht-silente somatische Mutationen auf.3 Diese Zahl steigt auf über 200 bei Tumoren, die durch mutagene Agenzien ausgelöst werden, wie Lungenkrebs und Melanom, und sogar auf über 1.000 bei Tumoren, die einen Mangel an DNA-Reparaturmechanismen oder an der DNA-Polymerase E aufweisen.3 Im Gegensatz dazu weisen flüssige und pädiatrische Tumoren weniger als zehn somatische Mutationen auf.3 Ein wichtiges Merkmal von Tumoren ist, dass sie sich schnell entwickeln und heterogen werden, so dass in Proben desselben Patienten, die in verschiedenen Regionen oder zu verschiedenen Zeitpunkten der Behandlung entnommen wurden, unterschiedliche Mutationen gefunden werden können, wie kürzlich durch Exom-Sequenzierung gezeigt wurde.74,75 Trotz dieser Komplexität zeichnen sich einige vereinheitlichende Konzepte ab, und die meisten der bekannten Krebstreibergene sind an einem oder mehreren der 12 Signalwege beteiligt, die das Zellüberleben, das Zellschicksal und die Erhaltung des Genoms regulieren.3,19 In diesem Szenario beginnt die Exom-Sequenzierung für die Krebsdiagnose durch die Identifizierung von Treibermutationen, zum Beispiel bei Prostatakrebs, eingesetzt zu werden.76

Die Exom-Sequenzierung kann auch für die Krebsbehandlung nützlich sein. Das Vorhandensein bestimmter Genmutationen kann zu einer Empfindlichkeit oder Resistenz gegenüber einem bestimmten Medikament führen, was als Pharmakogenomik bezeichnet wird. So ist beispielsweise der Einsatz von Protein-Tyrosinkinase-Inhibitoren bei Krebserkrankungen, bei denen die Proteine Abelson murine leukemia viral oncogene homolog 1 (ABL) oder epidermal growth factor receptor (EGFR) überexprimiert werden, bereits seit mehreren Jahren bekannt. Mit Hilfe der Exom- und Genomsequenzierung werden jedoch viel mehr Mutationsreaktionen auf Behandlungsassoziationen aufgedeckt (wie in einer Übersichtsarbeit hervorgehoben wird77). Ein aufschlussreiches Beispiel ist die jüngste Veröffentlichung des Exoms des NCI-60-Zellpanels.78 Dieses Panel enthält 60 gut charakterisierte Zelllinien aus neun Krebsarten und wurde in einem breiten Spektrum biologischer und pharmakologischer Studien verwendet.79 Die Nukleotidsequenz des Exoms dieser Zellen wurde bestimmt, um die in jeder dieser Zellen mutierten Krebstreibergene zu ermitteln. Die Autoren erstellten nicht nur eine Liste mutmaßlicher neuer Krebstreibergene, sondern untersuchten auch den möglichen Zusammenhang zwischen dem Genotyp jeder Zelllinie und der zuvor ermittelten Reaktion auf eine große Anzahl von Krebsmitteln. Es wurde eine Korrelation zwischen spezifischen Genmutationen und dem Ansprechen auf mehrere Medikamente festgestellt, was die mögliche Bedeutung der Exom-Sequenzierung bei der Auswahl einer personalisierten Behandlung verdeutlicht. Die Exom-Sequenzierung kann auch zur Vorhersage der Krebsveranlagung genutzt werden. Einige Beispiele finden sich in einem kürzlich erschienenen Bericht, der sich auf Darmkrebs konzentriert und die Ganzgenomsequenzierung verwendet.72

Medizinische Herausforderungen der Exomsequenzierung

Die Exomsequenzierung verspricht erhebliche Verbesserungen bei der Diagnose, Prognose und personalisierten Behandlung von Patienten. Die umfassende Anwendung dieser Technologie erfordert jedoch noch eine Reihe von Verbesserungen sowie die Festlegung wichtiger ethischer und medizinischer Erwägungen, wie in kürzlich erschienenen Übersichtsarbeiten erörtert wurde.23,27,60,61,71,77 Zu den technischen Herausforderungen gehört die Entwicklung effizienterer Techniken zur Exon-Erfassung, zur Sequenzierung und zum Alignment, um eine vollständige und gleichmäßige Darstellung aller Exons in der Sequenz zu erhalten. Außerdem müssen die Software-Tools für die Datenanalyse verbessert werden, damit pathologische Varianten schnell und genau erkannt werden können. Eine umfassende Exom-Sequenzierung erfordert den Einsatz spezieller Geräte und die Einstellung von Spezialistenteams, die über das entsprechende Fachwissen verfügen, um die Sequenzen zu generieren und die gewonnenen Daten zu analysieren und zu interpretieren.

Der Einsatz der Exom-Sequenzierung für die Diagnose erfordert auch die Umsetzung technischer Richtlinien und Vorschriften. Parameter wie die Sequenzierungstiefe, die Exonabdeckung, Qualitätsmetriken für Nukleotidsequenzdaten oder das Alignment-Calling müssen normiert werden. Auch die Datenspeicherung sollte geregelt werden.

Es gibt auch eine Reihe komplexer ethischer Fragen. Eine wichtige Frage ist die nach den Informationen, die dem Patienten zur Verfügung gestellt werden sollten. Bei der Exom-Sequenzierung könnten genetische Varianten entdeckt werden, die nicht mit der zu diagnostizierenden Krankheit zusammenhängen. Der Patient könnte genetische Varianten aufweisen, die Risikofaktoren darstellen oder für andere Krankheiten ursächlich sein könnten. Welche Informationen sollten an den Patienten zurückgegeben werden? Welche Beweise sind erforderlich, um eine genetische Variante als mit einer Krankheit verbunden zu betrachten? Weitere wichtige Fragen sind die Eigentumsverhältnisse, der Zugang und die Speicherung der Daten. Sollten die gewonnenen Daten für eine mögliche künftige Verwendung zu Lebzeiten des Patienten aufbewahrt werden? Diese und andere ethische Überlegungen werden wahrscheinlich zu erheblichen Kontroversen führen80 und erfordern eine ausführliche Diskussion, um zu einer Einigung über die in der klinischen Praxis anzuwendenden Kriterien zu gelangen.

Schlussfolgerung

Die Exom-Sequenzierung ist bereits ein leistungsfähiges Instrument zur Ermittlung der molekularen Grundlagen genetischer Krankheiten. Die Tiefe der genetischen Analyse ist geringer als bei der Ganzgenomsequenzierung, da genetische Variationen in nicht-proteinkodierenden Regionen nicht erkannt werden. Die geringere Anzahl von Sequenzen und Sequenzanalysen, die für die Exom-Sequenzierung erforderlich sind, macht sie jedoch zu einem erschwinglicheren Ansatz in der klinischen Praxis. Daher wird die Exom-Sequenzierung wahrscheinlich die Technik der Wahl für die erste Analyse von Patienten sein, zumindest solange, bis der Preis für die Ganzgenom-Sequenzierung sinkt und das Verfahren zur Analyse der Daten verbessert wird. Eine wichtige Einschränkung bei der Anwendung der Exom-Sequenzierung in der klinischen Praxis besteht darin, dass die funktionelle Bedeutung der meisten der erwarteten genetischen Varianten noch unbekannt ist. Diese Situation ändert sich rasch, da immer mehr krankheitsassoziierte genetische Varianten bestimmt und in öffentlichen Datenbanken zugänglich gemacht werden. Es ist plausibel, dass in einigen Jahren die meisten genetischen Variationen, die mit dem Risiko des Auftretens einer Krankheit zusammenhängen, mit präziser molekularer Diagnostik, einer Vorhersage der Krankheitsentwicklung und einer pharmakologischen Reaktion bekannt sein werden. Die genaue Kenntnis des Exoms oder Genoms des Patienten wird dann ein entscheidender Faktor in der medizinischen Praxis sein.

Danksagung

Ich danke Rosario Perona und Juliette Siegfried (ServingEdit.com) für die kritische Durchsicht des Manuskripts.

Disclosure

Der Autor meldet keine Interessenkonflikte in dieser Arbeit.

Kuhlenbäumer G, Hullmann J, Appenzeller S. Novel genomic techniques open new avenues in the analysis of monogenic disorders. Hum Mutat. 2011;32(2):144-151.

Kiezun A, Garimella K, Do R, et al. Exome sequencing and the genetic basis of complex traits. Nat Genet. 2012;44(6):623-630.

Vogelstein B, Papadopoulos N, Velculescu VE, Zhou S, Diaz LA Jr, Kinzler KW. Cancer genome landscapes. Wissenschaft. 2013;339(6127):1546-1558.

Kirwan M, Dokal I. Dyskeratosis congenita: a genetic disorder of many faces. Clin Genet. 2008;73(2):103-112.

Walne AJ, Dokal I. Advances in the understanding of dyskeratosis congenita. Br J Haematol. 2009;145(2):164-172.

Brady PD, Vermeesch JR. Genomic microarrays: a technology overview. Prenat Diagn. 2012;32(4):336-343.

Hehir-Kwa JY, Pfundt R, Veltman JA, de Leeuw N. Pathogenic or not? Bewertung der klinischen Relevanz von Kopienzahlvarianten. Clin Genet. 2013;84(5):415-421.

Simons A, Sikkema-Raddatz B, de Leeuw N, Konrad NC, Hastings RJ, Schoumans J. Genome-wide arrays in routine diagnostics of hematological malignancies. Hum Mutat. 2012;33(6):941-948.

Metzker ML. Sequenziertechnologien – die nächste Generation. Nat Rev Genet. 2010;11(1):31-46.

Sastre L. New DNA sequencing technologies open a promising era for cancer research and treatment. Clin Transl Oncol. 2011;13(5):301-306.

Lander ES, Linton LM, Birren B, et al. International Human Genome Sequencing Consortium. Erste Sequenzierung und Analyse des menschlichen Genoms. Nature. 2001;409(6822):860-921.

Abecasis GR, Auton A, Brooks LD, et al. 1000 Genomes Project Consortium. Eine integrierte Karte der genetischen Variation von 1.092 menschlichen Genomen. Nature. 2012;491(7422):56-65.

Yang Y, Liu R, Xie H, et al. Advances in nanopore sequencing technology. J Nanosci Nanotechnol. 2013;13(7):4521-4538.

Chen YS, Lee CH, Hung MY, Pan HA, Chiou JC, Huang GS. DNA-Sequenzierung mittels elektrischer Leitfähigkeitsmessungen einer DNA-Polymerase. Nat Nanotechnol. 2013;8(6):452-458.

Lu ZX, Jiang P, Xing Y. Genetische Variation des alternativen Spleißens von prä-mRNA in menschlichen Populationen. Wiley Interdiscip Rev RNA. 2012;3(4):581-592.

Pruitt KD, Harrow J, Harte RA, et al. The consensus coding sequence (CCDS) project: Identifizierung eines gemeinsamen proteinkodierenden Gensatzes für die Genome von Mensch und Maus. Genome Res. 2009;19(7):1316-1323.

Harrow J, Frankish A, Gonzalez JM, et al. GENCODE: the reference human genome annotation for The ENCODE Project. Genome Res. 2012;22(9):1760-1774.

Teer JK, Mullikin JC. Exom-Sequenzierung: der Sweet Spot vor ganzen Genomen. Hum Mol Genet. 2010;19(R2):R145-R151.

Liu X, Wang J, Chen L. Whole-exome sequencing reveals recurrent somatic mutation networks in cancer. Cancer Lett. 2013;340(2):270-276.

Parla JS, Iossifov I, Grabill I, Spector MS, Kramer M, McCombie WR. Eine vergleichende Analyse der Exomerfassung. Genome Biol. 2011; 12(9):R97.

Sulonen AM, Ellonen P, Almusa H, et al. Comparison of solution-based exome capture methods for next generation sequencing. Genome Biol. 2011;12(9):R94.

Clark MJ, Chen R, Lam HY, et al. Performance comparison of exome DNA sequencing technologies. Nat Biotechnol. 2011;29(10):908-914.

Gullapalli RR, Desai KV, Santana-Santos L, Kant JA, Becich MJ. Next Generation Sequencing in der klinischen Medizin: Herausforderungen und Lehren für die Pathologie und die biomedizinische Informatik. J Pathol Inform. 2012;3:40.

Samuels DC, Han L, Li J, et al. Finding the lost treasures in exome sequencing data. Trends Genet. 2013;29(10):593-599.

Taneri B, Asilmaz E, Gaasterland T. Biomedical impact of splicing mutations revealed through exome sequencing. Mol Med. 2012;18:314-319.

Fu W, O’Connor TD, Jun G, et al; NHLBI Exome Sequencing Project. Analysis of 6,515 exomes reveals the recent origin of most human protein-coding variants. Nature. 2013;493(7431):216-220.

Marian AJ. Herausforderungen bei medizinischen Anwendungen der Entdeckungen der Ganz-Exom-/Genom-Sequenzierung. Trends Cardiovasc Med. 2012;22(8):219-223.

Singleton AB. Exom-Sequenzierung: eine transformative Technologie. Lancet Neurol. 2011;10(10):942-946.

Vissers LE, de Ligt J, Gilissen C, et al. A de novo paradigm for mental retardation. Nat Genet. 2010;42(12):1109-1112.

Gonzalez-Perez A, Perez-Llamas C, Deu-Pons J, et al. IntOGen-mutations identifies cancer drivers across tumor types. Nat Methods. 2013;10(11):1081-1082.

Bernstein BE, Birney E, Dunham I, Green ED, Gunter C, Snyder M; ENCODE Project Consortium. Eine integrierte Enzyklopädie der DNA-Elemente im menschlichen Genom. Nature. 2012;489(7414):57-74.

Hardison RC. Genomweite epigenetische Daten erleichtern das Verständnis von Assoziationsstudien zur Krankheitsanfälligkeit. J Biol Chem. 2012;287(37):30932-30940.

Weedon MN, Cebola I, Patch AM, et al. International Pancreatic Agenesis Consortium. Rezessive Mutationen in einem distalen PTF1A-Enhancer verursachen isolierte Pankreas-Agenesie. Nat Genet. 2014;46(1):61-64.

Wang Z, Gerstein M, Snyder M. RNA-Seq: a revolutionary tool for transcriptomics. Nat Rev Genet. 2009;10(1):57-63.

Mutz KO, Heilkenbrinker A, Lönne M, Walter JG, Stahl F. Transcriptome analysis using next-generation sequencing. Curr Opin Biotechnol. 2013;24(1):22-30.

Hitzemann R, Bottomly D, Darakjian P, et al. Genes, behavior and next-generation RNA sequencing. Genes Brain Behav. 2013;12(1):1-12.

Costa V, Aprile M, Esposito R, Ciccodicola A. RNA-Seq and human complex diseases: recent accomplishments and future perspectives. Eur J Hum Genet. 2013;21(2):134-142.

Lappalainen T, Sammeth M, Friedländer MR, et al; Geuvadis Consortium; Geuvadis Consortium. Transkriptom- und Genomsequenzierung deckt funktionelle Variation beim Menschen auf. Nature. 2013; 501(7468):506-511.

Slotkin W, Nishikura K. Adenosine-to-inosine RNA editing and human disease. Genome Med. 2013;5:105.

Lee TI, Young RA. Transkriptionsregulation und ihre Fehlregulation bei Krankheiten. Cell. 2013;152(6):1237-1251.

Suvà ML, Riggi N, Bernstein BE. Epigenetische Umprogrammierung bei Krebs. Wissenschaft. 2013;339(6127):1567-1570.

Li P, Demirci F, Mahalingam G, Demirci C, Nakano M, Meyers BC. Ein integrierter Arbeitsablauf für die DNA-Methylierungsanalyse. J Genet Genomics. 2013;40(5):249-260.

Chibon F. Cancer gene expression signatures – the rise and fall? Eur J Cancer. 2013;49:2000-2009.

Dedeoğlu BG. Hochdurchsatzansätze für die Analyse der microRNA-Expression. Methods Mol Biol. 2014;1107:91-103.

Ni T, Wu H, Song S, Jelley M, Zhu J. Selective gene amplification for high-throughput sequencing. Recent Pat DNA Gene Seq. 2009; 3(1):29-38.

Barretina J, Caponigro G, Stransky N, et al. The Cancer Cell Line Encyclopedia enables predictive modelling of anticancer drug sensitivity. Nature. 2012;483(7391):603-607.

Garnett MJ, Edelman EJ, Heidorn SJ, et al. Systematic identification of genomic markers of drug sensitivity in cancer cells. Nature. 2012;483(7391):570-575.

Hoischen A, Gilissen C, Arts P, et al. Massively parallel sequencing of ataxia genes after array-based enrichment. Hum Mutat. 2010;31(4):494-499.

Ng SB, Bigham AW, Buckingham KJ, et al. Exome sequencing identifies MLL2 mutations as a cause of Kabuki syndrome. Nat Genet. 2010;42(9):790-793.

Hoischen A, van Bon BW, Gilissen C, et al. De novo Mutationen von SETBP1 verursachen das Schinzel-Giedion Syndrom. Nat Genet. 2010;42(6):483-485.

Edvardson S, Shaag A, Zenvirt S, et al. Joubert syndrome 2 (JBTS2) in Ashkenazi Jews is associated with a TMEM216 mutation. Am J Hum Genet. 2010;86(1):93-97.

Krawitz PM, Schweiger MR, Rödelsperger C, et al. Identity-by-descent filtering of exome sequence data identifies PIGV mutations in hyperphosphatasia mental retardation syndrome. Nat Genet. 2010;42(10):827-829.

Bilgüvar K, Oztürk AK, Louvi A, et al. Whole-exome sequencing identifies recessive WDR62 mutations in severe brain malformations. Nature. 2010;467(7312):207-210.

Johnson JO, Mandrioli J, Benatar M, et al. ITALSGEN Consortium. Exom-Sequenzierung enthüllt VCP-Mutationen als Ursache der familiären ALS. Neuron. 2010;68(5):857-864.

Choi M, Scholl UI, Ji W, et al. Genetic diagnosis by whole exome capture and massively parallel DNA sequencing. Proc Natl Acad Sci U S A. 2009;106(45):19096-19101.

Worthey EA, Mayer AN, Syverson GD, et al. Making a definitive diagnosis: successful clinical application of whole exome sequencing in a child with intractable inflammatory bowel disease. Genet Med. 2011;13(3):255-262.

Montenegro G, Powell E, Huang J, et al. Exome sequencing allows for rapid gene identification in a Charcot-Marie-Tooth family. Ann Neurol. 2011;69(3):464-470.

Bonnefond A, Durand E, Sand O, et al. Molecular diagnosis of neonatal diabetes mellitus using next-generation sequencing of the whole exome. PLoS One. 2010;5(10):e13630.

Johnson JO, Gibbs JR, Van Maldergem L, Houlden H, Singleton AB. Exom-Sequenzierung beim Brown-Vialetto-van Laere-Syndrom. Am J Hum Genet. 2010;87(4):567-9; author reply 569.

Bras JM, Singleton AB. Exome Sequencing in Parkinson’s disease. Clin Genet. 2011;80(2):104-109.

Topper S, Ober C, Das S. Exome sequencing and the genetics of intellectual disability. Clin Genet. 2011;80(2):117-126.

Corder EH, Saunders AM, Strittmatter WJ, et al. Gene dose of apolipoprotein E type 4 allele and the risk of Alzheimer’s disease in late onset families. Science. 1993;261(5123):921-923.

Klein RJ, Zeiss C, Chew EY, et al. Complement factor H polymorphism in age-related macular degeneration. Science. 2005;308(5720):385-389.

Tan EK. Identifizierung einer gemeinsamen genetischen Risikovariante (LRRK2 Gly2385Arg) bei der Parkinson-Krankheit. Ann Acad Med Singapore. 2006;35(11):840-842.

Libioulle C, Louis E, Hansoul S, et al. Novel Crohn disease locus identified by genome-wide association maps to a gene desert on 5p13.1 and modulates expression of PTGER4. PLoS Genet. 2007;3(4):e58.

Stephens PJ, Greenman CD, Fu B, et al. Massive genomic rearrangement acquired in a single catastrophic event during cancer development. Cell. 2011;144(1):27-40.

Jones S, Zhang X, Parsons DW, et al. Core signaling pathways in human pancreatic cancers revealed by global genomic analyses. Science. 2008;321(5897):1801-1806.

Parsons DW, Jones S, Zhang X, et al. An integrated genomic analysis of human glioblastoma multiforme. Science. 2008;321(5897):1807-1812.

Timmermann B, Kerick M, Roehr C, et al. Somatic mutation profiles of MSI and MSS colorectal cancer identified by whole exome next generation sequencing and bioinformatics analysis. PLoS One. 2010;5(12):e15661.

Varela I, Tarpey P, Raine K, et al. Exome sequencing identifies frequent mutation of the SWI/SNF complex gene PBRM1 in renal carcinoma. Nature. 2011;469(7331):539-542.

Ku CS, Cooper DN, Roukos DH. Klinische Relevanz der Sequenzierung von Krebsgenomen. World J Gastroenterol. 2013;19(13):2011–2018.

Kilpivaara O, Aaltonen LA. Diagnostische Krebsgenomsequenzierung und der Beitrag von Keimbahnvarianten. Science. 2013;339(6127):1559-1562.

Hudson TJ, Anderson W, Artez A, et al; International Cancer Genome Consortium. Internationales Netzwerk von Krebsgenomprojekten. Nature. 2010;464(7291):993-998.

Gerlinger M, Rowan AJ, Horswell S, et al. Intratumor heterogeneity and branched evolution revealed by multiregion sequencing. N Engl J Med. 2012;366(10):883-892.

Ren SC, Qu M, Sun YH. Untersuchung der intratumoralen Heterogenität durch Einzelzellsequenzierung. Asian J Androl. 2013;15(6):729-734.

Hieronymus H, Sawyers CL. Traversing the genomic landscape of prostate cancer from diagnosis to death. Nat Genet. 2012;44(6):613-614.

McLeod HL. Cancer pharmacogenomics: early promise, but concerted effort needed. Science. 2013;339(6127):1563-1566.

Abaan OD, Polley EC, Davis SR, et al. The exomes of the NCI-60 panel: a genomic resource for cancer biology and systems pharmacology. Cancer Res. 2013;73(14):4372-4382.

Weinstein JN. Drug Discovery: Zelllinien bekämpfen Krebs. Nature. 2012;483:544-545.

Shahmirzadi L, Chao EC, Palmaer E, Parra MC, Tang S, Gonzalez KD. Patientenentscheidungen zur Offenlegung sekundärer Befunde bei den ersten 200 Personen, die sich einer klinischen diagnostischen Exom-Sequenzierung unterzogen. Genet Med. Epub October 10, 2013.

Flicek P, Amode MR, Barrell D, et al. Ensembl 2011. Nucleic Acids Res. 2011;39:D800-D806.

Pruitt KD, Tatusova T, Klimke W, Maglott DR. NCBI Reference Sequences: current status, policy and new initiatives. Nucleic Acids Res. 2009;37:D32-D36.

Schreibe einen Kommentar

Deine E-Mail-Adresse wird nicht veröffentlicht.