Úvod

Mnoho nemocí má genetický základ. Některé jsou důsledkem absence nebo dysfunkce daného proteinu v důsledku mutací v kódujícím genu. To je případ nemocí s mendelovskou dědičností, jako je Huntingtonova choroba, talasemie a přibližně 1 000 dalších dědičných vzácných onemocnění.1 Mnoho nemocí má genetický základ, i když nejsou způsobeny výhradně mutací jediného genu, a stále více genetických variant a polymorfismů je identifikováno jako rizikové faktory komplexních onemocnění.2 Rakovina je genetické onemocnění způsobené mutací jednoho nebo více genů, které buď zvyšují riziko vzniku rakoviny (např. mutace zárodečné linie), nebo rakovinu podporují (onkogeny), nebo narušují buněčné mechanismy, které kontrolují buněčnou proliferaci (supresorové geny), k čemuž dochází u somatických mutací.3

Identifikace genetického základu těchto onemocnění byla ještě před několika lety pracným a náročným projektem. Tyto projekty často začínaly identifikací oblasti genomu, která se pravděpodobně podílí na přenosu onemocnění, pomocí genetických asociačních studií.1 K definování oblasti genomu, která má vysoký vztah k přenosu onemocnění, je obvykle nutná analýza velkých rodin s několika postiženými členy. Obvykle tato oblast obsahuje několik genů, které je třeba sekvenovat, aby bylo možné identifikovat genovou mutaci přítomnou u všech postižených jedinců a nikoli u jejich zdravých příbuzných, v případě dominantní dědičnosti. V případě recesivního přenosu by mutace měla být přítomna v obou alelách postižených členů a v jedné nebo žádné z alel nepostižených příbuzných.

Diagnostika genetických onemocnění byla a ve většině případů stále je stejně pracná. V nejlepším případě může mít nemoc původ v mutaci pouze v jednom genu. Diagnostika by vyžadovala určení nukleotidové sekvence pouze tohoto genu. Obvykle se gen amplifikuje jako několik fragmentů polymerázovou řetězovou reakcí a u každého se určí nukleotidová sekvence. Často může být onemocnění způsobeno mutací v některém z několika genů a pro zjištění genetického původu onemocnění u postižených pacientů je třeba amplifikovat a sekvenovat všechny z nich. Například u dyskeratosis congenita se mutace mohou nacházet v některém z genů dkc, tert, terc, NOP10, NH2 nebo TINF2 a počet postižených genů může být ještě větší, protože existuje část pacientů, u nichž nebyla příčinná mutace identifikována.4,5 Pro molekulární diagnózu každého pacienta je třeba určit nukleotidovou sekvenci všech těchto genů. U různých typů rakoviny nacházíme několik mutovaných genů.3 Molekulární diagnostika vyžaduje stanovení nukleotidové sekvence několika z těchto genů. V současné době se jedná o pracný a nákladný proces, který nelze použít pro velkou populaci pacientů. V praxi se pro účely diagnostiky a léčby sekvenuje pouze několik genů, které jsou mutovány u významné části pacientů postižených některými typy rakoviny.

Jen v posledních několika letech byly vyvinuty techniky pro současnou detekci více sekvenčních variant v daném vzorku. Mnohé z nich jsou založeny na technologii mikročipů deoxyribonukleové kyseliny (DNA). V genotypovacích maticích jsou na sklíčko naneseny oligonukleotidy obsahující aktivně identifikované mutace související s daným onemocněním. Na sklíčko se přidá vzorek DNA pacienta a hybridizující oligonukleotidy se identifikují. Během jediné hybridizace na mikročipu lze testovat miliony známých mutací.6 Změny v počtu kopií lze také analyzovat pomocí mikročipů DNA určených k detekci přítomnosti oblastí DNA, které jsou v DNA pacienta duplikovány nebo odstraněny.7 Tyto techniky se často používají v lékařském výzkumu a pro klinickou diagnostiku.8

Významným krokem v molekulární medicíně je však nedávný vývoj technologií masivního sekvenování, které umožňují stanovit nukleotidovou sekvenci DNA pacienta v krátkém čase a za přijatelnou cenu.9,10 Tyto metodiky se používají od roku 2005 a jsou založeny na současném stanovení nukleotidové sekvence milionů fragmentů DNA. Byly pojmenovány jako sekvenování druhé generace, sekvenování nové generace, hloubkové sekvenování nebo masivně paralelní sekvenování. Pomocí těchto přístrojů jsou určeny tisíce milionů nukleotidových sekvencí za maximálně 2 týdny. Jako příklad kapacity těchto nových sekvenačních systémů uveďme, že klíčové sekvenování prvního lidského genomu, publikované v roce 2001,11 vyžadovalo koordinovanou práci 23 laboratoří, která trvala 13 let a jejíž celkové náklady činily přibližně 3 miliardy USD. S novými metodikami trvá sekvenování lidského genomu jedné laboratoři a přibližně 2 týdny s přibližnými náklady 4 000 USD.

Dostupnost moderních sekvenačních metodik vytváří exponenciální růst našich znalostí o lidském genomu, variabilitě mezi jednotlivci a identifikaci genetických variant u nemocí. Tyto metodiky jsou například základem probíhajícího projektu 1000 genomů12 , jehož cílem je určit kompletní nukleotidovou sekvenci přibližně 1 000 osob různého geografického a etnického původu, aby bylo možné určit průměrnou variabilitu sekvence mezi jednotlivci a identifikovat nejčastější polymorfismy.

Masivní sekvenační technologie se v současné době vyvíjejí rychlým tempem. Vyvíjejí se menší a rychlejší stroje a zavádějí se nové metody sekvenování. Důležitým cílem je například sekvenování jediné molekuly DNA z jednotlivé buňky.13,14 Kromě technických problémů pokrok neustále snižuje cenu sekvenování DNA, takže cíl sekvenovat genom jednotlivého člověka za 1 000 USD se zdá být během několika let na dosah. V současné době je sekvenování celého lidského genomu a analýza všech získaných sekvenačních dat složitá, nákladná a časově náročná, a proto se mnoho studií provádí na menší části genomu. V současné době se věnuje velká pozornost zejména sekvenování oblasti genomu kódující bílkoviny, která je známá jako exom. Sekvenování exomu je mnohem dostupnější než sekvenování celého genomu a v tomto přehledu budou diskutovány možnosti, výhody a omezení této techniky.

Co je to exom?

Téměř všechny lidské geny kódující proteiny mají nespojitou strukturu. Oblast kódující bílkoviny je rozdělena na několik částí, kterým se říká exony. Exony jsou spojeny fragmenty DNA nekódujícími bílkoviny neboli introny, jak je schematicky znázorněno na obrázku 1. Geny jsou transkribovány z promotorové oblasti pod kontrolou několika regulačních oblastí, které se nacházejí na různých místech ve vztahu ke genu, před ním, za ním nebo dokonce uvnitř genu. Transkripcí vzniká primární transkript, který obsahuje exony a introny. Následné procesy sestřihu ribonukleové kyseliny (RNA) odstraňují introny a spojují exony, čímž vzniká zralá messengerová RNA (mRNA), která obsahuje pouze jednu souvislou oblast kódující protein. Nedávné studie ukazují, že primární transkripty většiny genů mohou být sestřihány několika způsoby, čímž vznikají různé zralé mRNA obsahující specifické kombinace exonů, známé jako alternativní varianty sestřihu (obrázek 1). Tyto mRNA kódují izoformy proteinů, které mají některé společné oblasti, ale které se také liší od jiných v závislosti na začleněných exonech.15

Analýza lidského genomu ukázala, že geny kódující proteiny představují malou část DNA, pouze asi 3 %.16 Exony představují ještě menší část na úrovni 1 % genomu.16 Souhrn těchto údajů je uveden v tabulce 1. Lidský genom se skládá z 3,3 ×109 párů bází (bp) a obsahuje 20 078 genů kódujících bílkoviny.17 Každý gen je rozdělen na průměrný počet osmi exonů, z nichž každý je dlouhý přibližně 170 bp. Všechny exony jako celek obsahují přibližně 3 ×107 bp. Sekvenování všech exonů však poskytuje stejné informace o sekvenci aminokyselin kódovaných proteinů jako sekvenování celého genomu, s výjimkou mutací, které mění sestřih mRNA, jak bude uvedeno v části Sekvenování exomu a analýza dat. Tento systém sekvenování všech exonů byl nazván exomové sekvenování a stal se platnou metodou zjišťování změn v aminokyselinové sekvenci všech lidských proteinů.18 Díky velmi výraznému rozdílu ve velikosti je exomové sekvenování mnohem levnější než sekvenování genomu, což usnadňuje výpočetní a funkční analýzy získaných sekvenačních dat.

Obrázek 1 Schematické znázornění struktury a exprese genů.
Poznámky: Geny kódující bílkoviny se skládají z exonů, které obsahují informace kódující bílkoviny (rámečky), oddělené nekódujícími introny (čáry). Šedé rámečky označují oblasti exonů kódující proteiny a bílé rámečky představují 5′ a 3′ nepřekládané oblasti mRNA. Geny jsou přepisovány z promotorových oblastí bezprostředně před exonem 1. Místo začátku transkripce je označeno šipkou. Exprese genu je řízena řadou oblastí TR, které se mohou nacházet před nebo za genem, v různé vzdálenosti nebo uvnitř genu (nejčastěji v intronech). Stabilitu mRNA a translaci lze regulovat vazbou mikroRNA na specifická místa v 3′ nepřekládané oblasti (označeno hvězdičkami). Geny jsou přepisovány do primární RNA obsahující introny a exony. Následné procesy sestřihu odstraňují introny a vytvářejí zralé mRNA. Alternativní procesy sestřihu mohou vést ke vzniku různých mRNA v závislosti na exonech, které obsahují (mRNA1, mRNA2), které kódují různé izoformy proteinů.
Zkratky: TR, regulační oblast transkripce; RNA, ribonukleová kyselina; mRNA, messengerová ribonukleová kyselina.

Tabulka 1 Obecné charakteristiky lidského genomu a exomu

Techniky zachycení exomu

Prvním a nejdůležitějším krokem při sekvenování exomu je izolace nebo zachycení exonů. Používané metody jsou založeny na hybridizaci DNA. Analýza lidského genomu umožnila identifikaci všech genových exonů a usnadňuje návrh oligonukleotidových sond specifických pro každý z nich. Tyto sondy se používají k purifikaci exonů z DNA.19 Prvním krokem je fragmentace DNA na kousky ne větší než 500 bp. DNA se poté hybridizuje s oligonukleotidovými sondami specifickými pro exony a hybridizované fragmenty se purifikují. Hybridizaci lze provádět v kapalné fázi. V tomto případě jsou oligonukleotidy označeny tak, aby bylo možné oddělit komplexy DNA-oligonukleotid od většiny nehybridizované DNA. V běžném příkladu jsou oligonukleotidy kovalentně vázány na biotin, takže hybridy DNA-oligonukleotidů lze izolovat pomocí molekuly vázající biotin, streptavidinu, spojeného s magnetickými kuličkami. Fragmenty DNA, které neobsahují exony, se na streptavidinové kuličky nevážou a lze je účinně odstranit po několika promývacích krocích. Fragmenty obsahující exony, navázané na kuličky, lze získat zpět po disociaci hybridů DNA-oligonukleotidů za podmínek nízké iontové síly.

Exony lze také izolovat hybridizací na pevný nosič, na který byly naneseny exonově specifické oligonukleotidy, podobně jako u DNA mikročipů. V tomto případě se fragmentovaná DNA rozprostře na oligonukleotidy, aby se umožnila hybridizace. Později se nehybridizovaná DNA odmyje a DNA obohacená o exony se eluuje za nízkoiontových podmínek.

Různí komerční dodavatelé nabízejí soupravy pro izolaci exomů pomocí hybridizačních protokolů v kapalné fázi, včetně společností Agilent Technologies (Santa Clara, CA, USA), Roche NimbelGen, Inc. (Madison, WI, USA), Illumina, Inc. (San Diego, Kalifornie, USA) a Life Technologies (Carlsbad, Kalifornie, USA). Tyto soupravy umožňují izolovat více než 90 % exonů přítomných v genomu s více než 90% specifičností při přibližné ceně 150 USD za exom. Několik autorů tyto platformy pro zachycení exomu porovnávalo20-22 a údaje získané Clarkem a spol.22 porovnávající soupravy SureSelect Human All Exon 50 Mb (Agilent Technologies), SeqCap EZ Exome Library v2.0 společnosti Roche NimbleGen, Inc. a TruSeq Exome Enrichment společnosti Illumina, Inc. jsou shrnuty v tabulce 2. Některé z těchto souprav pokrývají kromě oblastí kódujících proteiny také nepřekládané oblasti mRNA, což umožňuje analýzu regulačních oblastí, jako jsou vazebná místa mikroRNA (miRNA). Zahrnutí 5′ nepřekládaných oblastí také umožňuje analýzu proximálních promotorových oblastí.22 Většina souprav navíc pokrývá až 80 % kódujících oblastí miRNA.21 V poslední době byly těmito i dalšími dodavateli vyvinuty zdokonalené soupravy, takže údaje uvedené v tabulce 2 je třeba považovat pouze za orientační. Je důležité poznamenat, že purifikace exonů je kritickým krokem. Obnovení 100 % exonů je obtížné a v izolovaném exomu jsou exony často ztraceny nebo nedostatečně zastoupeny. Například pokud se analyzuje exom pacienta a během purifikace se ztratí 10 % exonů, pravděpodobnost, že kvůli této technické chybě bude chybět relevantní mutace, bude přibližně 10 %. Proto má při sekvenování exomu zásadní význam použití vysoce účinných postupů zachycení exonů.

Tabulka 2 Srovnání tří hlavních platforem pro zachycení exomu
Poznámky: aSrovnání databází Ensemble81 respektive RefSeq82; bprocento vybraných oblastí sekvenovaných každou platformou alespoň desetkrát po analýzách 80 mega čtení sekvence DNA. Agilent Technologies (Santa Clara, Kalifornie, USA); Roche NimbelGen, Inc. (Madison, WI, USA); Illumina, Inc. (San Diego, CA, USA).
Zkratky: mRNA, messenger ribonukleová kyselina; miRNA, mikro ribonukleová kyselina; DNA, deoxyribonukleová kyselina.

Exomové sekvenování a analýza dat

Fragmenty obsahující exony jsou sekvenovány pomocí některého ze systémů nebo technologií masivního sekvenovacího zařízení, které jsou v současnosti k dispozici. Jak bylo uvedeno v úvodu, tyto platformy určují nukleotidovou sekvenci milionů fragmentů DNA současně. Stanovená délka sekvence každého fragmentu při sekvenování exomu není dlouhá, obvykle se pohybuje mezi 35 bp a 100 bp. Protože však byla DNA původně fragmentována náhodně, bude každý jednotlivý nukleotid přítomen v mnoha překrývajících se fragmentech. Pokud se tedy získá dostatečně vysoký počet sekvencí, i když jsou krátké, bude každá báze nezávisle sekvenována v několika fragmentech DNA. Počet, kolikrát je každá báze sekvenována, se nazývá pokrytí nebo hloubka sekvenování. Pokrytí přímo souvisí s kvalitou a důvěryhodností získané nukleotidové sekvence. Obecně se pro získání spolehlivých výsledků při sekvenování exomu považuje za nezbytné pokrytí 20×-30×.59 Tato hloubka sekvenování znamená, že případná změna sekvence by byla nezávisle sekvenována ve 20-30 různých fragmentech DNA.

Analýza dat je posledním krokem v projektech sekvenování exomu (obrázek 2). Jak bylo uvedeno výše, jsou generována data z milionů sekvencí a jejich analýza vyžaduje specifické a složité počítačové programy a odborné znalosti.19,23 Předběžným krokem je analýza kvality generované sekvence. Testuje se přesnost čtení sekvencí při různých délkách sekvencí, průměrná délka čtení, jakož i další parametry. Pokud je kvalita dostatečně dobrá, porovnává se každá sekvence s referenční sekvencí, což je obvykle poslední dostupná verze sekvence lidského genomu. Obvykle lze s referenčním genomem zarovnat více než 80 % vytvořených sekvencí.22 Tento krok umožňuje malou míru nukleotidové variability vzhledem k referenčnímu genomu. Dalším krokem analýzy je identifikace sekvenčních variací mezi referenční sekvencí a sekvencí exomu získanou v naší studii. Následná analýza těchto variant by mohla poskytnout požadované informace o studovaném zdravotním problému.

Obrázek 2 Analýza dat sekvenování exomu.
Poznámky: Kroky potřebné pro izolaci exomu, sekvenování a analýzu dat jsou znázorněny schematicky. Tento proces řídí identifikaci variant genů, které se podílejí na vzniku onemocnění (driver geny) nebo jinak souvisejí s náchylností k onemocnění, evolucí nebo reakcí na léčiva. Tyto údaje poskytují cenné informace pro diagnózu a prognózu, pro genetické poradenství a pro návrh personalizované léčby.
Zkratka: DNA, deoxyribonukleová kyselina.

Exomové sekvenování může odhalit několik typů genetických variací. Jednou z nejčastěji zjišťovaných odlišností je změna jednoho nukleotidu za jiný, například A za G (kodon ATA na ATG). Tyto odchylky se nazývají jednonukleotidové varianty (SNV), i když za jednonukleotidové polymorfismy (SNP) se považují tehdy, když je jejich četnost v populaci větší než 1-5 % a nemají výrazný vliv na riziko nějakého onemocnění. Většina SNV je tichá, nebo také známá jako synonymní, protože obě sekvenční varianty kódují stejnou aminokyselinu (například varianta GCA na GCC, protože v obou případech jde o kodony alaninu). Většina těchto polymorfismů nepředstavuje žádný rozdíl pro kódovaný protein, nepodléhá evoluční selekci a představuje nejčastěji nalézané varianty v lidském exomu. Výjimkou jsou některé tiché mutace, které ovlivňují sestřihově-regulační signály nebo dokonce místa regulující transkripci a mění sestřih mRNA nebo expresi, i když nemění kódované aminokyseliny. V jiných případech má nukleotidová odchylka důsledek v kódovaném proteinu a jedná se o nemlčící nebo nesynonymní varianty. Tyto změny mohou vést k odchylkám v kódované aminokyselině (například GAT na GAG mění kyselinu asparagovou na kyselinu glutamovou) a nazývají se missense mutace. Drastičtější změny vznikají, když nukleotidová odchylka vytvoří translační stop kodon (například TGC na TGA mění cysteinový kodon na stop kodon), což se nazývá nonsense mutace. Existuje také typ SNV, který lze detekovat pomocí sekvenování exomu, i když neovlivňuje proteinové kodony. Vzhledem k tomu, že exony jsou vybírány po náhodné fragmentaci DNA, mohou obsahovat i sousední oblasti DNA, včetně sousedních intronových sekvencí, a dokonce i genové promotory, pokud byly zachyceny nepřekládané oblasti.24 Intronové oblasti obsahují regulační signály potřebné pro sestřih mRNA. SNV v těchto oblastech mohou různými způsoby změnit sestřih.15 Například postižený intron může být zachován ve zralé mRNA nebo může dojít ke sestřihu přilehlého exonu (přeskočení exonu). Tyto změny mění nukleotidovou sekvenci zralé mRNA, a tedy i kódovaný protein za SNV.25 Sekvenování exomu může také odhalit změny sekvence způsobené malými inzercemi nebo delecemi (indely).22 Tyto změny mohou vést k posunu rámce, s výjimkou případů, kdy se týkají tří nebo násobku tří nukleotidů. V takovém případě by vznikly malé delece nebo inserce aminokyselin.

Identifikace kauzálních mutací

Funkční význam zjištěných sekvenčních variant je třeba určit v dalším kroku analýzy dat. I když jsou všichni lidé z genetického hlediska téměř identičtí, počet rozdílů v sekvenci nukleotidů mezi jednotlivci je značný.26 Tato heterogenita komplikuje interpretaci dat získaných v jednotlivých sekvenačních projektech. Některé obecné údaje o individuálních sekvenčních rozdílech jsou uvedeny v tabulce 3. Vezmeme-li v úvahu celý genom, byl počet sekvenčních rozdílů mezi jedinci odhadnut na 4 × 106, a to podle údajů získaných v rámci projektu 1000 genomů a menších projektů sekvenování celého genomu.27 Exomy vykazují menší, ale stále značný počet sekvenčních variací, kterých je mezi dvěma nepříbuznými jedinci přibližně 20 000-25 000.27,28 Většina těchto genetických variací je němá, jak bylo uvedeno dříve. Počet nemlčících sekvenčních rozdílů mezi jedinci byl odhadnut na 10 000. Většina těchto variant existuje v běžné populaci a přenáší se po generace. Odhaduje se, že u každého jedince se de novo objeví méně než jedna nemlčící SNV.29

Údaje získané v projektech sekvenování exomu se často filtrují, aby se identifikovaly všechny SNP, které se vyskytují u jiných jedinců a které tedy nesouvisejí se studovaným onemocněním.2,19,23 Tento proces lze provést porovnáním s veřejnými databázemi, kde jsou shromážděny SNP, které byly nalezeny v projektech sekvenování. Výhrada, kterou je třeba vzít v úvahu, spočívá v tom, že všechny velké databáze obsahují řadu prokázaných mutací způsobujících relativně častá onemocnění. Po tomto kroku filtrování zbývá přibližně 400-700 nových a pravděpodobně relevantních SNV (tabulka 3).28 Dalším úkolem je určit, které z SNV, které se v globální populaci nevyskytují, pokud vůbec nějaké existují, jsou původcem zkoumaného onemocnění. Mnohé ze zjištěných rozdílů nebudou spojeny s žádným výskytem onemocnění a tyto změny se označují jako „passenger changes“.23 Naproti tomu jedna nebo několik málo změn může mít příčinnou roli a nazývají se „driver changes“. Přístup použitý k identifikaci těchto hybných změn bude záviset na konkrétních okolnostech studie. U nemocí s mendelovským vzorcem dědičnosti je obvykle nutné analyzovat řadu postižených a nepostižených jedinců, aby se našly genové změny, které dokonale segregují s nemocí. Toto srovnání má větší vypovídací hodnotu u velkých rodin s dobře charakterizovanými rodokmeny. Pokud neexistují dostatečně velké postižené rodiny, umožňuje identifikaci řídicích genů také srovnání řady nepříbuzných pacientů a kontrol. K výběru možných SNV souvisejících s onemocněním se používají další kritéria, včetně algoritmů in silico, které předpovídají možný význam mutované aminokyseliny na základě evolučního zachování a na základě předpokládaného dopadu na strukturu a funkci proteinu. Předpokládaná funkce mutovaného proteinu a jeho tkáňově specifický vzorec exprese jsou rovněž kritérii používanými při výběru předpokládaných kauzálních mutací.

Tabulka 3 Souhrn sekvenčních variací mezi jedinci

Některé příklady těchto typů studií budou uvedeny v pozdější části. S přibývajícími studiemi se však objevuje stále více genových variací, které jsou příčinou dědičných onemocnění, a je tedy pravděpodobné, že některé z genů mutovaných u pacienta by již byly popsány. Tyto mutované geny lze nalézt v literatuře a ve specializovaných databázích, jako je například databáze Online Mendelian Inheritance in Man (http://www.omim.org). Možnou relevanci mutací nalezených v různých genech lze také vyhledat na stránce Genome Ensemble (http://www.ensembl.org/), pokud byly již dříve popsány.

Nádorová onemocnění jsou pravděpodobně nejrozšířenější skupinou onemocnění s genetickým základem. Mnoho studií bylo zaměřeno na určení řídicích genů pro různé typy rakoviny.30 Vznikající skupinu řídicích genů pro rakovinu lze vyhledat v databázích, jako je Catalogue of Somatic Mutations In Cancer (COSMIC; http://cancer.sanger.ac.uk) nebo The Cancer Genome Atlas (http://cancergenome.nih.gov/). Několik podrobnějších příkladů bude uvedeno v části Příklady klinického využití sekvenování exomu.

Srovnání sekvenování exomu s jinými přístupy masivního sekvenování

Sekvenování genomu

Jak bylo uvedeno v úvodu, sekvenování celého lidského genomu je stále dostupnější. Ve srovnání se sekvenováním exomu je sekvenování celého genomu mnohem komplexnější alternativou. Počet sekvenačních reakcí, které je třeba provést, je mnohem vyšší, stejně jako počet generovaných dat o sekvenci nukleotidů. Výpočetní analýza se značně zvyšuje. Kromě toho je nalezeno mnohem více genetických variant, jak ukazuje tabulka 3, což ztěžuje identifikaci řídicích genů. Sekvenování genomu však poskytuje kompletní pohled na genetické změny přítomné u pacienta, včetně rozsáhlých reorganizací genomu. Sekvenování genomu s krátkými čteními ve střední hloubce však přehlédne strukturní změny, zejména v oblastech s nízkou komplexitou. Tyto informace jsou shrnuty v tabulce 4, která porovnává sekvenování exomu s jinými přístupy sekvenování.

Jak již bylo zmíněno, geny kódující proteiny představují pouze 3 % genomu.16 Zbytek genomu byl donedávna považován za „objemnou DNA“ bez větší informační hodnoty. Nedávné studie však tento pohled zcela změnily. Funkci všech oblastí genomu zkoumá rozsáhlý celogenomový projekt Encyclopedia of DNA Elements (ENCODE).31 V současnosti dostupné výsledky ukazují, že více než 70 % genomu je transkribováno. Mnohé z vytvořených transkriptů nekódují proteiny, ale zdá se, že mají regulační úlohu v genové expresi. Patří mezi ně již známé miRNA, které regulují stabilitu a translaci mRNA (obrázek 1), ale také více než 20 000 dlouhých nekódujících RNA, které regulují transkripci. Kromě toho bylo identifikováno mnoho oblastí DNA, které regulují genovou expresi, včetně mnoha dosud neznámých promotorových a transkripčních regulačních oblastí (obrázek 1). Tyto informace mají klinický význam, protože mutace v regulačních oblastech mohou ovlivnit expresi konkrétních genů a mohou mít patologické následky. Velká část celogenomových asociačních studií totiž spojuje oblasti DNA, v nichž nebyly nalezeny mutace kódující proteiny, s patologickými stavy.32 Data získaná v rámci projektu ENCODE umožnila revizi některých případů, při níž bylo zjištěno, že za onemocnění jsou zodpovědné mutace v regulačních oblastech exprese genů.31,32 Také Weedon et al33 v nedávném příkladu uvedli, že mutace v transkripční regulační oblasti genu PTF1A způsobují izolovanou agenezi pankreatu. Mutace v regulačních oblastech nelze detekovat pomocí sekvenování exomu, protože neovlivňují kódovaný protein, ale jeho expresi. Celogenomové sekvenování proto poskytuje více informací než sekvenování exomu na úkor zvýšené složitosti a ekonomických nákladů.

Tabulka 4 Porovnání technik masivního sekvenování
Zkratky: RNA, ribonukleová kyselina; DNA, deoxyribonukleová kyselina.

Sekvenování RNA

Techniky sekvenování RNA spočívají v převodu populací RNA na komplementární DNA (cDNA) pomocí reverzní transkripce a jejich následném sekvenování.34,35 V případě sekvenování mRNA je kompletní populace mRNA exprimovaná v buněčné linii nebo vzorku tkáně (známá jako transkriptom) převedena na cDNA a sekvenována. Proces sekvenování mRNA poskytuje informace o nukleotidové sekvenci genů, které jsou v analyzovaném vzorku přepisovány, a tedy o aminokyselinové sekvenci příslušných proteinů. Kromě toho lze odhadnout počet sekvencí generovaných pro každou mRNA, který je úměrný jejímu množství. Proto lze stanovit úrovně exprese genů a porovnat je s úrovněmi exprese jiných vzorků, včetně případných kontrolních vzorků (tabulka 4). Další specifickou výhodou sekvenování mRNA je, že umožňuje studovat alternativní sestřihy.36,37 Jak již bylo zmíněno, primární transkripty jsou často zpracovávány více způsoby, takže vznikají mRNA, které obsahují různé exony (obrázek 1). Tyto mRNA lze identifikovat pomocí sekvenování mRNA, a nikoli pomocí sekvenování exomu nebo genomu, které určuje sekvenování přepisované DNA, a nikoli sekvenování zralého transkriptu. Jinak sekvenování mRNA a exomu poskytuje podobné informace o oblasti genomu kódující proteiny. Rozdíl je v tom, že sekvenování exomu zahrnuje všechny geny a sekvenování mRNA se omezuje na geny exprimované v analyzovaném vzorku. Například nedávná studie sekvenování mRNA lymfoblastoidních buněčných linií od 462 jedinců určila kódující sekvenci přibližně 13 000 genů z 20 078 lidských genů.38 V tomto příkladu nebylo studováno přibližně 7 000 genů, protože nebyly exprimovány v lymfoblastoidních buněčných liniích. Nicméně v případech, kdy je typ buňky nebo tkáně postižené daným onemocněním dobře znám, by sekvenování mRNA bylo pro studium řídicích mutací rovnocenné sekvenování exomu. Další vlastností sekvenování mRNA je, že umožňuje detekovat sekvenční změny vzniklé editací RNA.39 Řada mRNA je zpracovávána tak, že dochází ke změně některých nukleotidů, přičemž nejčastěji vznikají změny adenosinu na inosin. Tyto změny jsou detekovány sekvenováním mRNA, ale nelze určit, zda vznikly editací RNA, nebo jako důsledek genomových změn, pokud nejsou porovnány sekvence mRNA i genomu.

Stanovení hladiny exprese mRNA může být v určitých případech velmi výhodné, protože některá onemocnění mohou být způsobena deregulovanou expresí jednoho nebo více genů. Změny hladin exprese mohou být velmi informativní o genetickém původu onemocnění. Například změny v expresi jednoho nebo více genů u pacienta mohou naznačovat poruchu mechanismů, které regulují jejich expresi. Tato dysfunkce by mohla být způsobena mutacemi v regulačních oblastech transkripce genů, jak je uvedeno v části věnované sekvenování genomu. Mohla by být také způsobena změnami v expresi nebo struktuře transkripčních regulačních faktorů.40 Změny v expresi genů jsou často způsobeny změnami v epigenetických mechanismech regulace genové exprese, jako je metylace DNA, které nelze zjistit sekvenováním genomu nebo exomu.41 Nedávno byly vyvinuty metody pro studium metylace celého genomu, které umožňují podrobné studium této epigenetické informace.42 Rakovina je jedním z onemocnění, u nichž bylo provedeno více studií úrovně genové exprese. Ve stále větším počtu případů jsou změny v expresi genů nebo skupiny genů spojeny s diagnózou rakoviny, prognózou nebo předpovědí odpovědi na protinádorové léky.43 Tyto změny v expresi genů se používají jako biomarkery. Mnohé z těchto studií jsou dostupné prostřednictvím databáze Cancer Genome Anatomy Project (http://cgap.nci.nih.gov).

Specifický typ projektu sekvenování RNA je zaměřen na stanovení sekvence nukleotidů a úrovně exprese malých regulačních RNA (miRNA). Malé RNA regulují expresi jiných genů tím, že určují stabilitu a/nebo translaci jejich mRNA (obr. 1). Změny ve vzorcích exprese miRNA proto mohou mít výrazný dopad na profil exprese proteinů v buňkách a tkáních. Byly vyvinuty protokoly pro purifikaci a sekvenování kompletní populace miRNA daného vzorku a pro stanovení úrovně jejich exprese.44 Většina platforem pro zachycení exonů také zahrnuje až 80 % známých oblastí kódujících miRNA.21

Sekvenování vybraných souborů genů

Některá onemocnění již byla studována tak podrobně, že je známa většina příslušných genů. To může být případ nemocí s mendelovským vzorcem dědičnosti, u nichž jsou všechny studované případy způsobeny mutacemi v některém z řady známých genů. Jiným příkladem jsou některé typy rakoviny, které jsou převážně způsobeny mutacemi v omezeném počtu genů. V takových případech by přímějším přístupem k charakterizaci vzorku pacienta bylo stanovení sekvence genů, které byly dříve identifikovány jako příčinné pro dané onemocnění. Klasickým přístupem by bylo amplifikovat všechny exony těchto genů a určit nukleotidovou sekvenci každého z nich. Alternativním přístupem masivního sekvenování by bylo purifikovat všechny předpokládané příslušné genomové oblasti a současně určit jejich nukleotidovou sekvenci v jediném běhu.45-47 Pro purifikaci kandidátních oblastí DNA se obecně používají dvě metody. První je jejich amplifikace pomocí polymerázové řetězové reakce s použitím sady specifických oligonukleotidů jako primerů. Druhá metoda spočívá ve fragmentaci DNA vzorku a purifikaci příslušných fragmentů hybridizací na specifické oligonukleotidy, a to buď v roztoku, nebo fixované na pevném nosiči, jak bylo dříve popsáno pro purifikaci exonů.48 Vybrané oblasti mohou obsahovat exony kódující proteiny a také jiné oblasti DNA, jako jsou regulační oblasti transkripce. Tyto oblasti obvykle odpovídají několika stovkám genů, a proto je analýza získaných sekvenčních dat mnohem snazší než u jiných přístupů masivního sekvenování. Hlavním omezením je, že se jedná o přístup založený na hypotézách, který neumožňuje detekci mutací v genech, které se studovaným onemocněním dosud nesouvisely (tabulka 4).

Příklady klinického využití sekvenování exomu

Nejčastější využití sekvenování exomu je pravděpodobně pro diagnostiku monogenních onemocnění. Bylo popsáno více než 3 000 monogenních poruch, ačkoli molekulárně genetické příčiny většiny z nich nejsou dosud známy.1 Exomové sekvenování lze použít k identifikaci těchto mutací, jak uvádí Kuhlenbäumer et al1 v nedávném přehledu. V některých z prvních studií bylo exomové sekvenování použito k identifikaci genetických mutací zodpovědných za známá onemocnění, jako jsou Kabukiho,49 Schinzel-Giedionův,50 Joubertův,51 a hyperfosfatický syndrom mentální retardace,52 závažné malformace mozku53 nebo známá amyotrofická laterální skleróza.54 Exomové sekvenování bylo také použito k odhalení nových mutací přítomných ve sporadickém případě mentální retardace.29 Kromě toho byla tato technika použita například k diagnostice vrozeného chloridového průjmu,55 zánětlivého střevního onemocnění,56 nemoci Charcot-Marie-Tooth,57 novorozeneckého diabetu mellitu58 nebo syndromu Brown-Vialetto-van Laere.59 Studie, o níž referovali Worthey a spol.56 , představuje relevantní příklad klinického využití sekvenování exomu. Dítě mužského pohlaví se prezentovalo s onemocněním podobným Crohnově chorobě bez definitivní diagnózy, a to navzdory komplexnímu klinickému hodnocení. Autoři se rozhodli použít k identifikaci příčinné mutace (mutací) přístup exomového sekvenování. Analýza sekvenačních dat odhalila u pacienta 16 124 variant. Filtrování dat při zohlednění nových variant přítomných v homozygotnosti, hemizygotnosti nebo složené heterozygotnosti a při postižení vysoce konzervovaných aminokyselinových zbytků, u nichž se předpokládá, že poškozují funkci proteinu, umožnilo autorům vybrat mutaci v genu X-linked inhibitor of apoptosis (XIAP). Funkční studie prokázaly význam této mutace pro prozánětlivou odpověď pozorovanou u pacienta. Na základě identifikace této mutace byla provedena alogenní transplantace krvetvorných progenitorových buněk. Sekvenování exomu tedy umožnilo identifikovat necharakterizovanou mutaci pro stanovení molekulární diagnózy u individuálního pacienta v rámci nového onemocnění, což vyústilo v plán léčby. Využití exomového sekvenování při objevování nových příčinných mutací a při diagnostice bylo nedávno přezkoumáno.60,61

Studium běžných a komplexních onemocnění bylo rovněž přiblíženo pomocí exomového sekvenování. Celogenomové asociační studie ukázaly, že některé genetické varianty přinášejí riziko pro řadu onemocnění. Dobře charakterizovanými příklady jsou apolipoprotein E u Alzheimerovy choroby, komplementový faktor H u makulární degenerace nebo glukocerebrosidáza/leucin rich repeat kináza 2 u Parkinsonovy choroby.62-64 O možném využití sekvenování exomu pro studium komplexních onemocnění se již diskutovalo.2,28 Jedním z omezení použití sekvenování exomu v těchto studiích je, že většina variant souvisejících s fenotypem leží distálně od oblastí kódujících proteiny, což by učinilo sekvenování celého genomu lepším přístupem.32 Některé z těchto genetických variant mohou ovlivnit funkčnost transkripčních regulačních oblastí, které řídí genovou expresi. V rámci projektu ENCODE31,65 byla provedena celogenomová analýza těchto regulačních oblastí a bylo zjištěno, že několik genetických variant ve specifických oblastech chromozomu 5 (například) je vazebným místem pro transkripční faktor GATA2, který je silně spojen s Crohnovou chorobou a dalšími zánětlivými onemocněními.

Nádorová onemocnění jsou onemocnění způsobená nahromaděním genomických změn, které vedou ke změně mnoha biologických procesů.19 Na rozdíl od monogenních genetických změn, o kterých jsme hovořili dříve, většina mutací způsobujících rakovinu není přítomna v normální tkáni pacienta; velká část těchto mutací se nachází v oblastech kódujících proteiny a lze je detekovat pomocí sekvenování exomu.19 Další důležitou skupinou genetických změn jsou však velké genomové reorganizace, jako jsou delece, inverze nebo translokace, které nelze exomovým sekvenováním detekovat.66 Navzdory tomuto omezení bylo exomové sekvenování použito k odhalení nádorových driver genů pomocí dvou obecných strategií: porovnání exomu nádorů s exomy zdravých tkání téhož pacienta nebo porovnání exomů několika nepříbuzných pacientů s exomy podobného počtu zdravých kontrol.67-70 V současné době se provádějí rozsáhlé studie, které zahrnují sekvenování exomu nebo genomu velké kohorty pacientů s nádorovým onemocněním a kontrolních skupin za účelem identifikace všech genů ovládajících nádorové onemocnění.19,71,72 Jedním z příkladů je projekt 5 000 nádorových genomů73 , jehož cílem je sekvenovat genom 50 nejčastějších typů nádorových onemocnění. Dostupná data již poskytla obecnou genomickou krajinu nejčastějších nádorových onemocnění, jak shrnuli Vogelstein et al.3 Bylo identifikováno přibližně 140 genů, které při změně podporují tumorigenezi, a to lze nalézt v již zmíněné databázi COSMIC.3 Zjištění mutace některého z těchto genů v exomu vzorku nádorového onemocnění může být důležitým krokem ke správné diagnóze a léčbě pacienta. Současné údaje také poskytují představu o složitosti nádorového genomu.3 Běžné solidní nádory vykazují průměrný počet 33 až 66 nesilentních somatických mutací.3 Tento počet se zvyšuje na více než 200 u nádorů indukovaných mutagenními látkami, jako je rakovina plic a melanom, a dokonce na více než 1 000 u nádorů s deficitem DNA reparačních mechanismů nebo DNA polymerázy E.3 Naproti tomu u tekutých a dětských nádorů se vyskytuje méně než deset somatických mutací.3 Důležitou vlastností nádorů je, že se rychle vyvíjejí a stávají se heterogenními, takže ve vzorcích od téhož pacienta odebraných v různých oblastech nebo v různých časových obdobích v průběhu léčby lze nalézt různé mutace, jak nedávno ukázalo exomové sekvenování.74,75 Navzdory této složitosti se objevují některé sjednocující koncepty a většina známých nádorových driver genů se účastní jedné nebo více z 12 drah, které regulují přežívání buněk, jejich osud a udržování genomu.3,19 V tomto scénáři se začíná exomové sekvenování využívat pro diagnostiku rakoviny prostřednictvím identifikace driver mutací, například u rakoviny prostaty.76

Exomové sekvenování může být užitečné i pro léčbu rakoviny. Přítomnost některých genových mutací může propůjčovat citlivost nebo rezistenci k danému léku, což bylo nazváno farmakogenomikou. Například použití inhibitorů proteinové tyrozinkinázy u nádorů, které nadměrně exprimují proteiny ABL (Abelson murine leukemia viral oncogene homolog 1) nebo EGFR (epidermal growth factor receptor), je známo již několik let. Přístupy sekvenování exomu a genomu však odhalují mnohem více odpovědí mutací na léčebné asociace (jak je zdůrazněno v jednom přehledu77). Informativním příkladem je nedávné zveřejnění exomu buněčného panelu NCI-60.78 Tento panel obsahuje 60 dobře charakterizovaných buněčných linií z devíti typů rakoviny a byl použit v široké škále biologických a farmakologických studií.79 Nukleotidová sekvence exomu těchto buněk byla určena za účelem stanovení genů ovládajících rakovinu, které byly v každé z nich mutovány. Kromě toho, že autoři poskytli seznam domnělých nových genů ovládajících rakovinu, studovali možnou korelaci mezi genotypem každé buněčné linie a dříve zjištěnou odpovědí na velké množství protinádorových látek. Byla zjištěna korelace mezi specifickými genovými mutacemi a odpovědí na několik léků, což odhalilo možný význam exomového sekvenování při výběru personalizované léčby. Exomové sekvenování lze také využít k predikci predispozice k rakovině. Některé příklady lze nalézt v nedávném přehledu zaměřeném na kolorektální karcinom a využívajícím celogenomové sekvenování.72

Medicínské výzvy exomového sekvenování

Exomové sekvenování slibuje významné zlepšení diagnostiky, prognózy a personalizované léčby pacientů. Rozsáhlé použití této technologie však stále vyžaduje řadu zlepšení a také vymezení důležitých etických a lékařských hledisek, jak bylo diskutováno v nedávných přehledech.23,27,60,61,71,77 Technické výzvy zahrnují vývoj účinnějších technik zachycování exonů, sekvenování a zarovnávání, aby bylo možné získat úplné a rovnoměrné zastoupení všech exonů v sekvenci. Je také zapotřebí zdokonalit softwarové nástroje pro analýzu dat pro rychlou a přesnou detekci patologických variant. Rozsáhlé exomové sekvenování bude vyžadovat zavedení specializovaného vybavení a najímání týmů odborníků s odpovídajícími odbornými znalostmi pro vytváření sekvencí a analýzu a interpretaci získaných dat.

Používání exomového sekvenování pro diagnostiku bude také vyžadovat zavedení technických směrnic a předpisů. Bude třeba normalizovat parametry, jako je hloubka sekvenování, pokrytí exonů, metriky kvality dat nukleotidových sekvencí nebo volání zarovnání. Rovněž by mělo být regulováno ukládání dat.

Existuje také řada složitých etických otázek. Důležitá otázka se týká informací, které by měly být poskytnuty pacientovi. Exomové sekvenování by mohlo odhalit genetické odchylky, které nesouvisejí s diagnostikovaným onemocněním. U pacienta se mohou vyskytovat genetické varianty, které představují rizikové faktory nebo mohou být příčinou jiných onemocnění. Jaké informace by měly být pacientovi vráceny? Jaké důkazy by byly nutné k tomu, aby bylo možné považovat genetickou variantu za spojenou s daným onemocněním? Dalšími důležitými otázkami jsou vlastnictví, přístup a uchovávání údajů. Měly by být vytvořené údaje uchovávány pro případné budoucí využití během života pacienta? Tyto a další etické otázky pravděpodobně vyvolají značné kontroverze80 a budou vyžadovat rozsáhlou diskusi, aby bylo dosaženo dohody o kritériích, která se budou používat v klinické praxi.

Závěr

Exomové sekvenování je již nyní mocným nástrojem používaným ke stanovení molekulárního základu genetických onemocnění. Hloubka genetické analýzy je menší než u celogenomového sekvenování, protože se nezjišťují genetické odchylky v oblastech nekódujících proteiny. Nicméně menší počet sekvencí a sekvenčních analýz potřebných pro exomové sekvenování z něj činí cenově dostupnější přístup v klinické praxi. Proto bude exomové sekvenování pravděpodobně technikou volby pro počáteční analýzu pacientů, přinejmenším do doby, než se sníží cena celogenomového sekvenování a než se zdokonalí značný postup analýzy dat. Důležitým omezením použití exomového sekvenování v klinické praxi je skutečnost, že funkční význam většiny očekávaných genetických variant stále není znám. Tato situace se rychle mění, protože stále více genetických variant souvisejících s onemocněním je určeno a zpřístupněno ve veřejných databázích. Je pravděpodobné, že během několika let bude známa většina genetických variant souvisejících s rizikem onemocnění, s přesnou molekulární diagnostikou, předpovědí vývoje onemocnění a farmakologickou odpovědí. Přesná znalost pacientova exomu neboli genomu pak bude rozhodujícím faktorem v lékařské praxi.

Poděkování

Děkuji Rosariu Peronovi a Juliette Siegfriedové (ServingEdit.com) za kritické posouzení rukopisu.

Zveřejnění informací

Autor neuvádí žádný střet zájmů v této práci.

Kuhlenbäumer G, Hullmann J, Appenzeller S. Novel genomic techniques open new avenues in the analysis of monogenic disorders. Hum Mutat. 2011;32(2):144-151.

Kiezun A, Garimella K, Do R, et al. Exome sequencing and the genetic basis of complex traits. Nat Genet. 2012;44(6):623-630.

Vogelstein B, Papadopoulos N, Velculescu VE, Zhou S, Diaz LA Jr, Kinzler KW. Krajiny nádorových genomů. Science. 2013;339(6127):1546-1558.

Kirwan M, Dokal I. Dyskeratosis congenita: genetická porucha mnoha tváří. Clin Genet. 2008;73(2):103-112.

Walne AJ, Dokal I. Advances in the understanding of dyskeratosis congenita. Br J Haematol. 2009;145(2):164-172.

Brady PD, Vermeesch JR. Genomické mikročipy: přehled technologií. Prenat Diagn. 2012;32(4):336-343.

Hehir-Kwa JY, Pfundt R, Veltman JA, de Leeuw N. Pathogenic or not? Posouzení klinického významu variant s počtem kopií. Clin Genet. 2013;84(5):415-421.

Simons A, Sikkema-Raddatz B, de Leeuw N, Konrad NC, Hastings RJ, Schoumans J. Genome-wide arrays in routine diagnostics of hematological malignancies. Hum Mutat. 2012;33(6):941-948.

Metzker ML. Sekvenační technologie – nová generace. Nat Rev Genet. 2010;11(1):31-46.

Sastre L. New DNA sequencing technologies open a promising era for cancer research and treatment. Clin Transl Oncol. 2011;13(5):301-306.

Lander ES, Linton LM, Birren B, et al. International Human Genome Sequencing Consortium. Počáteční sekvenování a analýza lidského genomu. Nature. 2001;409(6822):860-921.

Abecasis GR, Auton A, Brooks LD, et al. 1000 Genomes Project Consortium. Integrovaná mapa genetické variability z 1092 lidských genomů. Nature. 2012;491(7422):56-65.

Yang Y, Liu R, Xie H, et al. Advances in nanopore sequencing technology. J Nanosci Nanotechnol. 2013;13(7):4521-4538.

Chen YS, Lee CH, Hung MY, Pan HA, Chiou JC, Huang GS. Sekvenování DNA pomocí měření elektrické vodivosti DNA polymerázy. Nat Nanotechnol. 2013;8(6):452-458.

Lu ZX, Jiang P, Xing Y. Genetická variabilita alternativního sestřihu pre-mRNA v lidských populacích. Wiley Interdiscip Rev RNA. 2012;3(4):581-592.

Pruitt KD, Harrow J, Harte RA, et al. The consensus coding sequence (CCDS) project: Identifikace společné sady genů kódujících proteiny pro lidský a myší genom. Genome Res. 2009;19(7):1316-1323.

Harrow J, Frankish A, Gonzalez JM, et al. GENCODE: the reference human genome annotation for The ENCODE Project. Genome Res. 2012;22(9):1760-1774.

Teer JK, Mullikin JC. Exomové sekvenování: sladká tečka před celými genomy. Hum Mol Genet. 2010;19(R2):R145-R151.

Liu X, Wang J, Chen L. Whole-exome sequencing reveals recurrent somatic mutation networks in cancer. Cancer Lett. 2013;340(2):270-276.

Parla JS, Iossifov I, Grabill I, Spector MS, Kramer M, McCombie WR. Srovnávací analýza zachycení exomu. Genome Biol. 2011; 12(9):R97.

Sulonen AM, Ellonen P, Almusa H, et al. Comparison of solution-based exome capture methods for next generation sequencing. Genome Biol. 2011;12(9):R94.

Clark MJ, Chen R, Lam HY, et al. Performance comparison of exome DNA sequencing technologies. Nat Biotechnol. 2011;29(10):908-914.

Gullapalli RR, Desai KV, Santana-Santos L, Kant JA, Becich MJ. Sekvenování nové generace v klinické medicíně: H.: Výzvy a poučení pro patologii a biomedicínskou informatiku. J Pathol Inform. 2012;3:40.

Samuels DC, Han L, Li J, et al. Finding the lost treasures in exome sequencing data. Trends Genet. 2013;29(10):593-599.

Taneri B, Asilmaz E, Gaasterland T. Biomedical impact of splicing mutations revealed through exome sequencing. Mol Med. 2012;18:314-319.

Fu W, O’Connor TD, Jun G, et al; NHLBI Exome Sequencing Project. Analýza 6 515 exomů odhaluje nedávný původ většiny variant kódujících lidské proteiny. Nature. 2013;493(7431):216-220.

Marian AJ. Výzvy v lékařských aplikacích objevů v oblasti sekvenování celých exomů/genomů. Trends Cardiovasc Med. 2012;22(8):219-223.

Singleton AB. Exomové sekvenování: transformační technologie. Lancet Neurol. 2011;10(10):942-946.

Vissers LE, de Ligt J, Gilissen C, et al. A de novo paradigm for mental retardation. Nat Genet. 2010;42(12):1109-1112.

Gonzalez-Perez A, Perez-Llamas C, Deu-Pons J, et al. IntOGen-mutations identifies cancer drivers across tumor types. Nat Methods. 2013;10(11):1081-1082.

Bernstein BE, Birney E, Dunham I, Green ED, Gunter C, Snyder M; ENCODE Project Consortium. Integrovaná encyklopedie elementů DNA v lidském genomu. Nature. 2012;489(7414):57-74.

Hardison RC. Celogenomová epigenetická data usnadňují pochopení asociačních studií náchylnosti k nemocem. J Biol Chem. 2012;287(37):30932-30940.

Weedon MN, Cebola I, Patch AM, et al. International Pancreatic Agenesis Consortium. Recesivní mutace v distálním enhanceru PTF1A způsobují izolovanou agenezi pankreatu. Nat Genet. 2014;46(1):61-64.

Wang Z, Gerstein M, Snyder M. RNA-Seq: a revolutionary tool for transcriptomics. Nat Rev Genet. 2009;10(1):57-63.

Mutz KO, Heilkenbrinker A, Lönne M, Walter JG, Stahl F. Transcriptome analysis using next-generation sequencing. Curr Opin Biotechnol. 2013;24(1):22-30.

Hitzemann R, Bottomly D, Darakjian P, et al. Genes, behavior and next-generation RNA sequencing. Genes Brain Behavior. 2013;12(1):1-12.

Costa V, Aprile M, Esposito R, Ciccodicola A. RNA-Seq and human complex diseases: recent accomplishments and future perspectives. Eur J Hum Genet. 2013;21(2):134-142.

Lappalainen T, Sammeth M, Friedländer MR, et al; Geuvadis Consortium; Geuvadis Consortium. Sekvenování transkriptomu a genomu odhaluje funkční variabilitu u lidí. Nature. 2013; 501(7468):506-511.

Slotkin W, Nishikura K. Adenosine-to-inosine RNA editing and human disease. Genome Med. 2013;5:105.

Lee TI, Young RA. Transkripční regulace a její chybná regulace u onemocnění. Cell. 2013;152(6):1237-1251.

Suvà ML, Riggi N, Bernstein BE. Epigenetické přeprogramování u nádorových onemocnění. Science. 2013;339(6127):1567-1570.

Li P, Demirci F, Mahalingam G, Demirci C, Nakano M, Meyers BC. Integrovaný pracovní postup pro analýzu metylace DNA. J Genet Genomics. 2013;40(5):249-260.

Chibon F. Cancer gene expression signatures – the rise and fall? Eur J Cancer. 2013;49:2000-2009.

Dedeoğlu BG. Vysoce výkonné přístupy pro analýzu exprese mikroRNA. Methods Mol Biol. 2014;1107:91-103.

Ni T, Wu H, Song S, Jelley M, Zhu J. Selective gene amplification for high-throughput sequencing. Recent Pat DNA Gene Seq. 2009; 3(1):29-38.

Barretina J, Caponigro G, Stransky N, et al. The Cancer Cell Line Encyclopedia enables predictive modelling of anticancer drug sensitivity. Nature. 2012;483(7391):603-607.

Garnett MJ, Edelman EJ, Heidorn SJ, et al. Systematic identification of genomic markers of drug sensitivity in cancer cells. Nature. 2012;483(7391):570-575.

Hoischen A, Gilissen C, Arts P, et al. Massively parallel sequencing of ataxia genes after array-based enrichment. Hum Mutat. 2010;31(4):494-499.

Ng SB, Bigham AW, Buckingham KJ, et al. Exome sequencing identifies MLL2 mutations as a cause of Kabuki syndrome. Nat Genet. 2010;42(9):790-793.

Hoischen A, van Bon BW, Gilissen C, et al. De novo mutace SETBP1 způsobují syndrom Schinzel-Giedion. Nat Genet. 2010;42(6):483-485.

Edvardson S, Shaag A, Zenvirt S, et al. Joubertův syndrom 2 (JBTS2) u aškenázských Židů je spojen s mutací TMEM216. Am J Hum Genet. 2010;86(1):93-97.

Krawitz PM, Schweiger MR, Rödelsperger C, et al. Identity-by-descent filtering of exome sequence data identifies PIGV mutations in hyperphosphatasia mental retardation syndrome. Nat Genet. 2010;42(10):827-829.

Bilgüvar K, Oztürk AK, Louvi A, et al. Whole-exome sequencing identifies recessive WDR62 mutations in severe brain malformations. Nature. 2010;467(7312):207-210.

Johnson JO, Mandrioli J, Benatar M, et al. konsorcium ITALSGEN. Exomové sekvenování odhaluje mutace VCP jako příčinu familiární ALS. Neuron. 2010;68(5):857-864.

Choi M, Scholl UI, Ji W, et al. Genetic diagnosis by whole exome capture and massively parallel DNA sequencing. Proc Natl Acad Sci U S A. 2009;106(45):19096-19101.

Worthey EA, Mayer AN, Syverson GD, et al. Making a definitive diagnosis: successful clinical application of whole exome sequencing in a child with intractable inflammatory bowel disease. Genet Med. 2011;13(3):255-262.

Montenegro G, Powell E, Huang J, et al. Exome sequencing allows for rapid gene identification in a Charcot-Marie-Tooth family. Ann Neurol. 2011;69(3):464-470.

Bonnefond A, Durand E, Sand O, et al. Molecular diagnosis of neonatal diabetes mellitus using next-generation sequencing of the whole exome. PLoS One. 2010;5(10):e13630.

Johnson JO, Gibbs JR, Van Maldergem L, Houlden H, Singleton AB. Exomové sekvenování u syndromu Brown-Vialetto-van Laere. Am J Hum Genet. 2010;87(4):567-9; odpověď autora 569.

Bras JM, Singleton AB. Exomové sekvenování u Parkinsonovy nemoci. Clin Genet. 2011;80(2):104-109.

Topper S, Ober C, Das S. Exome sequencing and the genetics of intellectual disability. Clin Genet. 2011;80(2):117-126.

Corder EH, Saunders AM, Strittmatter WJ, et al. Gene dose of apolipoprotein E type 4 allele and the risk of Alzheimer’s disease in late onset families. Science. 1993;261(5123):921-923.

Klein RJ, Zeiss C, Chew EY, et al. Complement factor H polymorphism in age-related macular degeneration. Science. 2005;308(5720):385-389.

Tan EK. Identifikace společné genetické rizikové varianty (LRRK2 Gly2385Arg) u Parkinsonovy choroby. Ann Acad Med Singapore. 2006;35(11):840-842.

Libioulle C, Louis E, Hansoul S, et al. Novel Crohn disease locus identified by genome-wide association maps to a gene desert on 5p13.1 and modulates expression of PTGER4. PLoS Genet. 2007;3(4):e58.

Stephens PJ, Greenman CD, Fu B, et al. Massive genomic rearrangement acquired in a single catastrophic event during cancer development. Cell. 2011;144(1):27-40.

Jones S, Zhang X, Parsons DW, et al. Core signaling pathways in human pancreatic cancers revealed by global genomic analyses. Science. 2008;321(5897):1801-1806.

Parsons DW, Jones S, Zhang X, et al. An integrated genomic analysis of human glioblastoma multiforme. Science. 2008;321(5897):1807-1812.

Timmermann B, Kerick M, Roehr C, et al. Somatické mutační profily MSI a MSS kolorektálního karcinomu identifikované pomocí sekvenování celého exomu nové generace a bioinformatické analýzy. PLoS One. 2010;5(12):e15661.

Varela I, Tarpey P, Raine K, et al. Exomové sekvenování identifikuje časté mutace genu SWI/SNF komplexu PBRM1 u karcinomu ledviny. Nature. 2011;469(7331):539-542.

Ku CS, Cooper DN, Roukos DH. Klinický význam sekvenování nádorového genomu. World J Gastroenterol. 2013;19(13):2011–2018.

Kilpivaara O, Aaltonen LA. Diagnostické sekvenování genomu nádorových onemocnění a podíl zárodečných variant. Science. 2013;339(6127):1559-1562.

Hudson TJ, Anderson W, Artez A, et al; International Cancer Genome Consortium. Mezinárodní síť projektů nádorových genomů. Nature. 2010;464(7291):993-998.

Gerlinger M, Rowan AJ, Horswell S, et al. Intratumor heterogenity and branched evolution revealed by multiregion sequencing. N Engl J Med. 2012;366(10):883-892.

Ren SC, Qu M, Sun YH. Zkoumání intratumorózní heterogenity pomocí sekvenování jednotlivých buněk. Asian J Androl. 2013;15(6):729-734.

Hieronymus H, Sawyers CL. Putování genomickou krajinou karcinomu prostaty od diagnózy po smrt. Nat Genet. 2012;44(6):613-614.

McLeod HL. Farmakogenomika nádorových onemocnění: brzký příslib, ale je nutné společné úsilí. Science. 2013;339(6127):1563-1566.

Abaan OD, Polley EC, Davis SR, et al. The exomes of the NCI-60 panel: a genomic resource for cancer biology and systems pharmacology. Cancer Res. 2013;73(14):4372-4382.

Weinstein JN. Objevování léčiv: Buněčné linie bojují s rakovinou. Nature. 2012;483:544-545.

Shahmirzadi L, Chao EC, Palmaer E, Parra MC, Tang S, Gonzalez KD. Rozhodnutí pacientů o zveřejnění sekundárních nálezů u prvních 200 jedinců podstupujících klinické diagnostické sekvenování exomu. Genet Med. Epub October 10, 2013.

Flicek P, Amode MR, Barrell D, et al. 2011 Ensembl. Nucleic Acids Res. 2011;39:D800-D806.

Pruitt KD, Tatusova T, Klimke W, Maglott DR. Referenční sekvence NCBI: současný stav, politika a nové iniciativy. Nucleic Acids Res. 2009;37:D32-D36.

.

Napsat komentář

Vaše e-mailová adresa nebude zveřejněna.