Introducere

Numeroase boli au o bază genetică. Unele sunt consecința unei absențe sau a unei disfuncții a unei anumite proteine din cauza unor mutații în gena codificatoare. Acesta este cazul bolilor cu moștenire mendeliană, cum ar fi boala Huntington, talasemia și aproximativ 1.000 de alte boli rare moștenite.1 Multe boli au o bază genetică, chiar dacă nu se datorează exclusiv mutației unei singure gene, iar un număr din ce în ce mai mare de variante și polimorfisme genetice sunt identificate ca factori de risc pentru boli complexe.2 Cancerul este o boală genetică cauzată de mutația uneia sau mai multor gene care fie cresc riscul de cancer (cum ar fi mutațiile pe linia germinală), fie promovează cancerul (oncogene), fie afectează mecanismele celulare care controlează proliferarea celulară (gene supresoare), așa cum se întâmplă în cazul mutațiilor somatice.3

Identificarea bazei genetice a acestor boli a fost un proiect laborios și dificil, până acum câțiva ani. Aceste proiecte au început adesea cu identificarea unei regiuni a genomului posibil implicată în transmiterea bolii prin studii de asociere genetică.1 Analiza familiilor mari, cu mai mulți membri afectați, este de obicei necesară pentru a defini o regiune a genomului care este foarte legată de transmiterea bolii. În general, această regiune conține mai multe gene care trebuie secvențiate pentru a identifica o mutație genetică prezentă la toți indivizii afectați și nu la rudele lor sănătoase, în cazul unei moșteniri dominante. În cazul transmiterii recesive, mutația trebuie să fie prezentă în ambele alele ale membrilor afectați și în una sau în niciuna dintre alelele rudelor neafectate.

Diagnosticarea bolilor genetice a fost și, în cele mai multe cazuri, este încă la fel de laborioasă. În cel mai bun caz, boala își poate avea originea într-o mutație în doar o singură genă. Diagnosticul ar necesita determinarea secvenței nucleotidice doar a acelei gene. De obicei, gena este amplificată sub forma mai multor fragmente prin reacții de polimerizare în lanț și se determină secvența nucleotidică a fiecăruia. Adesea, boala poate fi cauzată de mutații în oricare dintre mai multe gene, iar toate acestea trebuie amplificate și secvențiate pentru a găsi originea genetică a bolii la pacienții afectați. De exemplu, în diskeratoza congenitală, mutațiile pot fi găsite în oricare dintre genele dkc, tert, terc, NOP10, NH2 sau TINF2, iar numărul de gene afectate poate fi chiar mai mare, deoarece există o fracțiune de pacienți la care mutația cauzală nu a fost identificată.4,5 Secvența nucleotidică a tuturor acestor gene trebuie determinată pentru diagnosticul molecular al fiecărui pacient. Găsim mai multe gene mutante în diferite tipuri de cancere.3 Diagnosticul molecular necesită determinarea secvenței nucleotidice a mai multora dintre aceste gene. În prezent, acesta este un proces laborios și costisitor care nu poate fi utilizat pentru o populație mare de pacienți. În practică, doar câteva gene care sunt mutate într-o proporție importantă de pacienți afectați de anumite tipuri de cancer sunt secvențiate pentru diagnostic și tratament.

Numai în ultimii ani au fost dezvoltate tehnici pentru detectarea simultană a mai multor variante de secvență într-o anumită probă. Multe dintre acestea se bazează pe tehnologia microarray de acid dezoxiribonucleic (ADN). În matricele de genotipare, oligonucleotidele care conțin mutațiile identificate în mod activ legate de o anumită boală sunt punctate pe o lamelă. Un eșantion de ADN al unui pacient este adăugat deasupra lamei, iar oligonucleotidele hibridizante sunt identificate. Milioane de mutații cunoscute pot fi testate în cadrul unei singure hibridări cu microrețele.6 Variațiile numărului de copii pot fi, de asemenea, analizate cu ajutorul microrețelelor de ADN concepute pentru a detecta prezența regiunilor de ADN care sunt duplicate sau șterse în ADN-ul pacientului.7 Aceste tehnici sunt utilizate frecvent în cercetarea medicală și pentru diagnosticul clinic.8

Cu toate acestea, un pas important în medicina moleculară a fost dezvoltarea recentă a tehnologiilor de secvențiere masivă care permit determinarea secvenței nucleotidice a ADN-ului unui pacient într-o perioadă scurtă de timp și la un preț accesibil.9,10 Aceste metodologii sunt utilizate din 2005 și se bazează pe determinarea simultană a secvenței nucleotidice a milioane de fragmente de ADN. Ele au fost denumite secvențiere de a doua generație, secvențiere de generație următoare, secvențiere profundă sau secvențiere masivă paralelă. Mii de milioane de milioane de secvențe de nucleotide sunt determinate în cel mult 2 săptămâni cu ajutorul acestor aparate. Ca un exemplu al capacității acestor noi sisteme de secvențiere, rețineți că secvențierea de etapă a primului genom uman, publicată în 200111 , a necesitat munca coordonată a 23 de laboratoare, care a durat 13 ani, cu un cost total de aproximativ 3 miliarde de dolari SUA. Cu noile metodologii, secvențierea unui genom uman necesită un singur laborator și aproximativ 2 săptămâni, cu un cost aproximativ de 4.000 USD.

Disponibilitatea metodelor moderne de secvențiere produce creșterea exponențială a cunoștințelor noastre despre genomul uman, variabilitatea între indivizi și identificarea variantelor genetice în boli. De exemplu, aceste metodologii stau la baza proiectului 1000 Genomes Project,12 aflat în curs de desfășurare, care vizează determinarea secvenței complete de nucleotide a aproximativ 1.000 de persoane de diferite origini geografice și etnice pentru a determina variația medie a secvenței între indivizi și pentru a identifica cele mai frecvente polimorfisme.

Tehnologiile de secvențiere masivă evoluează în prezent într-un ritm rapid. Sunt dezvoltate mașini mai mici și mai rapide și sunt introduse noi metode de secvențiere. Un obiectiv important, de exemplu, este secvențierea unei singure molecule de ADN dintr-o celulă individuală.13,14 În afară de provocările tehnice, progresele scad constant prețul secvențierii ADN, astfel încât obiectivul de a secvenția un genom uman individual pentru 1.000 USD pare a fi la îndemână în câțiva ani. În prezent, secvențierea unui întreg genom uman și analiza tuturor datelor de secvențiere generate este complexă, costisitoare și consumatoare de timp, iar multe studii sunt efectuate pe o parte mai mică a genomului. În special, în prezent se acordă multă atenție secvențierii regiunii genomului care codifică proteine, cunoscută sub numele de exom. Secvențierea exomului este mult mai accesibilă decât secvențierea întregului genom, iar posibilitățile, avantajele și limitările acestei tehnici vor fi discutate în această analiză.

Ce este un exom?

Chiar toate genele umane codificatoare de proteine au o structură discontinuă. Regiunea codificatoare de proteine este fragmentată în mai multe bucăți, numite exoni. Exonii sunt conectați de fragmente de ADN non-codificatoare de proteine, sau introni, așa cum se arată schematic în figura 1. Genele sunt transcrise din regiunea promotoare sub controlul mai multor regiuni de reglare, care sunt prezente în diferite locații în raport cu gena, în amonte, în aval sau chiar în interiorul genei. Transcripția creează un transcript primar care conține exoni și introni. Procesele ulterioare de splicing al acidului ribonucleic (ARN) elimină intronii și unesc exonii pentru a genera ARN-ul mesager (ARNm) matur care conține o singură regiune continuă codificatoare de proteine. Studii recente arată că transcriptele primare ale majorității genelor pot fi splitate în mai multe moduri, dând naștere la diverse ARNm mature care conțin combinații specifice de exoni, cunoscute ca variante de splicing alternativ (figura 1). Aceste ARNm codifică pentru izoforme proteice care au unele regiuni comune, dar care diferă și de altele, în funcție de exonii încorporați.15

Analiza genomului uman a arătat că genele codificatoare de proteine reprezintă o proporție mică de ADN, doar aproximativ 3%.16 Exonii reprezintă o fracțiune și mai mică, de 1% din genom.16 Un rezumat al acestor date este prezentat în tabelul 1. Genomul uman este compus din 3,3 ×109 perechi de baze (bp) și conține 20.078 de gene codificatoare de proteine.17 Fiecare genă este împărțită într-un număr mediu de opt exoni, fiecare având o lungime de aproximativ 170 bp. Toți exonii în ansamblul lor conțin aproximativ 3 ×107 bp. Cu toate acestea, secvențierea tuturor exonilor oferă aceleași informații despre secvența de aminoacizi a proteinelor codificate ca și secvențierea întregului genom, cu excepția mutațiilor care modifică splicingul ARNm, după cum se va discuta în secțiunea Secvenție de secvențiere a exomului și analiză a datelor. Acest sistem de secvențiere a tuturor exonilor a fost denumit secvențierea exomului și a devenit o metodă validă de detectare a variațiilor în secvența de aminoacizi a tuturor proteinelor umane.18 Diferența de mărime foarte pronunțată face ca secvențierea exomului să fie mult mai ieftină decât secvențierea genomului, ceea ce facilitează analizele computaționale și funcționale ale datelor de secvențiere generate.

Figura 1 Reprezentare schematică a structurii și expresiei genice.
Note: Genele codificatoare de proteine sunt compuse din exoni care conțin informații codificatoare de proteine (casete), separate de introni necodificatori (linii). Casetele gri indică regiunile exonice codificatoare de proteine, iar casetele albe reprezintă regiunile netranslatate 5′ și 3′ ale ARNm. Genele sunt transcrise din regiunile promotoare, imediat în amonte de exonul 1. Locul de începere a transcrierii este indicat de o săgeată. Expresia genelor este controlată de un număr de regiuni TR care pot fi situate în amonte sau în aval de genă, la distanțe variabile sau în interiorul genei (cel mai frecvent în introni). Stabilitatea și traducerea ARNm pot fi reglementate prin legarea microARN la situsuri specifice din regiunea netranslatată 3′ (indicate prin asteriscuri). Genele sunt transcrise în ARN-uri primare care conțin introni și exoni. Procesele ulterioare de splicing elimină intronii pentru a genera ARNm maturi. Procesele de splicing alternativ pot da naștere la ARNm diferiți, în funcție de exonii pe care îi conțin (ARNm1, ARNm2), care codifică pentru diferite izoforme proteice.
Abbreviații: TR, regiune de reglare a transcripției; ARN, acid ribonucleic; ARNm, acid ribonucleic mesager.

Tabelul 1 Caracteristici generale ale genomului și exomului uman

Tehnici de captare a exomului

Prima și cea mai critică etapă în secvențierea exomului este izolarea sau captarea exonilor. Metodele utilizate se bazează pe hibridizarea ADN. Analiza genomului uman a făcut posibilă identificarea tuturor exonilor genelor și facilitează proiectarea de sonde oligonucleotidice specifice fiecăruia dintre ei. Sondele sunt utilizate pentru purificarea exonilor din ADN.19 Fragmentarea ADN-ului în bucăți nu mai mari de 500 bp este primul pas. ADN-ul este apoi hibridizat cu sondele oligonucleotide specifice exonilor, iar fragmentele hibridizate sunt purificate. Hibridizarea poate fi efectuată în fază lichidă. În acest caz, oligonucleotidele sunt marcate astfel încât complexele ADN-oligonucleotide să poată fi separate de grosul de ADN nehibridizat. Într-un exemplu obișnuit, oligonucleotidele sunt legate covalent de biotină, astfel încât hibrizii ADN-oligonucleotide pot fi izolați cu ajutorul moleculei de legare a biotinei, streptavidina, cuplată la margele magnetice. Fragmentele de ADN care nu conțin exoni nu se vor lega de bilele de streptavidină și pot fi îndepărtate eficient după mai multe etape de spălare. Fragmentele care conțin exoni, legate de microsfere, pot fi recuperate după disocierea hibrizilor ADN-oligonucleotide în condiții de forță ionică scăzută.

Exonii pot fi, de asemenea, izolați prin hibridizare pe un suport solid pe care au fost marcate oligonucleotidele specifice exonilor, ca în cazul microplăcilor de ADN. În acest caz, ADN-ul fragmentat este împrăștiat peste oligonucleotide pentru a permite hibridizarea. Ulterior, ADN-ul nehibridizat este spălat, iar ADN-ul îmbogățit cu exoni este eluat în condiții ionice scăzute.

Diferiți furnizori comerciali oferă kituri pentru izolarea exomului folosind protocoale de hibridizare în fază lichidă, inclusiv Agilent Technologies (Santa Clara, CA, SUA), Roche NimbelGen, Inc. (Madison, WI, SUA), Illumina, Inc. (San Diego, CA, SUA), și Life Technologies (Carlsbad, CA, SUA). Aceste kituri permit izolarea a peste 90 % din exonii prezenți în genom, cu o specificitate de peste 90 %, la un preț aproximativ de 150 USD per exom. Mai mulți autori au comparat aceste platforme de captare a exomului20-22 , iar datele obținute de Clark et al22 care compară SureSelect Human All Exon 50 Mb (Agilent Technologies), SeqCap EZ Exome Library v2.0 de la Roche NimbleGen, Inc. și kiturile TruSeq Exome Enrichment de la Illumina, Inc. sunt rezumate în tabelul 2. Unele dintre kituri acoperă regiunile netranslate ale ARNm, în plus față de regiunile care codifică proteinele, ceea ce permite analiza regiunilor de reglementare, cum ar fi site-urile de legare a microARN (miARN). Includerea regiunilor netranslatate 5′ permite, de asemenea, analiza regiunilor promotoare proximale.22 În plus, majoritatea kiturilor acoperă până la 80 % din regiunile codificatoare de miARN.21 Recent, au fost dezvoltate kituri îmbunătățite de către acești și alți furnizori, astfel încât datele prezentate în tabelul 2 ar trebui să fie considerate doar o indicație. Este important de reținut că purificarea exonilor este o etapă critică. Recuperarea a 100 % din exoni este dificilă, iar exonii sunt frecvent pierduți sau subreprezentați în exomul izolat. De exemplu, dacă se analizează exomul unui pacient și se pierd 10 % din exoni în timpul purificării, probabilitatea de a rata o mutație relevantă va fi de aproximativ 10 % din cauza acestei erori tehnice. Prin urmare, utilizarea unor proceduri foarte eficiente de captare a exonilor este de o importanță critică în secvențierea exomului.

Tabelul 2 Compararea a trei platforme majore de captare a exomului
Note: aCompararea bazelor de date Ensemble81 și, respectiv, RefSeq82; bpercentajul regiunilor selectate secvențiate de fiecare platformă de cel puțin zece ori după analizele a 80 de mega citiri ale secvenței de ADN. Agilent Technologies (Santa Clara, CA, SUA); Roche NimbelGen, Inc. (Madison, WI, SUA); Illumina, Inc. (San Diego, CA, SUA).
Abbreviații: ARNm, acid ribonucleic mesager; miARN, acid micro ribonucleic; ADN, acid dezoxiribonucleic.

Secvențierea exomului și analiza datelor

Fragmentele care conțin exoni sunt secvențiate utilizând oricare dintre sistemele sau tehnologiile de echipamente de secvențiere masivă disponibile în prezent. După cum s-a menționat în introducere, aceste platforme determină simultan secvența nucleotidică a milioane de fragmente de ADN. Lungimea determinată a secvenței fiecărui fragment în secvențierea exomului nu este mare, de obicei între 35 pb și 100 pb. Cu toate acestea, deoarece ADN-ul a fost fragmentat inițial în mod aleatoriu, fiecare nucleotidă individuală va fi prezentă în multe fragmente care se suprapun. Prin urmare, dacă se obține un număr suficient de mare de secvențe, chiar dacă sunt scurte, fiecare bază va fi secvențiată independent în mai multe fragmente de ADN. Numărul de ori de câte ori este secvențiată fiecare bază se numește acoperire sau adâncime de secvențiere. Acoperirea este direct legată de calitatea și încrederea secvenței de nucleotide generate. În general, o acoperire de 20×-30× este considerată necesară pentru a obține rezultate fiabile în secvențierea exomului.59 Această adâncime de secvențiere înseamnă că o posibilă variație de secvență ar fi fost secvențiată independent în 20-30 de fragmente de ADN diferite.

Analiza datelor este ultima etapă în proiectele de secvențiere a exomului (figura 2). După cum s-a menționat mai sus, sunt generate date din milioane de secvențe, iar analizele acestora necesită programe informatice specifice și complexe și expertiză.19,23 O etapă preliminară este o analiză a calității secvenței generate. Se testează acuratețea citirii secvențelor la diferite lungimi de secvență, lungimea medie a citirilor, precum și alți parametri. În cazul în care calitatea este suficient de bună, fiecare secvență este comparată cu o secvență de referință, care este, de obicei, ultima versiune disponibilă a secvenței genomului uman. În mod obișnuit, peste 80 % din secvențele generate pot fi aliniate cu genomul de referință.22 Această etapă permite un grad mic de variație a nucleotidelor în raport cu genomul de referință. Următoarea etapă a analizei constă în identificarea variațiilor de secvență între secvența de referință și secvența exomului obținută în studiul nostru. Analizele ulterioare ale acestor variante ar putea furniza informațiile dorite cu privire la problema medicală studiată.

Figura 2 Analiza datelor de secvențiere a exomului.
Note: Etapele necesare pentru izolarea exomului, secvențierea și analiza datelor sunt reprezentate schematic. Acest proces conduce la identificarea variantelor de gene implicate în originea bolilor (gene driver) sau legate în alt mod de susceptibilitatea la boală, evoluția sau răspunsul farmaceutic. Aceste date oferă informații valoroase pentru diagnostic și prognostic, pentru consiliere genetică și pentru conceperea de tratamente personalizate.
Abbreviație: „genetică”: ADN, acid dezoxiribonucleic.

Secvențierea exomului poate detecta mai multe tipuri de variații genetice. Una dintre cele mai frecvent întâlnite diferențe este schimbarea unei nucleotide în alta, de exemplu, A în loc de G (codon ATA în codon ATG). Aceste variații se numesc variante de un singur nucleotid (SNV), deși sunt considerate polimorfisme de un singur nucleotid (SNP) atunci când frecvența lor în populație este mai mare de 1%-5% și nu există un efect puternic asupra riscului de apariție a vreunei boli. Majoritatea SNV-urilor sunt silențioase sau, de asemenea, cunoscute ca sinonime, deoarece ambele variante de secvență codifică același aminoacid (de exemplu, o variație de la GCA la GCC, deoarece ambele sunt codoni de alanină). Cele mai multe dintre aceste polimorfisme nu reprezintă nicio diferență pentru proteina codificată, nu sunt supuse selecției evolutive și reprezintă cele mai frecvent întâlnite variații în exomul uman. Excepție fac unele mutații silențioase care afectează semnalele de reglare a splicingului sau chiar situsurile de reglare a transcripției, modificând splicingul sau expresia ARNm, chiar dacă nu modifică aminoacizii codificați. În alte cazuri, variația de nucleotide are o consecință în proteina codificată, iar acestea sunt variante nesilențioase sau nonsinonime. Aceste modificări pot avea ca rezultat variații ale aminoacidului codificat (de exemplu, GAT în GAG schimbă acidul aspartic în acid glutamic) și se numesc mutații missense. Modificări mai drastice sunt produse atunci când variația de nucleotide creează un codon de oprire a traducerii (de exemplu, TGC în TGA schimbă un codon de cisteină într-un codon de oprire), ceea ce se numește mutație fără sens. Există, de asemenea, un tip de SNV care poate fi detectat prin secvențierea exomului chiar dacă nu afectează codonii proteici. Deoarece exonii sunt selectați în urma fragmentării aleatorii a ADN-ului, aceștia pot conține, de asemenea, regiuni contigue de ADN, inclusiv secvențe de introni vecine și chiar promotori de gene dacă au fost capturate regiuni netranslatate.24 Regiunile de introni conțin semnalele de reglementare necesare pentru splicarea ARNm. SNV-urile din aceste regiuni pot modifica splicingul în diferite moduri.15 De exemplu, intronul afectat ar putea fi reținut în ARNm matur sau exonul contiguu ar putea fi eliminat prin splicing (exon skipping). Aceste modificări schimbă secvența nucleotidică a ARNm matur și, prin urmare, proteina codificată în aval de SNV.25 Secvențierea exomului poate detecta, de asemenea, variații de secvență datorate unor mici inserții sau deleții (indels).22 Aceste variații pot duce la o schimbare de cadru, cu excepția cazului în care afectează trei nucleotide sau un multiplu de trei nucleotide. În acest caz, s-ar produce mici deleții sau inserții de aminoacizi.

Identificarea mutațiilor cauzale

Relevanța funcțională a variantelor de secvență detectate trebuie să fie determinată în următoarea etapă de analiză a datelor. Chiar dacă toți oamenii sunt aproape identici din punct de vedere genetic, numărul de diferențe de secvențe de nucleotide între indivizi este considerabil.26 Această eterogenitate complică interpretarea datelor obținute în cadrul proiectelor individuale de secvențiere. Unele date generale privind variațiile de secvență individuale sunt prezentate în tabelul 3. Atunci când se ia în considerare întregul genom, numărul de diferențe de secvență între indivizi a fost estimat la 4 × 106, conform datelor obținute în cadrul proiectului 1000 Genomes Project și al unor proiecte mai mici de secvențiere a întregului genom.27 Exomii prezintă un număr mai mic, dar totuși considerabil, de variații de secvență, care se ridică la aproximativ 20 000-25 000 între doi indivizi neînrudiți.27,28 Majoritatea acestor variații genetice sunt silențioase, după cum s-a discutat anterior. Numărul de diferențe de secvență nesilențioase între indivizi a fost estimat la 10.000. Cele mai multe dintre aceste variante există în populația generală și sunt transmise de generații întregi. S-a estimat că mai puțin de o SNV nesilențioasă apare de novo la fiecare individ.29

Datele obținute în cadrul proiectelor de secvențiere a exomului sunt frecvent filtrate pentru a identifica toate SNP-urile care sunt prezente la alți indivizi și care, prin urmare, nu au legătură cu boala studiată.2,19,23 Acest proces poate fi realizat prin comparare cu bazele de date publice în care sunt compilate SNP-urile care se găsesc în proiectele de secvențiere. Un avertisment care trebuie luat în considerare este că toate bazele de date mari conțin un număr de mutații dovedite care cauzează boli relativ frecvente. După această etapă de filtrare rămân aproximativ 400-700 de SNV-uri noi și posibil relevante (tabelul 3).28 Următoarea provocare este de a determina care dintre SNV-urile care nu sunt prezente în populația globală, dacă există, se află la originea bolii studiate. Multe dintre diferențele observate nu vor fi asociate cu nicio incidență a bolii, iar acestea sunt cunoscute sub numele de modificări de pasageri.23 În schimb, una sau câteva modificări ar putea avea un rol cauzal și acestea sunt numite modificări motoare. Abordarea utilizată pentru a identifica aceste schimbări motoare va depinde de circumstanțele particulare ale studiului. În cazul bolilor cu un model de moștenire mendeliană, este de obicei necesar să se analizeze un număr de indivizi afectați și neafectați pentru a găsi variațiile genetice care segregă perfect cu boala. Această comparație este mai informativă în cazul familiilor mari cu pedigree-uri bine caracterizate. În absența unor familii afectate suficient de mari, compararea unui număr de pacienți și martori neînrudiți permite, de asemenea, identificarea genelor motoare. Criterii suplimentare sunt utilizate pentru a selecta posibilele SNV-uri legate de boală, inclusiv algoritmi in silico, care prezic posibila importanță a aminoacidului mutat pe baza conservării evolutive și a impactului prezis asupra structurii și funcției proteinei. Funcția prezisă a proteinei mutate și tiparul de expresie specific țesutului acesteia sunt, de asemenea, criterii utilizate în selectarea mutațiilor cauzale putative.

Tabelul 3 Rezumat al variației secvenței între indivizi

Într-o secțiune ulterioară vor fi oferite câteva exemple ale acestor tipuri de studii. Cu toate acestea, pe măsură ce se efectuează mai multe studii, se identifică tot mai multe variații genetice ca fiind cauza unor boli ereditare, ceea ce face probabil ca unele dintre genele mutante la pacient să fi fost deja descrise. Aceste gene mutante pot fi găsite în literatura de specialitate și în baze de date specializate, cum ar fi baza de date Online Mendelian Inheritance in Man (http://www.omim.org). Posibila relevanță a mutațiilor găsite în diverse gene poate fi, de asemenea, căutată în pagina Genome Ensemble (http://www.ensembl.org/) dacă acestea au fost descrise anterior.

Cancerul este probabil cel mai răspândit grup de boli cu o bază genetică. Multe studii au fost direcționate pentru a determina genele driver pentru diferite tipuri de cancer.30 Grupul emergent de gene driver pentru cancer poate fi consultat în baze de date precum Catalogue of Somatic Mutations In Cancer (COSMIC; http://cancer.sanger.ac.uk) sau The Cancer Genome Atlas (http://cancergenome.nih.gov/). Câteva exemple mai detaliate vor fi prezentate în secțiunea Exemple de utilizare clinică a secvențierii exomului.

Compararea secvențierii exomului cu alte abordări de secvențiere masivă

Secvențierea genomului

După cum s-a menționat în introducere, secvențierea întregului genom uman devine din ce în ce mai accesibilă. În comparație cu secvențierea exomului, secvențierea genomului integral este o alternativă mult mai complexă. Numărul de reacții de secvențiere care trebuie efectuate este mult mai mare, la fel ca și numărul de date privind secvențele de nucleotide generate. Analiza computațională este mult mai mare. În plus, se găsesc mult mai multe variante genetice, după cum se arată în tabelul 3, ceea ce face ca identificarea genelor pilot să fie mai dificilă. Cu toate acestea, secvențierea genomului oferă o viziune completă a modificărilor genetice prezente la pacient, inclusiv a marilor reorganizări ale genomului. Cu toate acestea, secvențierea cu citire scurtă a unui genom la o adâncime moderată va rata variațiile structurale, în special în regiunile cu complexitate redusă. Aceste informații sunt rezumate în tabelul 4, care compară secvențierea exomului cu alte abordări de secvențiere.

După cum s-a menționat anterior, genele care codifică proteine reprezintă doar 3% din genom.16 Până de curând, restul genomului era considerat a fi „ADN în vrac”, fără prea multă valoare informațională. Cu toate acestea, studii recente au schimbat complet acest punct de vedere. Un proiect de amploare la nivelul întregului genom studiază funcția tuturor regiunilor genomului, proiectul ENCODE (Encyclopedia of DNA Elements).31 Rezultatele disponibile în prezent arată că peste 70% din genom este transcris. Multe dintre transcriptele generate nu codifică pentru proteine, dar par să aibă un rol de reglementare a expresiei genice. Printre acestea se numără miARN-urile deja cunoscute, care reglează stabilitatea și traducerea ARNm (figura 1), dar și peste 20 000 de ARN-uri lungi necodante care reglează transcripția. În plus, au fost identificate multe regiuni de ADN care reglează expresia genelor, inclusiv multe regiuni de reglementare a promotorilor și a transcripției necunoscute anterior (figura 1). Aceste informații au relevanță clinică, deoarece mutațiile din regiunile de reglementare pot afecta expresia unor gene specifice și pot avea rezultate patologice. De fapt, o mare parte din studiile de asociere la nivel de genom au pus în relație regiuni ADN, în care nu au fost găsite mutații de codificare a proteinelor, cu afecțiuni patologice.32 Datele generate în cadrul proiectului ENCODE au permis revizuirea unor cazuri, în care s-a constatat că mutațiile din regiunile de reglare a expresiei genice sunt responsabile de boală.31,32 De asemenea, într-un exemplu recent, Weedon et al33 au raportat că mutațiile dintr-o regiune de reglare a transcripției din gena PTF1A cauzează agenezia pancreasului izolat. Mutațiile din regiunile reglatoare nu pot fi detectate prin secvențierea exomului, deoarece acestea nu afectează proteina codificată, ci expresia acesteia. Prin urmare, secvențierea genomului întreg oferă mai multe informații decât secvențierea exomului în detrimentul unei complexități crescute și a unui cost economic.

Tabelul 4 Compararea tehnicilor de secvențiere masivă
Abbreviații: ARN, acid ribonucleic; ADN, acid dezoxiribonucleic.

Secvențierea ARN

Tehnicile de secvențiere a ARN constau în conversia populațiilor de ARN în ADN complementar (ADNc) prin transcriere inversă și secvențierea lor ulterioară.34,35 În cazul secvențierii ARNm, populația completă de ARNm exprimată într-o linie celulară sau într-o probă de țesut (cunoscută sub numele de transcriptom) este convertită în ADNc și secvențiată. Procesul de secvențiere a ARNm oferă informații despre secvența de nucleotide a genelor care sunt transcrise în proba analizată și, prin urmare, despre secvența de aminoacizi a proteinelor corespunzătoare. În plus, numărul de secvențe generate pentru fiecare ARNm poate fi estimat și este proporțional cu abundența acestuia. Prin urmare, nivelurile de expresie a genelor pot fi determinate și comparate cu cele ale altor probe, inclusiv cu eventualele probe de control (tabelul 4). Un alt avantaj specific al secvențierii ARNm este că permite studierea evenimentelor de splicing alternativ.36,37 După cum s-a menționat anterior, transcriptele primare sunt adesea procesate în mai multe moduri pentru a da naștere la ARNm care conțin exoni diferiți (figura 1). Aceste ARNm pot fi identificate prin secvențierea ARNm și nu prin secvențierea exomului sau a genomului, care determină secvențierea ADN-ului care este transcris și nu cea a transcrisului matur. În rest, secvențierea ARNm și a exomului oferă informații similare cu privire la regiunea genomului care codifică proteine. Diferența constă în faptul că secvențierea exomului include toate genele, iar secvențierea ARNm se limitează la genele exprimate în proba analizată. De exemplu, un studiu recent de secvențiere a ARNm al liniilor celulare limfoblastoide de la 462 de persoane a determinat secvența codificatoare a aproximativ 13.000 de gene din cele 20.078 de gene umane.38 În acest exemplu, aproximativ 7.000 de gene nu au fost studiate, deoarece nu erau exprimate în liniile celulare limfoblastoide. Cu toate acestea, în acele cazuri în care tipul de celule sau țesutul afectat de o anumită boală este bine cunoscut, secvențierea ARNm ar fi echivalentă cu secvențierea exomului pentru studierea mutațiilor driver. O altă caracteristică a secvențierii ARNm este că permite detectarea variațiilor de secvență produse de editarea ARN.39 Un număr de ARNm sunt procesate astfel încât unele nucleotide sunt modificate, iar modificările de la adenozină la inozină sunt cele mai frecvent produse. Aceste modificări sunt detectate prin secvențierea ARNm, dar nu se poate stabili dacă acestea sunt produse de editarea ARN sau ca o consecință a variațiilor genomice decât dacă se compară atât secvențele ARNm, cât și cele genomice.

Determinarea nivelurilor de expresie a ARNm poate fi foarte convenabilă în anumite cazuri, deoarece unele boli pot fi cauzate de expresia dereglementată a uneia sau mai multor gene. Modificările nivelurilor de expresie pot fi foarte informative cu privire la originea genetică a bolii. De exemplu, modificările în expresia uneia sau mai multor gene la un pacient ar putea indica o disfuncție a mecanismelor care le reglează expresia. Această disfuncție s-ar putea datora unor mutații în regiunile de reglementare a transcripției genice, așa cum s-a discutat în secțiunea privind secvențierea genomului. S-ar putea datora, de asemenea, unor modificări ale expresiei sau structurii factorilor de reglare a transcripției.40 Modificările expresiei genice se datorează frecvent unor modificări ale mecanismelor epigenetice de reglare a expresiei genice, cum ar fi metilarea ADN-ului, care nu pot fi detectate prin secvențierea genomului sau a exomului.41 Recent, au fost dezvoltate metode de studiu al metilării întregului genom care permit studiul detaliat al acestor informații epigenetice.42 Cancerul este una dintre bolile asupra cărora s-au efectuat mai multe studii privind nivelul expresiei genice. Într-un număr din ce în ce mai mare de cazuri, modificările în expresia genelor sau a unui grup de gene sunt legate de diagnosticul cancerului, de prognostic sau de predicția răspunsului la medicamentele anticancerigene.43 Aceste modificări ale expresiei genelor sunt utilizate ca biomarkeri. Multe dintre aceste studii sunt disponibile prin intermediul bazei de date Cancer Genome Anatomy Project (http://cgap.nci.nih.gov).

Un tip specific de proiect de secvențiere a ARN-ului vizează determinarea secvenței de nucleotide și a nivelurilor de expresie a ARN-urilor mici de reglare (miARN-uri). ARN-urile mici reglează expresia altor gene prin determinarea stabilității și/sau traducerii ARNm-urilor lor (figura 1). Prin urmare, modificările modelelor de exprimare a miARN-urilor pot avea un impact semnificativ asupra profilului de exprimare a proteinelor din celule și țesuturi. Au fost elaborate protocoale pentru purificarea și secvențierea populației complete de miARN-uri dintr-o anumită probă și pentru a determina nivelurile de expresie ale acestora.44 Majoritatea platformelor de captare a exonilor includ, de asemenea, până la 80% din regiunile cunoscute de codificare a miARN-urilor.21

Secvențierea unor seturi selectate de gene

Câteva boli au fost deja studiate atât de detaliat încât majoritatea genelor implicate sunt cunoscute. Acesta poate fi cazul bolilor cu un model mendelian de moștenire, în care toate cazurile studiate se datorează unor mutații în oricare dintre un număr de gene cunoscute. Alte exemple sunt unele tipuri de cancer care se datorează predominant unor mutații într-un număr redus de gene. În astfel de cazuri, abordarea mai directă pentru caracterizarea eșantionului unui pacient ar fi determinarea secvenței genelor identificate anterior ca fiind responsabile de boală. Abordarea clasică ar fi amplificarea tuturor exonilor acestor gene și determinarea secvenței nucleotidice a fiecăruia. Abordarea alternativă de secvențiere masivă ar fi purificarea tuturor regiunilor genomice presupuse implicate și determinarea simultană a secvenței lor nucleotidice într-o singură serie.45-47 Două metode sunt în general utilizate pentru purificarea regiunilor ADN candidate. Prima este amplificarea acestora prin reacții de polimerizare în lanț folosind un set de oligonucleotide specifice ca primeri. A doua metodă constă în fragmentarea ADN-ului probei și purificarea fragmentelor relevante prin hibridizare cu oligonucleotide specifice, fie în soluție, fie fixate pe un suport solid, așa cum a fost descris anterior pentru purificarea exonilor.48 Regiunile selectate pot conține exoni codificatori de proteine, dar și alte regiuni de ADN, cum ar fi regiunile de reglare a transcripției. Aceste regiuni corespund, de obicei, la câteva sute de gene și, prin urmare, analiza datelor de secvențiere generate este mult mai ușoară decât în alte abordări de secvențiere masivă. Principala limitare este că aceasta este o abordare bazată pe ipoteze care nu permite detectarea mutațiilor în gene care nu au fost legate anterior de boala studiată (tabelul 4).

Exemple de utilizare clinică a secvențierii exomului

Cea mai frecventă utilizare a secvențierii exomului este, probabil, pentru diagnosticarea bolilor monogenice. Au fost descrise peste 3.000 de afecțiuni monogenice, deși cauzele genetice moleculare ale majorității dintre ele sunt încă necunoscute.1 Secvențierea exomului poate fi utilizată pentru a identifica aceste mutații, așa cum au discutat Kuhlenbäumer et al1 într-o recenzie recentă. În unele dintre primele studii, secvențierea exomului a fost utilizată pentru a identifica mutațiile genetice responsabile de boli cunoscute, cum ar fi sindroamele de retard mintal Kabuki,49 Schinzel-Giedion,50 Joubert,51 și hiperfosfataza,52 malformații cerebrale severe,53 sau scleroza laterală amiotrofică cunoscută.54 Secvențierea exomului a fost utilizată, de asemenea, pentru a descoperi noi mutații prezente într-un caz sporadic de retard mintal.29 În plus, această tehnică a fost utilizată pentru diagnosticarea, de exemplu, a diareei congenitale cu clorură,55 a bolii inflamatorii intestinale,56 a bolii Charcot-Marie-Tooth,57 a diabetului zaharat neonatal,58 sau a sindromului Brown-Vialetto-van Laere.59 Studiul raportat de Worthey et al56 reprezintă un exemplu relevant de aplicare clinică a secvențierii exomului. Un copil de sex masculin s-a prezentat cu o afecțiune asemănătoare bolii Crohn fără un diagnostic definitiv, în ciuda unei evaluări clinice cuprinzătoare. Autorii au decis să utilizeze o abordare de secvențiere a exomului pentru a identifica mutația (mutațiile) cauzală (cauzale). Analiza datelor de secvență a detectat 16.124 de variante la pacient. Filtrarea datelor, luând în considerare variantele noi prezente în homozigozitate, hemizigozitate sau heterozigozitate compusă și afectând reziduuri de aminoacizi foarte conservate, prezise a fi dăunătoare pentru funcția proteică, le-a permis autorilor să selecteze o mutație în gena X-linked inhibitor of apoptosis (XIAP). Studiile funcționale au demonstrat relevanța acestei mutații în răspunsul proinflamator observat la pacient. Pe baza identificării acestei mutații, a fost efectuat un transplant alogen de celule progenitoare hematopoietice. Prin urmare, secvențierea exomului a permis identificarea unei mutații necaracterizate pentru a face un diagnostic molecular pentru un pacient individual, în cadrul unei boli noi, care a dus la un plan de management. Utilizarea secvențierea exomului în descoperirea de noi mutații cauzatoare și în diagnosticare a fost recent analizată.60,61

Studiul bolilor comune și complexe a fost, de asemenea, abordat prin secvențierea exomului. Studiile de asociere la nivelul întregului genom au arătat că unele variante genetice conferă risc pentru o serie de boli. Exemple bine caracterizate sunt apolipoproteina E în boala Alzheimer, factorul H al complementului în degenerescența maculară sau glucocerebrosidază/leucină bogată în repetări ale kinazei 2 în boala Parkinson.62-64 S-a discutat despre posibila utilizare a secvențierii exomului pentru studiul bolilor complexe.2,28 O limitare a utilizării secvențierii exomului în aceste studii este că majoritatea variantelor asociate fenotipului se află la distanță de regiunile codificatoare de proteine, ceea ce ar face ca secvențierea întregului genom să fie o abordare mai bună.32 Unele dintre aceste variante genetice pot afecta funcționalitatea regiunilor de reglementare a transcripției care controlează expresia genelor. Proiectul ENCODE31,65 a efectuat o analiză la nivelul întregului genom a acestor regiuni de reglare și s-a constatat că mai multe variante genetice din anumite regiuni ale cromozomului 5 (de exemplu) sunt situsuri de legare pentru factorul de transcripție, GATA2, care sunt puternic asociate cu boala Crohn și alte boli inflamatorii.

Cancerul este o boală cauzată de acumularea de modificări genomice care duc la alterarea mai multor procese biologice.19 Spre deosebire de alterările genetice monogenice discutate anterior, majoritatea mutațiilor driver ale cancerului nu sunt prezente în țesutul normal al pacientului; o mare parte din aceste mutații rezidă în regiunile codificatoare de proteine și pot fi detectate prin secvențierea exomului.19 Cu toate acestea, un alt grup important de modificări genetice sunt reorganizările genomice de mari dimensiuni, cum ar fi delețiile, inversiunile sau translocațiile, care nu pot fi detectate prin secvențierea exomului.66 În ciuda acestei limitări, secvențierea exomului a fost aplicată la descoperirea genelor driver ale cancerului folosind două strategii generale: compararea exomului tumorilor cu cel al țesuturilor sănătoase de la același pacient; sau compararea exomului unui număr de pacienți neînrudiți cu cel al unui număr similar de controale sănătoase.67-70 În prezent, sunt în curs de desfășurare studii ample care implică secvențierea exomului sau a genomului unei cohorte mari de pacienți cu cancer și de martori pentru a identifica toate genele driver ale cancerului.19,71,72 Proiectul 5.000 de genomuri ale cancerului este un exemplu,73 deoarece își propune să secvențieze genomul a 50 dintre cele mai frecvente tipuri de cancer. Datele disponibile au oferit deja un peisaj genomic general al celor mai frecvente tipuri de cancer, așa cum a fost analizat de Vogelstein et al.3 Au fost identificate aproximativ 140 de gene care favorizează tumorigeneza atunci când sunt alterate, iar acest lucru se regăsește în baza de date COSMIC menționată anterior.3 Detectarea mutației uneia dintre aceste gene în exomul unei probe de cancer poate fi un pas important pentru diagnosticarea și tratamentul adecvat al pacientului. Datele actuale oferă, de asemenea, o idee despre complexitatea genomului cancerului.3 Tumorile solide obișnuite prezintă un număr mediu de 33 până la 66 de mutații somatice nesilențioase.3 Acest număr crește la peste 200 în cazul tumorilor induse de agenți mutageni, cum ar fi cancerul pulmonar și melanomul, și chiar la peste 1.000 în cazul tumorilor cu deficiențe în mecanismele de reparare a ADN-ului sau în ADN polimeraza E.3 În schimb, tumorile lichide și pediatrice prezintă mai puțin de zece mutații somatice.3 O caracteristică importantă a tumorilor este că acestea evoluează rapid și devin eterogene, astfel încât pot fi găsite mutații diferite în eșantioane de la același pacient recoltate în regiuni diferite sau în perioade de timp diferite de-a lungul tratamentului, așa cum s-a demonstrat recent prin secvențierea exomului.74,75 În ciuda acestei complexități, apar unele concepte unificatoare, iar majoritatea genelor driver cunoscute ale cancerului participă la una sau mai multe dintre cele 12 căi care reglează supraviețuirea celulară, destinul celular și menținerea genomului.3,19 În acest scenariu, secvențierea exomului începe să fie utilizată pentru diagnosticarea cancerului prin identificarea mutațiilor driver, de exemplu, în cancerul de prostată.76

Secvențierea exomului poate fi utilă și pentru tratamentul cancerului. Prezența unor mutații genetice poate conferi sensibilitate sau rezistență la un anumit medicament, ceea ce a fost denumit farmacogenomică. De exemplu, utilizarea inhibitorilor proteinei tirozin kinazei în cancerele care supraexprimă proteinele Abelson murine leukemia viral oncogene homolog 1 (ABL) sau receptorul factorului de creștere epidermică (EGFR) este cunoscută de mai mulți ani. Cu toate acestea, abordările de secvențiere a exomului și a genomului dezvăluie mult mai multe răspunsuri ale mutațiilor la asociațiile de tratament (după cum se subliniază într-o analiză77). Un exemplu informativ este publicarea recentă a exomului panelului de celule NCI-60.78 Acest panel conține 60 de linii celulare bine caracterizate din nouă tipuri de cancer și a fost utilizat într-o gamă largă de studii biologice și farmacologice.79 Secvența nucleotidică a exomului acestor celule a fost determinată pentru a se stabili genele driver de cancer care au suferit mutații în fiecare dintre ele. Pe lângă faptul că au furnizat o listă de gene driver de cancer noi și presupuse, autorii au studiat posibila corelație dintre genotipul fiecărei linii celulare și răspunsul determinat anterior la un număr mare de agenți anticancerigeni. A fost găsită o corelație între mutațiile genetice specifice și răspunsul la mai multe medicamente, dezvăluind posibila importanță a secvențierii exomului în selectarea unui tratament personalizat. Secvențierea exomului poate fi utilizată, de asemenea, pentru a prezice predispoziția la cancer. Câteva exemple pot fi găsite într-o recenzie recentă centrată pe cancerul colorectal și care utilizează secvențierea genomului întreg.72

Provocări medicale ale secvențierii exomului

Secvențierea exomului promite îmbunătățiri semnificative în diagnosticarea pacienților, în prognosticul și în tratamentele personalizate. Cu toate acestea, aplicarea pe scară largă a acestei tehnologii necesită încă o serie de îmbunătățiri, precum și definirea unor considerente etice și medicale importante, așa cum s-a discutat în recenziile recente.23,27,60,61,71,77 Provocările tehnice includ dezvoltarea unor tehnici mai eficiente de captare, secvențiere și aliniere a exonilor pentru a obține o reprezentare completă și uniformă a tuturor exonilor din secvență. De asemenea, sunt necesare îmbunătățiri ale instrumentelor software de analiză a datelor pentru detectarea rapidă și precisă a variantelor patologice. Secvențierea extensivă a exomului va necesita implementarea de echipamente specializate și angajarea unor echipe de specialiști cu expertiză adecvată pentru a genera secvențele și pentru a analiza și interpreta datele obținute.

Utilizarea secvențierii exomului pentru diagnosticare va necesita, de asemenea, implementarea unor ghiduri și reglementări tehnice. Parametrii, cum ar fi adâncimea de secvențiere, acoperirea exonilor, parametrii de calitate pentru datele de secvență nucleotidă sau apelarea alinierii vor trebui să fie normalizați. De asemenea, va trebui reglementată și stocarea datelor.

Există, de asemenea, o serie de probleme etice complexe. O problemă importantă este legată de informațiile care ar trebui furnizate pacientului. Secvențierea exomului ar putea detecta variații genetice care nu au legătură cu boala în curs de diagnosticare. Pacientul ar putea prezenta variante genetice care reprezintă factori de risc sau ar putea fi cauzale pentru alte boli. Ce informații ar trebui să fie returnate pacientului? Care ar fi dovezile necesare pentru a considera o variantă genetică legată de o boală? Proprietatea, accesul și stocarea datelor sunt alte aspecte relevante. Ar trebui ca datele generate să fie păstrate pentru o eventuală utilizare viitoare în timpul vieții pacientului? Aceste și alte considerente etice vor stârni probabil controverse considerabile80 și vor necesita discuții ample pentru a se ajunge la un acord asupra criteriilor care vor fi utilizate în practica clinică.

Concluzie

Secvențierea exomului este deja un instrument puternic utilizat pentru a determina bazele moleculare ale bolilor genetice. Profunzimea analizei genetice este mai mică decât cea a secvențierii întregului genom, deoarece nu sunt detectate variațiile genetice din regiunile non-codificatoare de proteine. Cu toate acestea, numărul redus de secvențe și de analize de secvențe necesare pentru secvențierea exomului face ca aceasta să fie o abordare mai accesibilă în practica clinică. Prin urmare, secvențierea exomului va fi, probabil, tehnica de alegere pentru analiza inițială a pacienților, cel puțin până când prețul secvențierii genomului întreg va scădea și procedura considerabilă de analiză a datelor va fi îmbunătățită. O limitare importantă a aplicării secvențierii exomului în practica clinică este faptul că semnificația funcțională a majorității variantelor genetice așteptate este încă necunoscută. Această situație se schimbă rapid, pe măsură ce un număr din ce în ce mai mare de variante genetice asociate bolilor sunt determinate și puse la dispoziție în baze de date publice. Este plauzibil ca, în câțiva ani, să se cunoască majoritatea variațiilor genetice legate de riscul de a contracta o boală, cu diagnostice moleculare precise, o predicție a evoluției bolii și un răspuns farmacologic. Cunoașterea precisă a exomului, sau a genomului pacientului, va fi atunci un factor determinant în practica medicală.

Recunoștințe

Le mulțumesc cu recunoștință lui Rosario Perona și Juliette Siegfried (ServingEdit.com) pentru revizuirea critică a manuscrisului.

Dezvăluiri

Autorul nu raportează conflicte de interese în această lucrare.

Kuhlenbäumer G, Hullmann J, Appenzeller S. Novel genomic techniques open new avenues in the analysis of monogenic disorders. Hum Mutat. 2011;32(2):144-151.

Kiezun A, Garimella K, Do R, et al. Exome sequencing and the genetic basis of complex traits. Nat Genet. 2012;44(6):623-630.

Vogelstein B, Papadopoulos N, Velculescu VE, Zhou S, Diaz LA Jr, Kinzler KW. Cancer genome landscapes. Science. 2013;339(6127):1546-1558.

Kirwan M, Dokal I. Dyskeratosis congenita: a genetic disorder of many faces. Clin Genet. 2008;73(2):103-112.

Walne AJ, Dokal I. Advances in the understanding of dyskeratosis congenita. Br J Haematol. 2009;145(2):164-172.

Brady PD, Vermeesch JR. Genomic microarrays: a technology overview. Prenat Diagn. 2012;32(4):336-343.

Hehir-Kwa JY, Pfundt R, Veltman JA, de Leeuw N. Pathogenic or not? Evaluarea relevanței clinice a variantelor numărului de copii. Clin Genet. 2013;84(5):415-421.

Simons A, Sikkema-Raddatz B, de Leeuw N, Konrad NC, Hastings RJ, Schoumans J. Genome-wide arrays in routine diagnostics of hematological malignancies. Hum Mutat. 2012;33(6):941-948.

Metzker ML. Tehnologii de secvențiere – următoarea generație. Nat Rev Genet. 2010;11(1):31-46.

Sastre L. New DNA sequencing technologies open a promising era for cancer research and treatment. Clin Transl Oncol. 2011;13(5):301-306.

Lander ES, Linton LM, Birren B, et al. International Human Genome Sequencing Consortium. Secvențierea și analiza inițială a genomului uman. Nature. 2001;409(6822):860-921.

Abecasis GR, Auton A, Brooks LD, et al. 1000 Genomes Project Consortium. O hartă integrată a variației genetice din 1.092 de genomuri umane. Nature. 2012;491(7422):56-65.

Yang Y, Liu R, Xie H, et al. Advances in nanopore sequencing technology. J Nanosci Nanotechnol. 2013;13(7):4521-4538.

Chen YS, Lee CH, Hung MY, Pan HA, Chiou JC, Huang GS. Secvențierea ADN folosind măsurători de conductanță electrică a unei ADN polimeraze. Nat Nanotechnol. 2013;8(6):452-458.

Lu ZX, Jiang P, Xing Y. Variația genetică a splicingului alternativ al pre-ARNm în populațiile umane. Wiley Interdiscip Rev RNA. 2012;3(4):581-592.

Pruitt KD, Harrow J, Harte RA, et al. The consensus coding sequence (CCDS) project: Identificarea unui set comun de gene codificatoare de proteine pentru genomul uman și cel al șoarecilor. Genome Res. 2009;19(7):1316-1323.

Harrow J, Frankish A, Gonzalez JM, et al. GENCODE: the reference human genome annotation for The ENCODE Project. Genome Res. 2012;22(9):1760-1774.

Teer JK, Mullikin JC. Secvențierea exomului: locul ideal înainte de genomurile întregi. Hum Mol Genet. 2010;19(R2):R145-R151.

Liu X, Wang J, Chen L. Whole-exome sequencing reveals recurrent somatic mutation networks in cancer. Cancer Lett. 2013;340(2):270-276.

Parla JS, Iossifov I, Grabill I, Spector MS, Kramer M, McCombie WR. O analiză comparativă a captării exomului. Genome Biol. 2011; 12(9):R97.

Sulonen AM, Ellonen P, Almusa H, et al. Compararea metodelor de captare a exomului pe bază de soluție pentru secvențierea de generație următoare. Genome Biol. 2011;12(9):R94.

Clark MJ, Chen R, Lam HY, et al. Performance comparison of exome DNA sequencing technologies. Nat Biotechnol. 2011;29(10):908-914.

Gullapalli RR, Desai KV, Santana-Santos L, Kant JA, Becich MJ. Secvențierea de generație următoare în medicina clinică: Challenges and lessons for pathology and biomedical informatics (Provocări și lecții pentru patologie și informatică biomedicală). J Pathol Inform. 2012;3:40.

Samuels DC, Han L, Li J, et al. Finding the lost treasures in exome sequencing data. Trends Genet. 2013;29(10):593-599.

Taneri B, Asilmaz E, Gaasterland T. Biomedical impact of splicing mutations revealed through exome sequencing. Mol Med. 2012;18:314-319.

Fu W, O’Connor TD, Jun G, et al; NHLBI Exome Sequencing Project. Analiza a 6.515 exomuri relevă originea recentă a majorității variantelor umane codificatoare de proteine. Nature. 2013;493(7431):216-220.

Marian AJ. Challenges in medical applications of whole exome/genome sequencing discoveries. Trends Cardiovasc Med. 2012;22(8):219-223.

Singleton AB. Secvențierea exomului: o tehnologie transformatoare. Lancet Neurol. 2011;10(10):942-946.

Vissers LE, de Ligt J, Gilissen C, et al. A de novo paradigm for mental retardation. Nat Genet. 2010;42(12):1109-1112.

Gonzalez-Perez A, Perez-Llamas C, Deu-Pons J, et al. IntOGen-mutations identifies cancer drivers across tumor types. Nat Methods. 2013;10(11):1081-1082.

Bernstein BE, Birney E, Dunham I, Green ED, Gunter C, Snyder M; ENCODE Project Consortium. O enciclopedie integrată a elementelor ADN din genomul uman. Nature. 2012;489(7414):57-74.

Hardison RC. Datele epigenetice la nivelul genomului facilitează înțelegerea studiilor de asociere a susceptibilității bolilor. J Biol Chem. 2012;287(37):30932-30940.

Weedon MN, Cebola I, Patch AM, et al. International Pancreatic Agenesis Consortium. Mutațiile recesive într-un enhancer PTF1A distal cauzează agenezie pancreatică izolată. Nat Genet. 2014;46(1):61-64.

Wang Z, Gerstein M, Snyder M. RNA-Seq: un instrument revoluționar pentru transcriptomică. Nat Rev Genet. 2009;10(1):57-63.

Mutz KO, Heilkenbrinker A, Lönne M, Walter JG, Stahl F. Transcriptome analysis using next-generation sequencing. Curr Opin Biotechnol. 2013;24(1):22-30.

Hitzemann R, Bottomly D, Darakjian P, et al. Genes, behavior and next-generation RNA sequencing. Genes Brain Behav. 2013;12(1):1-12.

Costa V, Aprile M, Esposito R, Ciccodicola A. RNA-Seq and human complex diseases: recent accomplishments and future perspectives. Eur J Hum Genet. 2013;21(2):134-142.

Lappalainen T, Sammeth M, Friedländer MR, et al; Geuvadis Consortium; Geuvadis Consortium. Secvențierea transcriptomului și a genomului descoperă variații funcționale la om. Nature. 2013; 501(7468):506-511.

Slotkin W, Nishikura K. Adenosine-to-inosine RNA editing and human disease. Genome Med. 2013;5:105.

Lee TI, Young RA. Reglarea transcripțională și reglarea sa eronată în boală. Cell. 2013;152(6):1237-1251.

Suvà ML, Riggi N, Bernstein BE. Epigenetic reprogramming in cancer. Science. 2013;339(6127):1567-1570.

Li P, Demirci F, Mahalingam G, Demirci C, Nakano M, Meyers BC. Un flux de lucru integrat pentru analiza metilației ADN. J Genet Genomics. 2013;40(5):249-260.

Chibon F. Cancer gene expression signatures – the rise and fall? Eur J Cancer. 2013;49:2000-2009.

Dedeoğlu BG. Abordări de mare randament pentru analiza expresiei microARN-urilor. Methods Mol Biol. 2014;1107:91-103.

Ni T, Wu H, Song S, Jelley M, Zhu J. Selective gene amplification for high-throughput sequencing. Recent Pat DNA Gene Seq. 2009; 3(1):29-38.

Barretina J, Caponigro G, Stransky N, et al. The Cancer Cell Line Encyclopedia enables predictive modelling of anticancer drug sensitivity. Nature. 2012;483(7391):603-607.

Garnett MJ, Edelman EJ, Heidorn SJ, et al. Systematic identification of genomic markers of drug sensitivity in cancer cells. Nature. 2012;483(7391):570-575.

Hoischen A, Gilissen C, Arts P, et al. Massively parallel sequencing of ataxia genes after array-based enrichment. Hum Mutat. 2010;31(4):494-499.

Ng SB, Bigham AW, Buckingham KJ, et al. Exome sequencing identifies MLL2 mutations as a cause of Kabuki syndrome. Nat Genet. 2010;42(9):790-793.

Hoischen A, van Bon BW, Gilissen C, et al. De novo mutations of SETBP1 cause Schinzel-Giedion syndrome. Nat Genet. 2010;42(6):483-485.

Edvardson S, Shaag A, Zenvirt S, et al. Sindromul Joubert 2 (JBTS2) la evreii Ashkenazi este asociat cu o mutație TMEM216. Am J Hum Genet. 2010;86(1):93-97.

Krawitz PM, Schweiger MR, Rödelsperger C, et al. Identity-by-descent filtering of exome sequence data identifies PIGV mutations in hyperphosphatasia mental retardation syndrome. Nat Genet. 2010;42(10):827-829.

Bilgüvar K, Oztürk AK, Louvi A, et al. Whole-exome sequencing identifies recessive WDR62 mutations in severe brain malformations. Nature. 2010;467(7312):207-210.

Johnson JO, Mandrioli J, Benatar M, et al. ITALSGEN Consortium. Secvențierea exomului dezvăluie mutațiile VCP ca fiind o cauză a SLA familială. Neuron. 2010;68(5):857-864.

Choi M, Scholl UI, Ji W, et al. Genetic diagnosis by whole exome capture and massively parallel DNA sequencing. Proc Natl Acad Sci U S A. 2009;106(45):19096-19101.

Worthey EA, Mayer AN, Syverson GD, et al. Making a definitive diagnosis: successful clinical application of whole exome sequencing in a child with intractable inflammatory bowel disease. Genet Med. 2011;13(3):255-262.

Montenegro G, Powell E, Huang J, et al. Exome sequencing allows for rapid gene identification in a Charcot-Marie-Tooth family. Ann Neurol. 2011;69(3):464-470.

Bonnefond A, Durand E, Sand O, et al. Molecular diagnosis of neonatal diabetes mellitus using next-generation sequencing of the whole exome. PLoS One. 2010;5(10):e13630.

Johnson JO, Gibbs JR, Van Maldergem L, Houlden H, Singleton AB. Secvențierea exomului în sindromul Brown-Vialetto-van Laere. Am J Hum Genet. 2010;87(4):567-9; răspuns autor 569.

Bras JM, Singleton AB. Secvențierea exomului în boala Parkinson. Clin Genet. 2011;80(2):104-109.

Topper S, Ober C, Das S. Exome sequencing and the genetics of intellectual disability (Secvențierea exomului și genetica dizabilității intelectuale). Clin Genet. 2011;80(2):117-126.

Corder EH, Saunders AM, Strittmatter WJ, et al. Dozajul genetic al alelei apolipoproteinei E tip 4 și riscul de boală Alzheimer în familiile cu debut tardiv. Science. 1993;261(5123):921-923.

Klein RJ, Zeiss C, Chew EY, et al. Complement factor H polymorphism in age-related macular degeneration. Science. 2005;308(5720):385-389.

Tan EK. Identificarea unei variante genetice comune de risc (LRRK2 Gly2385Arg) în boala Parkinson. Ann Acad Med Singapore. 2006;35(11):840-842.

Libioulle C, Louis E, Hansoul S, et al. Novel Crohn disease locus identified by genome-wide association maps to a gene desert on 5p13.1 and modulates expression of PTGER4. PLoS Genet. 2007;3(4):e58.

Stephens PJ, Greenman CD, Fu B, et al. Rearanjament genomic masiv dobândit într-un singur eveniment catastrofal în timpul dezvoltării cancerului. Cell. 2011;144(1):27-40.

Jones S, Zhang X, Parsons DW, et al. Core signaling pathways in human pancreatic cancers revealed by global genomic analyses. Science. 2008;321(5897):1801-1806.

Parsons DW, Jones S, Zhang X, et al. An integrated genomic analysis of human glioblastoma multiforme. Science. 2008;321(5897):1807-1812.

Timmermann B, Kerick M, Roehr C, et al. Somatic mutation profiles of MSI and MSS colorectal cancer identified by whole exome next generation sequencing and bioinformatics analysis. PLoS One. 2010;5(12):e15661.

Varela I, Tarpey P, Raine K, et al. Exome sequencing identifies frequent mutation of the SWI/SNF complex gene PBRM1 in renal carcinoma. Nature. 2011;469(7331):539-542.

Ku CS, Cooper DN, Roukos DH. Relevanța clinică a secvențierii genomului cancerului. World J Gastroenterol. 2013;19(13):2011–2018.

Kilpivaara O, Aaltonen LA. Secvențierea genomului de diagnosticare a cancerului și contribuția variantelor germinale. Science. 2013;339(6127):1559-1562.

Hudson TJ, Anderson W, Artez A, et al; International Cancer Genome Consortium. Rețeaua internațională de proiecte privind genomul cancerului. Nature. 2010;464(7291):993-998.

Gerlinger M, Rowan AJ, Horswell S, et al. Intratumor heterogeneity and branched evolution revealed by multiregion sequencing. N Engl J Med. 2012;366(10):883-892.

Ren SC, Qu M, Sun YH. Investigarea heterogenității intratumorale prin secvențierea celulelor unice. Asian J Androl. 2013;15(6):729-734.

Hieronymus H, Sawyers CL. Traversarea peisajului genomic al cancerului de prostată de la diagnostic până la moarte. Nat Genet. 2012;44(6):613-614.

McLeod HL. Cancer pharmacogenomics: promisiuni timpurii, dar sunt necesare eforturi concertate. Science. 2013;339(6127):1563-1566.

Abaan OD, Polley EC, Davis SR, et al. The exomes of the NCI-60 panel: a genomic resource for cancer biology and systems pharmacology (Exomii panelului NCI-60: o resursă genomică pentru biologia cancerului și farmacologia sistemelor). Cancer Res. 2013;73(14):4372-4382.

Weinstein JN. Drug discovery: Liniile celulare luptă împotriva cancerului. Nature. 2012;483:544-545.

Shahmirzadi L, Chao EC, Palmaer E, Parra MC, Tang S, Gonzalez KD. Deciziile pacienților privind dezvăluirea rezultatelor secundare în rândul primelor 200 de persoane supuse unui secvențiat exomic de diagnostic clinic. Genet Med. Epub October 10, 2013.

Flicek P, Amode MR, Barrell D, et al. Ensembl 2011. Nucleic Acids Res. 2011;39:D800-D806.

Pruitt KD, Tatusova T, Klimke W, Maglott DR. Secvențe de referință NCBI: situația actuală, politica și noile inițiative. Nucleic Acids Res. 2009;37:D32-D36.

.

Lasă un răspuns

Adresa ta de email nu va fi publicată.