Introdução

Numerosas doenças têm uma base genética. Algumas são a consequência de uma ausência ou disfunção de uma determinada proteína devido a mutações no gene codificador. É o caso das doenças da herança Mendeliana, como a doença de Huntington, talassemia e aproximadamente 1.000 outras doenças raras hereditárias.1 Muitas doenças têm uma base genética, mesmo que não sejam exclusivamente devidas à mutação de um único gene, e um número crescente de variantes genéticas e polimorfismos está sendo identificado como fatores de risco para doenças complexas.2 O câncer é uma doença genética causada pela mutação de um ou mais genes que ou aumentam o risco de câncer (como as mutações da linha germinal), ou promovem o câncer (oncogenes), ou prejudicam os mecanismos celulares que controlam a proliferação celular (genes supressores), como ocorre com as mutações somáticas.3

A identificação da base genética dessas doenças tem sido um projeto trabalhoso e desafiador, até alguns anos atrás. Estes projetos frequentemente começaram com a identificação de uma região do genoma possivelmente envolvida na transmissão da doença por estudos de associação genética.1 A análise de famílias grandes com vários membros afetados é geralmente necessária para definir uma região do genoma altamente relacionada à transmissão da doença. Geralmente, esta região contém vários genes que devem ser sequenciados para identificar uma mutação genética presente em todos os indivíduos afetados e não em seus parentes saudáveis, no caso de herança dominante. No caso de transmissão recessiva, a mutação deve estar presente em ambos os alelos dos membros afetados e em um, ou nenhum, dos alelos dos parentes não afetados.

O diagnóstico de doenças genéticas foi, e na maioria dos casos ainda é, igualmente trabalhoso. No melhor dos casos, a doença pode ter origem em uma mutação em apenas um gene. O diagnóstico exigiria a determinação da sequência nucleotídica daquele gene apenas. Tipicamente, o gene é amplificado como vários fragmentos por reacções em cadeia da polimerase e a sequência nucleotídica de cada um deles é determinada. Muitas vezes, a doença pode ser causada por mutações em qualquer um dos vários genes, e todos eles devem ser amplificados e sequenciados a fim de encontrar a origem genética da doença nos pacientes afetados. Por exemplo, na disqueratose congênita, mutações podem ser encontradas em qualquer um dos genes dkc, tert, terc, NOP10, NH2 ou TINF2, e o número de genes afetados pode ser ainda maior, já que há uma fração de pacientes nos quais a mutação causal não foi identificada.4,5 A sequência nucleotídica de todos esses genes deve ser determinada para o diagnóstico molecular de cada paciente. Encontramos vários genes mutantes em vários tipos de câncer.3 O diagnóstico molecular requer a determinação da sequência nucleotídica de vários desses genes. Atualmente, este é um processo trabalhoso e caro que não pode ser usado para uma grande população de pacientes. Na prática, apenas alguns poucos genes que são mutados em uma proporção importante de pacientes afetados por alguns tipos de câncer são sequenciados para diagnóstico e tratamento.

Somente nos últimos anos foram desenvolvidas técnicas para a detecção simultânea de múltiplas variantes de seqüência em uma determinada amostra. Muitas delas são baseadas na tecnologia de microarranjo de ácido desoxirribonucleico (ADN). Em matrizes de genotipagem, os oligonucleotídeos contendo as mutações ativamente identificadas relacionadas a uma determinada doença são manchados em uma lâmina. Uma amostra de DNA do paciente é adicionada em cima da lâmina e os oligonucleotídeos hibridizadores são identificados. Milhões de mutações conhecidas podem ser testadas em uma única hibridação de microarranjos.6 As variações do número de cópias também podem ser analisadas usando microarrays de DNA projetados para detectar a presença de regiões de DNA que são duplicadas ou deletadas no DNA do paciente.7 Estas técnicas são freqüentemente usadas em pesquisas médicas e para diagnóstico clínico.8

Contudo, um passo importante na medicina molecular tem sido o recente desenvolvimento de tecnologias de sequenciamento maciço que permitem a determinação da sequência nucleotídica do DNA de um paciente em um curto período de tempo e a um preço acessível.9,10 Essas metodologias estão em uso desde 2005 e são baseadas na determinação simultânea da sequência nucleotídica de milhões de fragmentos de DNA. Elas foram nomeadas como sequenciamento de segunda geração, sequenciamento de próxima geração, sequenciamento profundo, ou sequenciamento maciçamente paralelo. Milhares de milhões de seqüências de nucleotídeos são determinadas em não mais de 2 semanas usando essas máquinas. Como exemplo da capacidade desses novos sistemas de seqüenciamento, note-se que o seqüenciamento de marcos do primeiro genoma humano, publicado em 2001,11 exigiu o trabalho coordenado de 23 laboratórios, que levou 13 anos, com um custo total de cerca de US$ 3 bilhões. Com as novas metodologias, o sequenciamento de um genoma humano leva um laboratório e cerca de 2 semanas, com um custo aproximado de US$4.000,

A disponibilidade de metodologias modernas de sequenciamento está produzindo o crescimento exponencial de nosso conhecimento sobre o genoma humano, a variabilidade entre indivíduos e a identificação de variantes genéticas em doenças. Por exemplo, estas metodologias são a base de um Projeto em andamento de 1000 Genomas,12 com o objetivo de determinar a seqüência completa de nucleotídeos de cerca de 1.000 pessoas de diferentes origens geográficas e étnicas para determinar a variação média da seqüência entre indivíduos e identificar os polimorfismos mais freqüentes.

As tecnologias de seqüenciamento maciço estão atualmente evoluindo a um ritmo acelerado. Máquinas menores e mais rápidas estão sendo desenvolvidas, e novos métodos de seqüenciamento estão sendo introduzidos. Um objetivo importante, por exemplo, é sequenciar uma única molécula de DNA de uma célula individual.13,14 Além dos desafios técnicos, os avanços estão diminuindo constantemente o preço do sequenciamento de DNA, de modo que o objetivo de sequenciar um genoma humano individual por US$1.000 parece estar ao alcance em poucos anos. Atualmente, o seqüenciamento de todo um genoma humano e a análise de todos os dados sequenciais gerados é complexo, caro e demorado, e muitos estudos estão sendo realizados em uma parte menor do genoma. Em particular, muita atenção está sendo dada atualmente ao seqüenciamento da região codificadora de proteínas do genoma, que é conhecida como o exoma. O sequenciamento do exoma é muito mais acessível que o sequenciamento do genoma inteiro, e as possibilidades, vantagens e limitações desta técnica serão discutidas nesta revisão.

O que é um exoma?

A maior parte dos genes codificadores de proteínas humanos tem uma estrutura descontínua. A região codificadora de proteínas é fragmentada em vários pedaços, chamados exons. Os exons são ligados por fragmentos de DNA não-codificadores de proteínas, ou introns, como esquematicamente mostrado na Figura 1. Os genes são transcritos da região promotora sob o controle de várias regiões reguladoras, que estão presentes em diferentes locais em relação ao gene, a montante, a jusante, ou mesmo dentro do gene. A transcrição cria uma transcrição primária que contém exons e introns. Os processos subsequentes de emenda do ácido ribonucleico (RNA) eliminam os introns e unem os exons para gerar o RNA do mensageiro maduro (mRNA) que contém apenas uma região codificadora contínua de proteínas. Estudos recentes mostram que as transcrições primárias da maioria dos genes podem ser emendadas de várias maneiras, dando origem a vários mRNAs maduros contendo combinações específicas de exons, conhecidas como variantes alternativas de emenda (Figura 1). Estes mRNAs codificam isoformas proteicas que têm algumas regiões comuns, mas que também diferem de outras, dependendo dos exons incorporados.15

Análise do genoma humano mostrou que genes codificadores de proteínas representam uma pequena proporção do DNA, apenas cerca de 3%.16 Exons representam uma fração ainda menor a 1% do genoma.16 Um resumo destes dados é mostrado na Tabela 1. O genoma humano é composto de 3,3 × 109 pares de bases (bp) e contém 20.078 genes codificadores de proteínas.17 Cada gene é dividido em um número médio de oito exons, cada um com cerca de 170 bp de comprimento. Todos os exons como um todo contêm cerca de 3 ×107 bp. Entretanto, o seqüenciamento de todos os exons fornece a mesma informação sobre a seqüência de aminoácidos das proteínas codificadas como seqüenciando todo o genoma, com exceção das mutações que alteram a emenda do mRNA, como será discutido na seção de seqüenciamento e análise de dados do Exome. Este sistema de sequenciamento de todos os exons foi nomeado sequenciamento exome e tornou-se um método válido para detectar variações na sequência de aminoácidos de todas as proteínas humanas.18 A diferença de tamanho muito marcada torna o sequenciamento do exoma muito mais barato do que o sequenciamento do genoma, e isto facilita a análise computacional e funcional dos dados da sequência gerada.

Figure 1 Representação esquemática da estrutura e expressão genética.
Notes: Os genes codificadores de proteínas são compostos por exons que contêm informação codificadora de proteínas (caixas), separados por introns não codificadores (linhas). As caixas cinzentas indicam regiões exon codificadoras de proteínas e as caixas brancas representam mRNA 5′ e 3′ regiões não traduzidas. Os genes são transcritos a partir das regiões promotoras, imediatamente a montante do exon 1. O local de início da transcrição é indicado por uma seta. A expressão do gene é controlada por um número de regiões TR que podem ser localizadas a montante ou a jusante do gene, a distâncias variáveis, ou dentro do gene (mais frequentemente em introns). A estabilidade e tradução do mRNA pode ser regulada pela ligação do microRNA a sites específicos na região não traduzida de 3′ (indicada por asteriscos). Os genes são transcritos em RNAs primários contendo introns e exons. Processos subsequentes de emenda eliminam os introns para gerar mRNAs maduros. Processos alternativos de emenda podem dar origem a diferentes mRNAs, dependendo dos exons que contêm (mRNA1, mRNA2), esse código para diferentes isoformas de proteínas.
A abreviações: TR, região reguladora da transcrição; RNA, ácido ribonucleico; mRNA, ácido ribonucleico mensageiro.

Tabela 1 Características gerais do genoma humano e exoma

Técnicas de captura de exomas

O primeiro e mais crítico passo no sequenciamento de exomas é o isolamento ou captura dos exons. Os métodos utilizados são baseados na hibridação do DNA. A análise do genoma humano tornou possível a identificação de todos os exônios genéticos e facilita o desenho de sondas oligonucleotídicas específicas para cada um deles. As sondas são utilizadas para purificação dos exônios do DNA.19 A fragmentação do DNA em pedaços não maiores que 500 bp é o primeiro passo. O DNA é então hibridizado para as sondas de oligonucleotídeos específicos do exon e os fragmentos hibridizados são purificados. A hibridização pode ser realizada na fase líquida. Neste caso, os oligonucleotídeos são rotulados de forma a que os complexos de ADN-oligonucleotídeos possam ser separados do grosso do ADN não hibridizado. Em um exemplo comum, os oligonucleotídeos são covalentemente ligados à biotina para que os híbridos de DNA-oligonucleotídeos possam ser isolados usando a molécula de ligação à biotina, estreptavidina, acoplada a contas magnéticas. Os fragmentos de ADN que não contêm exões não se ligam às contas de estreptavidina e podem ser removidos eficazmente após várias etapas de lavagem. Os fragmentos contendo exões, ligados às contas, podem ser recuperados após a dissociação dos híbridos de DNA-oligonucleotídeos sob condições de baixa resistência iônica.

Os exões também podem ser isolados por hibridação para um suporte sólido onde os oligonucleotídeos específicos do exão foram manchados, como nos microarrays de DNA. Neste caso, o DNA fragmentado é espalhado sobre os oligonucleotídeos para permitir a hibridação. Mais tarde, o DNA não-hibridizado é lavado e o DNA exon enriquecido é eluído em condições de baixa iónica.

Vários fornecedores comerciais oferecem kits para isolamento do exoma utilizando protocolos de hibridação de fase líquida, incluindo a Agilent Technologies (Santa Clara, CA, EUA), Roche NimbelGen, Inc. (Madison, WI, EUA), Illumina, Inc. (Madison, WI, EUA), Illumina, Inc. (Illumina, EUA) (San Diego, CA, EUA), e Life Technologies (Carlsbad, CA, EUA). Estes kits permitem o isolamento de mais de 90% dos exões presentes no genoma, com mais de 90% de especificidade a um preço aproximado de US$150 por exoma. Vários autores compararam essas plataformas de captura de exons,20-22 e os dados obtidos por Clark et al22 comparando os kits SureSelect Human All Exon 50 Mb (Agilent Technologies), Roche NimbleGen, Inc.’s SeqCap EZ Exome Library v2.0, e Illumina, Inc.’s TruSeq Exome Enrichment estão resumidos na Tabela 2. Alguns dos kits cobrem as regiões não traduzidas do mRNA, além das regiões codificadoras de proteínas, e isso permite a análise de regiões reguladoras, como os locais de ligação do microRNA (miRNA). A inclusão do 5′ regiões não traduzidas também permite a análise das regiões promotoras proximais.22 Além disso, a maioria dos kits cobre até 80% das regiões codificadoras do miRNA.21 Recentemente, kits melhorados foram desenvolvidos por estes e outros fornecedores, de modo que os dados mostrados na Tabela 2 devem ser considerados apenas uma indicação. É importante notar que a purificação exon é um passo crítico. A recuperação de 100% dos exons é difícil, e os exons são frequentemente perdidos ou subrepresentados no exoma isolado. Por exemplo, se o exômen de um paciente estiver sendo analisado e 10% dos exons forem perdidos durante a purificação, a probabilidade de faltar uma mutação relevante será de cerca de 10% devido a este erro técnico. Portanto, o uso de procedimentos altamente eficientes de exon-captura é de importância crítica no seqüenciamento do exoma.

Tabela 2 Comparação de três grandes plataformas de exome-captura
Notas: aComparação das bases de dados Ensemble81 e RefSeq82, respectivamente; bpercentagem das regiões selecionadas seqüenciadas por cada plataforma pelo menos dez vezes após as análises de 80 mega leituras da seqüência de DNA. Agilent Technologies (Santa Clara, CA, EUA); Roche NimbelGen, Inc. (Madison, WI, EUA); Illumina, Inc. (Madison, WI, EUA); Illumina, Inc. (Illumina, Inc., EUA) (San Diego, CA, EUA).
A abreviações: mRNA, ácido ribonucleico mensageiro; miRNA, ácido micro ribonucleico; DNA, ácido desoxirribonucleico.

Exemplo sequenciamento e análise de dados

Exemplos fragmentos contendo fragmentos são sequenciados usando qualquer um dos sistemas ou tecnologias de equipamento de sequenciamento massivo atualmente disponíveis. Como mencionado na introdução, estas plataformas determinam a sequência de nucleotídeos de milhões de fragmentos de DNA simultaneamente. O comprimento determinado da sequência de cada fragmento no sequenciamento exome não é longo, normalmente entre 35 bp e 100 bp. Entretanto, como o DNA foi inicialmente fragmentado aleatoriamente, cada nucleotídeo individual estará presente em muitos fragmentos sobrepostos. Portanto, se for obtido um número suficientemente alto de sequências, mesmo que curto, cada base será sequenciada independentemente em vários fragmentos de ADN. O número de vezes que cada base é sequenciada é chamado de cobertura ou profundidade de sequenciação. A cobertura está diretamente relacionada com a qualidade e confiança da seqüência nucleotídica gerada. Em geral, a cobertura de 20×-30× é considerada necessária para obter resultados confiáveis no seqüenciamento de exomos.59 Esta profundidade de seqüenciamento significa que uma possível variação de seqüência teria sido sequenciada independentemente em 20-30 diferentes fragmentos de DNA.

Análise de dados é o último passo em projetos de seqüenciamento de exomos (Figura 2). Como mencionado acima, dados de milhões de seqüências são gerados e suas análises requerem programas de computador específicos e complexos e experiência.19,23 Uma etapa preliminar é uma análise da qualidade da seqüência gerada. A precisão da leitura das seqüências em vários comprimentos de seqüência, o comprimento médio das leituras, assim como outros parâmetros, são testados. Se a qualidade for suficientemente boa, cada seqüência é comparada a uma seqüência de referência, que geralmente é a última versão disponível da seqüência do genoma humano. Normalmente, mais de 80% das sequências geradas podem ser alinhadas com o genoma de referência.22 Esta etapa permite um pequeno grau de variação de nucleotídeos em relação ao genoma de referência. O próximo passo na análise é identificar variações de seqüência entre a seqüência de referência e a seqüência de exoma obtida em nosso estudo. As análises subseqüentes dessas variações poderiam fornecer as informações desejadas sobre o problema médico em estudo.

Figure 2 Exome sequencing data analysis.
Notes: Os passos necessários para o isolamento do exoma, sequenciamento e análise de dados são representados esquematicamente. Este processo conduz à identificação de variantes gênicas envolvidas na origem das doenças (genes condutores) ou de outra forma relacionadas à suscetibilidade, evolução ou resposta farmacêutica às doenças. Estes dados fornecem informações valiosas para diagnóstico e prognóstico, para aconselhamento genético e para o desenho de tratamentos personalizados.
A abreviatura: DNA, ácido desoxirribonucleico.

Exome sequencing pode detectar vários tipos de variações genéticas. Uma das diferenças mais frequentemente encontradas é uma mudança de um nucleotídeo para outro, por exemplo, A para G (códão ATA para ATG). Estas variações são chamadas variantes de nucleotídeos simples (SNVs), embora sejam consideradas polimorfismos de nucleotídeos simples (SNPs) quando a sua frequência na população é superior a 1%-5% e não há um forte efeito sobre o risco de qualquer doença. A maioria dos SNVs são silenciosos, ou também conhecidos como sinônimos, porque ambas as variantes de seqüência codificam para o mesmo aminoácido (por exemplo, uma variação de GCA para GCC, já que ambos são códons alaninos). A maioria destes polimorfismos não representam nenhuma diferença para a proteína codificada, não estão sob selecção evolutiva, e representam as variações mais frequentemente encontradas no exoma humano. A exceção são algumas mutações silenciosas que afetam sinais reguladores de emendas, ou mesmo locais reguladores de transcrição, alterando emendas de mRNA ou expressão mesmo que eles não mudam os aminoácidos codificados. Em outros casos, a variação do nucleotídeo tem uma consequência na proteína codificada e estas são variantes não-silenciosas ou não-sinônimas. Estas mudanças podem resultar em variações no aminoácido codificado (por exemplo, GAT para GAG muda ácido aspártico para ácido glutâmico), e são chamadas mutações de missense. Alterações mais drásticas são produzidas quando a variação de nucleotídeos cria um códon de parada de tradução (por exemplo, TGC para TGA muda um códon cisteína para um códon de parada), o que é chamado de mutação sem sentido. Há também um tipo de SNV que pode ser detectado pelo sequenciamento exome mesmo que não afete os códons de proteína. Como os exons são selecionados após a fragmentação aleatória do DNA, eles também podem conter regiões contíguas de DNA, incluindo seqüências de intron vizinhos e até mesmo promotores gênicos se regiões não traduzidas forem capturadas.24 As regiões Intron contêm os sinais regulatórios necessários para a emenda do mRNA. SNVs nessas regiões podem alterar a emenda de várias maneiras.15 Por exemplo, o intron afetado pode ser retido no mRNA maduro, ou o exon contíguo pode ser emendado (exon pulando). Essas alterações alteram a seqüência de nucleotídeos do mRNA maduro e, portanto, a proteína codificada a jusante do SNV.25 O seqüenciamento de exônomos também pode detectar variações de seqüência devido a pequenas inserções ou deleções (indels).22 Essas variações podem resultar em uma mudança de estrutura, exceto quando afetam três ou um múltiplo de três nucleotídeos. Nesse caso, pequenas deleções ou inserções de aminoácidos seriam produzidas.

Identificação das mutações causadoras

A relevância funcional das variantes de seqüência detectadas deve ser determinada na próxima etapa da análise dos dados. Mesmo que todos os humanos sejam quase idênticos do ponto de vista genético, o número de diferenças de seqüência de nucleotídeos entre indivíduos é considerável.26 Essa heterogeneidade complica a interpretação dos dados obtidos em projetos de seqüenciamento individual. Alguns dados gerais sobre variações de seqüências individuais são mostrados na Tabela 3. Ao considerar o genoma inteiro, o número de diferenças de seqüência entre os indivíduos foi estimado em 4 × 106, de acordo com os dados obtidos no Projeto 1000 Genomes e em projetos menores de seqüenciamento do genoma inteiro.27 Os exomes mostram um número menor, mas ainda considerável, de variações de seqüência, numerando cerca de 20.000-25.000 entre quaisquer dois indivíduos não relacionados.27,28 A maioria dessas variações genéticas é silenciosa, como discutido anteriormente. O número de diferenças de seqüências nãoilenciadas entre os indivíduos foi estimado em 10.000. A maioria dessas variantes existe na população em geral e são transmitidas por gerações. Estima-se que menos de um SNV não-silencioso aparece de novo em cada indivíduo.29

Os dados obtidos nos projetos de sequenciamento exome são freqüentemente filtrados para identificar todos os SNPs presentes em outros indivíduos e que não estão, portanto, relacionados à doença em estudo.2,19,23 Este processo pode ser feito por comparação com bases de dados públicas onde são compilados os SNPs encontrados nos projetos de sequenciamento. Uma ressalva a ser levada em conta é que todas as grandes bases de dados contêm uma série de mutações comprovadas que causam doenças relativamente frequentes. Cerca de 400-700 novos, e possivelmente relevantes, SNVs permanecem após esta etapa de filtragem (Tabela 3).28 O próximo desafio é determinar quais dos SNVs que não estão presentes na população global, se houver, estão na origem da doença em estudo. Muitas das diferenças observadas não estarão associadas a qualquer incidência da doença, e estas são conhecidas como alterações de passageiros.23 Em contraste, uma ou algumas alterações podem ter um papel causal e são chamadas alterações de condutor. A abordagem utilizada para identificar essas mudanças de condutor dependerá das circunstâncias particulares do estudo. Em doenças com um padrão mendeliano de herança, geralmente é necessário analisar um número de indivíduos afetados e não afetados para encontrar variações genéticas que se segregam perfeitamente com a doença. Esta comparação é mais informativa em famílias grandes com pedigrees bem caracterizados. Na ausência de famílias afetadas suficientemente grandes, a comparação de um número de pacientes e controles não relacionados também permite a identificação dos genes condutores. Critérios adicionais são usados para selecionar possíveis SNVs relacionados à doença, inclusive em algoritmos de silício, que predizem a possível importância do aminoácido mutante com base na conservação evolutiva, e no impacto previsto na estrutura e função da proteína. A função prevista da proteína mutante e seu padrão de expressão específico do tecido também são critérios utilizados na seleção de mutações causais putativas.

Quadro 3 Resumo da variação da seqüência entre indivíduos

Alguns exemplos desses tipos de estudos serão fornecidos em uma seção posterior. Entretanto, à medida que mais estudos estão sendo realizados, mais variações genéticas estão sendo identificadas como causadoras de doenças hereditárias, o que torna provável que alguns dos genes mutantes no paciente já teriam sido descritos. Esses genes mutantes podem ser encontrados na literatura e em bancos de dados especializados, como o banco de dados Online Mendelian Inheritance in Man (http://www.omim.org). A possível relevância das mutações encontradas em vários genes também pode ser pesquisada na página do Genome Ensemble (http://www.ensembl.org/) caso tenham sido previamente descritas.

Cancer é provavelmente o grupo de doenças com base genética mais prevalente. Muitos estudos têm sido direcionados para determinar os genes condutores de vários tipos de câncer.30 O grupo emergente de genes condutores de câncer pode ser consultado em bancos de dados como o Catálogo de Mutações Somáticas em Câncer (COSMIC; http://cancer.sanger.ac.uk) ou o Atlas de Genomas do Câncer (http://cancergenome.nih.gov/). Vários exemplos mais detalhados serão mostrados na secção Exemplos do uso clínico do sequenciamento de exomas.

Comparação do sequenciamento de exomas com outras abordagens de sequenciamento massivo

Sequenciamento do genoma

Como mencionado na Introdução, o sequenciamento de todo o genoma humano está a tornar-se cada vez mais acessível. Comparado ao sequenciamento de exomas, o sequenciamento do genoma inteiro é uma alternativa muito mais complexa. O número de reações de seqüenciamento que devem ser realizadas é muito maior, assim como os números de dados de seqüenciamento de nucleotídeos gerados. A análise computacional é muito maior. Além disso, muitas outras variantes genéticas são encontradas, como mostra a Tabela 3, o que dificulta a identificação dos genes condutores. No entanto, o sequenciamento genético fornece uma visão completa das alterações genéticas presentes no paciente, incluindo grandes reorganizações genômicas. No entanto, o sequenciamento de um genoma a uma profundidade moderada não terá variações estruturais, especialmente em regiões de baixa complexidade. Esta informação está resumida na Tabela 4, que compara o sequenciamento exoma com outras abordagens de sequenciamento.

Como mencionado anteriormente, genes codificadores de proteínas representam apenas 3% do genoma.16 Até recentemente, o resto do genoma era considerado como “DNA em massa” sem muito valor de informação. Entretanto, estudos recentes mudaram completamente este ponto de vista. Um grande projeto de genoma está estudando a função de todas as regiões do genoma, o projeto Enciclopédia de Elementos de DNA (ENCODE).31 Os resultados atualmente disponíveis mostram que mais de 70% do genoma é transcrito. Muitas das transcrições geradas não codificam as proteínas, mas parecem ter um papel regulador na expressão gênica. Entre eles estão os já conhecidos miRNAs, que regulam a estabilidade e tradução do mRNA (Figura 1), mas também mais de 20.000 RNAs não-codificadores que regulam a transcrição. Além disso, muitas regiões de DNA que regulam a expressão gênica têm sido identificadas, incluindo muitas regiões promotoras e reguladoras de transcrição previamente desconhecidas (Figura 1). Esta informação é de relevância clínica porque as mutações nas regiões reguladoras podem afetar a expressão de genes específicos e podem ter resultados patológicos. De fato, uma grande proporção dos estudos de associação entre genomas relacionou regiões de DNA, onde não foram encontradas mutações codificadoras de proteínas, com condições patológicas.32 Os dados gerados no projeto ENCODE permitiram a revisão de alguns casos, que constataram que mutações em regiões reguladoras de expressão gênica são responsáveis pela doença.31,32 Também, em um exemplo recente, Weedon et al33 relataram que mutações em uma região reguladora de transcrição do gene PTF1A causam agenesia isolada do pâncreas. Mutações em regiões regulatórias não podem ser detectadas pelo seqüenciamento exoma, pois não afetam a proteína codificada, mas sim sua expressão. Portanto, o sequenciamento do genoma inteiro fornece mais informação do que o sequenciamento do exoma à custa de uma maior complexidade e custo económico.

Tabela 4 Comparação de técnicas de sequenciamento massivo
A abreviaturas: RNA, ácido ribonucleico; DNA, ácido desoxirribonucleico.

Sequenciamento do RNA

Técnicas de seqüenciamento do RNA consistem na conversão de populações de RNA em DNA complementar (cDNA) por transcrição reversa e seu seqüenciamento subseqüente.34,35 No caso do sequenciamento de mRNA, a população completa de mRNAs expressa em uma linha celular ou amostra de tecido (conhecida como transcriptoma) é convertida para cDNA e sequenciada. O processo de sequenciamento do mRNA fornece informações sobre a seqüência de nucleotídeos dos genes que estão sendo transcritos na amostra analisada e, portanto, sobre a seqüência de aminoácidos das proteínas correspondentes. Além disso, o número de sequências geradas para cada mRNA pode ser estimado e é proporcional à sua abundância. Portanto, os níveis de expressão gênica podem ser determinados e comparados com os de outras amostras, incluindo possíveis amostras de controle (Tabela 4). Outra vantagem específica do sequenciamento do mRNA é que ele permite o estudo de eventos alternativos de emenda.36,37 Como mencionado anteriormente, as transcrições primárias são freqüentemente processadas de múltiplas formas para dar origem ao mRNA que contém diferentes exons (Figura 1). Estes mRNAs podem ser identificados pelo sequenciamento de mRNA e não pelo sequenciamento do exoma ou genoma, que determina o sequenciamento do DNA a ser transcrito e não o da transcrição madura. Caso contrário, o mRNA e o sequenciamento de exomas fornecem informações semelhantes sobre a região codificadora de proteínas do genoma. A diferença é que o sequenciamento do exoma inclui todos os genes e o sequenciamento do mRNA é restrito aos genes expressos na amostra analisada. Por exemplo, um estudo recente de seqüenciamento do mRNA de linhas de células linfoblastóides de 462 indivíduos determinou a seqüência codificadora de cerca de 13.000 genes dos 20.078 genes humanos.38 Neste exemplo, cerca de 7.000 genes não foram estudados porque não foram expressos em linhas de células linfoblastóides. Entretanto, nos casos em que o tipo celular ou tecido afetado por uma determinada doença é bem conhecido, o sequenciamento do mRNA seria equivalente ao sequenciamento do exoma para o estudo das mutações do condutor. Outra característica do sequenciamento do mRNA é que ele permite a detecção de variações de sequência produzidas pela edição do RNA.39 Vários mRNAs são processados para que alguns nucleotídeos sejam alterados, e adenosina para inosina é a alteração mais frequentemente produzida. Estas alterações são detectadas pelo sequenciamento de mRNA, mas se são produzidas pela edição de RNA ou como consequência de variações genômicas não podem ser determinadas a menos que tanto o mRNA quanto as sequências genômicas sejam comparados.

Determinar os níveis de expressão do mRNA pode ser muito conveniente em certos casos, uma vez que algumas doenças podem ser causadas pela expressão desregulada de um ou mais genes. Mudanças nos níveis de expressão podem ser muito informativas sobre a origem genética da doença. Por exemplo, alterações na expressão de um ou mais genes em um paciente podem indicar uma disfunção nos mecanismos que regulam a sua expressão. Esta disfunção pode ser devida a mutações nas regiões reguladoras da transcrição genética, como discutido na seção de seqüenciamento genômico. Também pode ser devido a alterações na expressão ou estrutura dos fatores reguladores da transcrição.40 Alterações na expressão gênica são freqüentemente devidas a alterações nos mecanismos epigenéticos de regulação da expressão gênica, como a metilação do DNA, que não podem ser detectadas pelo genoma ou seqüenciamento exógeno.41 Métodos para o estudo da metilação do genoma inteiro que permitem o estudo detalhado dessa informação epigenética foram desenvolvidos recentemente.42 O câncer é uma das doenças nas quais mais estudos nos níveis de expressão gênica foram realizados. Em um número crescente de casos, alterações na expressão de genes ou de um grupo de genes estão relacionadas a um diagnóstico, prognóstico ou previsão da resposta a drogas anticancerígenas.43 Essas alterações na expressão gênica estão sendo usadas como biomarcadores. Muitos destes estudos estão disponíveis através da base de dados do Cancer Genome Anatomy Project (http://cgap.nci.nih.gov).

Um tipo específico de projeto de sequenciamento de RNA tem como objetivo determinar a sequência de nucleotídeos e níveis de expressão de pequenos RNAs regulatórios (miRNAs). Os pequenos RNAs regulam a expressão de outros genes determinando a estabilidade e/ou tradução de seus mRNAs (Figura 1). Mudanças nos padrões de expressão dos miRNA podem, portanto, ter um impacto marcante no perfil de expressão das proteínas das células e tecidos. Protocolos foram desenvolvidos para a purificação e sequenciamento da população completa de miRNAs de uma determinada amostra e para determinar seus níveis de expressão.44 A maioria das plataformas de ex-captura também incluem até 80% das regiões codificadoras de miRNAs conhecidas.21

Sequenciamento de conjuntos selecionados de genes

Algumas doenças já foram estudadas com tal detalhe que a maioria dos genes envolvidos são conhecidos. Este pode ser o caso de doenças com um padrão Mendeliano de herança, em que todos os casos estudados são devidos a mutações em qualquer um dos vários genes conhecidos. Outros exemplos são alguns tipos de câncer que são predominantemente devidos a mutações em um número reduzido de genes. Nesses casos, a abordagem mais direta para caracterizar a amostra de um paciente seria determinar a seqüência dos genes previamente identificados como causadores da doença. A abordagem clássica seria amplificar todos os exões desses genes e determinar a sequência nucleotídica de cada um deles. A abordagem alternativa de sequenciamento massivo seria purificar todas as regiões genômicas putativas envolvidas, e simultaneamente determinar sua seqüência nucleotídica em uma única execução.45-47 Dois métodos são geralmente usados para a purificação das regiões de DNA candidatas. O primeiro é sua amplificação por reações em cadeia da polimerase usando um conjunto de oligonucleotídeos específicos como primers. O segundo método consiste na fragmentação do DNA da amostra e a purificação dos fragmentos relevantes por hibridação para oligonucleotídeos específicos, em solução ou fixados a um suporte sólido, como descrito anteriormente para a purificação de exons.48 As regiões selecionadas podem conter exons codificadores de proteínas e também outras regiões de DNA, como regiões reguladoras de transcrição. Estas regiões geralmente correspondem a algumas centenas de genes e, portanto, a análise dos dados da seqüência gerada é muito mais fácil do que em outras abordagens de seqüenciamento massivo. A principal limitação é que esta é uma abordagem orientada por hipóteses que não permite a detecção de mutações em genes não anteriormente relacionados à doença estudada (Tabela 4).

Exemplos do uso clínico do sequenciamento de exomas

O uso mais comum do sequenciamento de exomas é provavelmente para o diagnóstico de doenças monogênicas. Mais de 3.000 doenças monogênicas já foram descritas, embora as causas genéticas moleculares da maioria delas ainda sejam desconhecidas.1 O seqüenciamento do exoma pode ser usado para identificar essas mutações, como discutido por Kuhlenbäumer et al1 em uma revisão recente. Em alguns dos primeiros estudos, o seqüenciamento do exoma foi usado para identificar mutações genéticas responsáveis por doenças familiares como a Kabuki’s,49 Schinzel-Giedion,50 Joubert,51 e síndromes de retardo mental por hiperfosfatase,52 malformações cerebrais graves,53 ou esclerose lateral amiotrófica familiar.54 O seqüenciamento do exoma também tem sido usado para descobrir novas mutações presentes em um caso esporádico de retardo mental.29 Além disso, essa técnica tem sido utilizada para o diagnóstico, por exemplo, de diarréia com cloreto congênito,55 doença inflamatória intestinal,56 doença de Charcot-Marie-Tooth,57 diabetes mellitus neonatal,58 ou a síndrome de Brown-Vialetto-van Laere.59 O estudo relatado por Worthey et al56 representa um exemplo relevante da aplicação clínica do seqüenciamento de exomos. Uma criança do sexo masculino apresentou uma doença semelhante à de Crohn sem um diagnóstico definitivo, apesar de uma avaliação clínica abrangente. Os autores decidiram utilizar uma abordagem de seqüenciamento de exomos para identificar a(s) mutação(ões) causadora(s). Análise dos dados da sequência detectada 16.124 variantes no paciente. A filtração dos dados ao considerar novas variantes presentes na homozigosidade, hemizigosidade ou heterozigosidade composta, e ao mesmo tempo em que afeta resíduos de aminoácidos altamente conservados, previstos como prejudiciais à função protéica, permitiu aos autores selecionar uma mutação no inibidor ligado ao X do gene da apoptose (XIAP). Estudos funcionais demonstraram a relevância desta mutação na resposta pró-inflamatória observada no paciente. Com base na identificação desta mutação, foi realizado um transplante de células hematopoiéticas progenitoras alogênicas. Portanto, o sequenciamento exoma permitiu a identificação de uma mutação não caracterizada para fazer o diagnóstico molecular de um paciente individual, no contexto de uma nova doença, o que resultou em um plano de manejo. O uso do sequenciamento exoma na descoberta de novas mutações causais e no diagnóstico foi recentemente revisto.60,61

O estudo de doenças comuns e complexas também foi abordado através do sequenciamento exoma. Estudos de associações genômicas mostraram que algumas variantes genéticas conferem risco para uma série de doenças. Exemplos bem caracterizados são a apolipoproteína E na doença de Alzheimer, o fator complementar H na degeneração macular ou a glucocerebrosidase/leucine rich repeat kinase 2 na doença de Parkinson.62-64 O possível uso do seqüenciamento exoma para o estudo de doenças complexas tem sido discutido.2,28 Uma limitação do uso de sequenciamento de exomas nestes estudos é que a maioria das variantes fenotípicas associadas ao fenótipo são distais às regiões codificadoras de proteínas, o que faria do sequenciamento de genes inteiros uma melhor abordagem.32 Algumas destas variantes genéticas podem afetar a funcionalidade das regiões reguladoras de transcrição que controlam a expressão gênica. O projeto ENCODE31,65 realizou uma análise genômica dessas regiões reguladoras e constatou-se que várias variantes genéticas em regiões específicas do cromossomo 5 (por exemplo) são locais de ligação para o fator de transcrição, GATA2, que estão fortemente associadas à doença de Crohn e outras doenças inflamatórias.

Cancers são doenças causadas pelo acúmulo de alterações genômicas que resultam na alteração de múltiplos processos biológicos.19 Em contraste com as alterações genéticas monogênicas discutidas anteriormente, a maioria das mutações causadoras de câncer não está presente no tecido normal do paciente; uma grande proporção dessas mutações reside em regiões codificadoras de proteínas e pode ser detectada pelo seqüenciamento exógeno.19 Entretanto, outro grupo importante de alterações genéticas são grandes reorganizações genômicas como deleções, inversões ou translocações que não podem ser detectadas pelo seqüenciamento do exoma.66 Apesar desta limitação, o seqüenciamento do exoma tem sido aplicado à descoberta de genes causadores de câncer usando duas estratégias gerais: a comparação do exoma dos tumores com o dos tecidos saudáveis do mesmo paciente; ou a comparação de um número de exomas de pacientes não relacionados com o de um número similar de controles saudáveis.67-70 Atualmente, estão sendo realizados extensos estudos que envolvem o exoma ou seqüenciamento do genoma de uma grande coorte de pacientes com câncer e controles para identificar todos os genes causadores do câncer.19,71,72 O projeto de 5.000 genomas cancerígenos é um exemplo,73 pois visa seqüenciar o genoma de 50 dos tipos mais comuns de câncer. Os dados disponíveis já forneceram um panorama genômico geral dos cânceres mais comuns, conforme revisto por Vogelstein et al.3 Cerca de 140 genes foram identificados que promovem a tumorigenese quando alterados, e isto pode ser encontrado na base de dados COSMIC anteriormente mencionada.3 A detecção da mutação de um destes genes no exoma de uma amostra de câncer pode ser um passo importante para o diagnóstico e tratamento adequado do paciente. Os dados atuais também dão uma idéia da complexidade do genoma do câncer.3 Tumores sólidos comuns apresentam um número médio de 33 a 66 mutações somáticas não-silenciosas.3 Este número aumenta para mais de 200 em tumores induzidos por agentes mutagênicos, como câncer de pulmão e melanoma, e até mais de 1.000 em tumores deficientes nos mecanismos de reparação do DNA ou na DNA polimerase E.3 Em contraste, tumores líquidos e pediátricos apresentam menos de dez mutações somáticas.3 Uma característica importante dos tumores é que eles evoluem rapidamente e se tornam heterogêneos, de modo que diferentes mutações podem ser encontradas em amostras do mesmo paciente coletadas em diferentes regiões ou em diferentes períodos de tempo ao longo do tratamento, como mostrado recentemente pelo seqüenciamento de exomas.74,75 Apesar desta complexidade, alguns conceitos unificadores estão surgindo, e a maioria dos genes conhecidos de driver do câncer participa de uma ou mais das 12 vias que regulam a sobrevivência celular, destino celular e manutenção do genoma.3,19 Neste cenário, o seqüenciamento de exomas está começando a ser usado para diagnóstico do câncer através da identificação de mutações do driver, por exemplo, no câncer de próstata.76

O seqüenciamento de exomas também pode ser útil para o tratamento do câncer. A presença de algumas mutações genéticas pode conferir sensibilidade ou resistência a um determinado medicamento, que foi denominado farmacogenómica. Por exemplo, o uso de inibidores de proteína tirosina quinase em cancros que superexpressam as proteínas abelson murine oncogene homólogo 1 (ABL) ou receptor de fator de crescimento epidérmico (EGFR) é conhecido há vários anos. Entretanto, as abordagens de exoma e seqüenciamento genômico estão revelando muito mais respostas de mutação às associações de tratamento (como destacado em uma revisão77). Um exemplo informativo é a recente publicação do exoma do painel de células NCI-60.78 Este painel contém 60 linhas celulares bem caracterizadas de nove tipos de câncer e tem sido usado em uma ampla gama de estudos biológicos e farmacológicos.79 A sequência nucleotídica do exoma destas células foi determinada para estabelecer os genes causadores de câncer mutantes em cada uma delas. Além de fornecer uma lista de supostos novos genes cancerígenos, os autores estudaram a possível correlação entre o genótipo de cada linha celular e a resposta previamente determinada a um grande número de agentes anticancerígenos. Foi encontrada uma correlação entre mutações de genes específicos e a resposta a vários medicamentos, revelando a possível importância do sequenciamento exógeno na seleção de um tratamento personalizado. O sequenciamento de exomas também pode ser usado para prever a predisposição para o câncer. Alguns exemplos podem ser encontrados em uma revisão recente centrada no câncer colorretal e usando o seqüenciamento do genoma inteiro.72

Desafios médicos do seqüenciamento do exoma

O seqüenciamento do exoma promete melhorias significativas nos diagnósticos, prognósticos e tratamentos personalizados dos pacientes. Entretanto, a aplicação extensa desta tecnologia ainda requer uma série de melhorias, bem como a definição de importantes considerações éticas e médicas, como tem sido discutido em revisões recentes.23,27,60,61,71,77 Os desafios técnicos incluem o desenvolvimento de técnicas mais eficientes de captura, sequenciamento e alinhamento de exons para obter uma representação completa e uniforme de todos os exons na sequência. Também são necessárias melhorias nas ferramentas do software de análise de dados para a detecção rápida e precisa de variantes patológicas. Um extenso sequenciamento de exons exigirá a implementação de equipamentos especializados e a contratação de equipes de especialistas com a expertise adequada para gerar as sequências e analisar e interpretar os dados obtidos.

O uso do sequenciamento de exons para diagnóstico também exigirá a implementação de diretrizes e regulamentos técnicos. Parâmetros como profundidade do sequenciamento, cobertura exon, métricas de qualidade para dados de sequências de nucleotídeos, ou chamadas de alinhamento terão que ser normalizados. O armazenamento de dados também deve ser regulamentado.

Há também uma série de questões éticas complexas. Uma questão importante está relacionada com as informações que devem ser fornecidas ao paciente. O sequenciamento de exomas pode detectar variações genéticas que não estão relacionadas com a doença em diagnóstico. O paciente pode apresentar variantes genéticas que representam fatores de risco ou que podem ser causadoras de outras doenças. Que informação deve ser devolvida ao paciente? Quais seriam as evidências necessárias para considerar uma variante genética ligada a uma doença? A propriedade, acesso e armazenamento dos dados são outras questões relevantes. Os dados gerados devem ser mantidos para uma possível utilização futura durante a vida do paciente? Essas e outras considerações éticas provavelmente levantarão considerável controvérsia80 e exigirão ampla discussão para se chegar a um acordo sobre os critérios a serem usados na prática clínica.

Conclusão

Exome sequencing já é uma ferramenta poderosa usada para determinar a base molecular de doenças genéticas. A profundidade da análise genética é menor que a do sequenciamento de todo o genoma, uma vez que não são detectadas variações genéticas em regiões não-codificadoras de proteínas. No entanto, o número reduzido de sequências e análises sequenciais necessárias para a sequenciação de exomas torna-a uma abordagem mais acessível na prática clínica. Portanto, o sequenciamento de exomas será provavelmente a técnica de escolha para a análise inicial dos pacientes, pelo menos até que o preço do sequenciamento do genoma inteiro diminua e o considerável procedimento de análise de dados seja melhorado. Uma limitação importante da aplicação do sequenciamento de exomas na prática clínica é que o significado funcional da maioria das variantes genéticas esperadas ainda é desconhecido. Esta situação está a mudar rapidamente, uma vez que um número crescente de variantes genéticas associadas à doença são determinadas e disponibilizadas em bases de dados públicas. É plausível que em poucos anos, a maioria das variações genéticas relacionadas com o risco de adquirir uma doença, com diagnósticos moleculares precisos, uma previsão da evolução da doença e uma resposta farmacológica, serão conhecidas. O conhecimento preciso do exoma, ou genoma, do paciente será então um fator determinante na prática médica.

Agradecimentos

Agradeço a Rosario Perona e Juliette Siegfried (ServingEdit.com) pela revisão crítica do manuscrito.

Divulgação

A autora não relata conflitos de interesse neste trabalho.

Kuhlenbäumer G, Hullmann J, Appenzeller S. Novel genomic techniques open new avenues in the analysis of monogenic disorders. Hum Mutat. 2011;32(2):144-151.

Kiezun A, Garimella K, Do R, et al. Sequenciamento de exomas e a base genética de traços complexos. Nat Genet. 2012;44(6):623-630.

Vogelstein B, Papadopoulos N, Velculescu VE, Zhou S, Diaz LA Jr, Kinzler KW. Paisagens do genoma cancerígeno. Ciência. 2013;339(6127):1546-1558.

Kirwan M, Dokal I. Disqueratose congênita: uma desordem genética de muitas faces. Clin Genet. 2008;73(2):103-112.

Walne AJ, Dokal I. Avanços na compreensão da disqueratose congênita. Br J Haematol. 2009;145(2):164-172.

Brady PD, Vermeesch JR. Genomic microarrays: uma visão geral da tecnologia. Diagnóstico Prenat. 2012;32(4):336-343.

Hehir-Kwa JY, Pfundt R, Veltman JA, de Leeuw N. Pathogenic ou não? Avaliando a relevância clínica das variantes do número de cópias. Clin Genet. 2013;84(5):415-421.

Simons A, Sikkema-Raddatz B, de Leeuw N, Konrad NC, Hastings RJ, Schoumans J. Genome-wide arrays in routine diagnostics of hematological malignancies. Hum Mutat. 2012;33(6):941-948.

Metzker ML. Tecnologias de sequenciação – a próxima geração. Nat Rev Genet. 2010;11(1):31-46.

Sastre L. Novas tecnologias de sequenciamento de DNA abrem uma era promissora para a pesquisa e tratamento do câncer. Clin Transl Oncol. 2011;13(5):301-306.

Lander ES, Linton LM, Birren B, et al. International Human Genome Sequencing Consortium. Sequenciamento e análise inicial do genoma humano. Natureza. 2001;409(6822):860-921.

Abecasis GR, Auton A, Brooks LD, et al. 1000 Genomes Project Consortium. Um mapa integrado de variação genética a partir de 1.092 genomas humanos. Natureza. 2012;491(7422):56-65.

Yang Y, Liu R, Xie H, et al. Avanços na tecnologia de sequenciamento de nanoporos. J Nanotecnol Nanosci. 2013;13(7):4521-4538.

Chen YS, Lee CH, Hung MY, Pan HA, Chiou JC, Huang GS. Sequenciamento de DNA usando medidas de condutância elétrica de uma DNA polimerase. Nat Nanotechnol. 2013;8(6):452-458.

Lu ZX, Jiang P, Xing Ying. Variação genética de emendas alternativas pré-RNA em populações humanas. Wiley Interdiscip Rev RNA. 2012;3(4):581-592.

Pruitt KD, Harrow J, Harte RA, et al. The consensus coding sequence (CCDS) project: Identificando um conjunto de genes codificadores de proteínas comuns para os genomas humano e do rato. Genoma Res. 2009;19(7):1316-1323.

Harrow J, Frankish A, Gonzalez JM, et al. GENCODE: a anotação do genoma humano de referência para o Projeto ENCODE. Genoma Res. 2012;22(9):1760-1774.

Teer JK, Mullikin JC. Sequenciamento de exomas: o ponto doce antes de genomas inteiros. Hum Mol Genet. 2010;19(R2):R145-R151.

Liu X, Wang J, Chen L. Sequenciação de todo o exoma revela redes de mutação somática recorrente no cancro. Cancer Lett. 2013;340(2):270-276.

Parla JS, Iossifov I, Grabill I, Spector MS, Kramer M, McCombie WR. Uma análise comparativa da captura de exomas. Genome Biol. 2011; 12(9):R97.

Sulonen AM, Ellonen P, Almusa H, et al. Comparação de métodos de captura de exomas baseados em soluções para sequenciamento da próxima geração. Genome Biol. 2011;12(9):R94.

Clark MJ, Chen R, Lam HY, et al. Comparação de desempenho de tecnologias de sequenciação de DNA exoma. Nat Biotechnol. 2011;29(10):908-914.

Gullapalli RR, Desai KV, Santana-Santos L, Kant JA, Becich MJ. Sequenciamento de próxima geração em medicina clínica: Desafios e lições de patologia e informática biomédica. J Pathol Inform. 2012;3:40.

Samuels DC, Han L, Li J, et al. Encontrar os tesouros perdidos em dados de sequenciação exome. Tendências Genet. 2013;29(10):593-599.

Taneri B, Asilmaz E, Gaasterland T. Impacto biomédico das mutações de emendas reveladas através do seqüenciamento de exomas. Mol Med. 2012;18:314-319.

Fu W, O’Connor TD, Jun G, et al; NHLBI Exome Sequencing Project. A análise de 6.515 exomos revela a origem recente da maioria das variantes codificadoras de proteínas humanas. Natureza. 2013;493(7431):216-220.

Marian AJ. Desafios em aplicações médicas de descobertas de seqüenciamento de exomas/genomas inteiros. Tendências Cardiovasc Med. 2012;22(8):219-223.

Singleton AB. Exome sequencing: uma tecnologia transformadora. Lancet Neurol. 2011;10(10):942-946.

Vissers LE, de Ligt J, Gilissen C, et al. A de novo paradigma para o retardamento mental. Nat Genet. 2010;42(12):1109-1112.

Gonzalez-Perez A, Perez-Llamas C, Deu-Pons J, et al. IntOGen-mutations identifica os condutores de cancro através dos tipos de tumor. Métodos Nat. 2013;10(11):1081-1082.

Bernstein BE, Birney E, Dunham I, Green ED, Gunter C, Snyder M; ENCODE Project Consortium. Uma enciclopédia integrada de elementos de DNA no genoma humano. Natureza. 2012;489(7414):57-74.

Hardison RC. Dados epigenéticos genómicos facilitam a compreensão dos estudos de associação de susceptibilidade a doenças. J Biol Chem. 2012;287(37):30932-30940.

Weedon MN, Cebola I, Patch AM, et al. International Pancreatic Agenesis Consortium. Mutações recessivas em um PTF1A distal aumentam a causa da agenesia pancreática isolada. Nat Genet. 2014;46(1):61-64.

Wang Z, Gerstein M, Snyder M. RNA-Seq: uma ferramenta revolucionária para a transcriptômica. Nat Rev Genet. 2009;10(1):57-63.

Mutz KO, Heilkenbrinker A, Lönne M, Walter JG, Stahl F. Transcriptome analysis using next-generation sequencing. Curr Opinião Biotecnol. 2013;24(1):22-30.

Hitzemann R, Bottomly D, Darakjian P, et al. Genes, behavior and next-generation RNA sequencing. Genes Comportamento Cerebral. 2013;12(1):1-12.

Costa V, Aprile M, Esposito R, Ciccodicola A. RNA-Seq e doenças do complexo humano: realizações recentes e perspectivas futuras. Eur J Hum Genet. 2013;21(2):134-142.

Lappalainen T, Sammeth M, Friedländer MR, et al; Geuvadis Consortium; Geuvadis Consortium. Transcriptoma e sequenciação do genoma descobrem variação funcional em humanos. Natureza. 2013; 501(7468):506-511.

Slotkin W, Nishikura K. Edição de RNA Adenosina-a-inosina e doença humana. Genoma Med. 2013;5:105.

Lee TI, Young RA. Transcriptional regulation and its misregulation in disease. Célula. 2013;152(6):1237-1251.

Suvà ML, Riggi N, Bernstein BE. Reprogramação epigenética no câncer. Ciência. 2013;339(6127):1567-1570.

Li P, Demirci F, Mahalingam G, Demirci C, Nakano M, Meyers BC. Um fluxo de trabalho integrado para análise da metilação do DNA. J Genet Genomics. 2013;40(5):249-260.

Chibon F. Assinaturas de expressão do gene do cancro – a ascensão e a queda? Eur J Cancer. 2013;49:2000-2009.

Dedeoğlu BG. Abordagens de alto rendimento para análise da expressão do microRNA. Métodos Mol Biol. 2014;1107:91-103.

Ni T, Wu H, Song S, Jelley M, Zhu J. Amplificação seletiva de genes para seqüenciamento de alto rendimento. Seq. Gene Pat DNA Recente. 2009; 3(1):29-38.

Barretina J, Caponigro G, Stransky N, et al. A Enciclopédia da Linha Câncer permite a modelação preditiva da sensibilidade aos medicamentos anticancerígenos. Natureza. 2012;483(7391):603-607.

Garnett MJ, Edelman EJ, Heidorn SJ, et al. Identificação sistemática de marcadores genómicos da sensibilidade às drogas nas células cancerígenas. Natureza. 2012;483(7391):570-575.

Hoischen A, Gilissen C, Arts P, et al. Sequenciamento maciçamente paralelo de genes de ataxia após enriquecimento baseado em array. Hum Mutat. 2010;31(4):494-499.

Ng SB, Bigham AW, Buckingham KJ, et al. O sequenciamento de Exome identifica as mutações MLL2 como uma causa da síndrome de Kabuki. Nat Genet. 2010;42(9):790-793.

Hoischen A, van Bon BW, Gilissen C, et al. De novo mutações do SETBP1 causam a síndrome de Schinzel-Giedion. Nat Genet. 2010;42(6):483-485.

Edvardson S, Shaag A, Zenvirt S, et al. A síndrome de Joubert 2 (JBTS2) nos judeus Ashkenazi está associada a uma mutação TMEM216. Am J Hum Genet. 2010;86(1):93-97.

Krawitz PM, Schweiger MR, Rödelsperger C, et al. A filtragem identidade por declive dos dados da sequência de exoma identifica mutações PIGV na síndrome de hiperfosfatase mental retardada. Nat Genet. 2010;42(10):827-829.

Bilgüvar K, Oztürk AK, Louvi A, et al. Whole-exome sequencing identifies recessive WDR62 mutations in severe brain malformations. Natureza. 2010;467(7312):207-210.

Johnson JO, Mandrioli J, Benatar M, et al. ITALSGEN Consortium. O sequenciamento de exomas revela mutações VCP como uma causa de ALS familiar. Neurônio. 2010;68(5):857-864.

Choi M, Scholl UI, Ji W, et al. Genetic diagnosis by whole exome capture and massively parallel DNA sequencing. Proc Natl Acad Scien U S A. 2009;106(45):19096-19101.

Worthey EA, Mayer AN, Syverson GD, et al. Fazendo um diagnóstico definitivo: aplicação clínica bem sucedida da sequência de exomas inteiros em uma criança com doença inflamatória intestinal intratável. Genet Med. 2011;13(3):255-262.

Montenegro G, Powell E, Huang J, et al. O sequenciamento do exoma permite a rápida identificação do gene em uma família Charcot-Marie-Tooth. Ann Neurol. 2011;69(3):464-470.

Bonnefond A, Durand E, Sand O, et al. Diagnóstico molecular de diabetes mellitus neonatal usando sequenciação de próxima geração de todo o exoma. PLoS Um. 2010;5(10):e13630.

Johnson JO, Gibbs JR, Van Maldergem L, Houlden H, Singleton AB. Sequenciamento de exomas na síndrome de Brown-Vialetto-van Laere. Am J Hum Genet. 2010;87(4):567-9; resposta do autor 569.

Bras JM, Singleton AB. Sequenciamento de Exome na doença de Parkinson. Clin Genet. 2011;80(2):104-109.

>

Sequenciamento de Topper S, Ober C, Das S. Exome e a genética da deficiência intelectual. Clin Genet. 2011;80(2):117-126.

>

Corder EH, Saunders AM, Strittmatter WJ, et al. Gene dose de apolipoproteína E tipo 4 alelo e o risco de doença de Alzheimer em famílias de início tardio. Ciência. 1993;261(5123):921-923.

Klein RJ, Zeiss C, Chew EY, et al. Complementar fator H polimorfismo na degeneração macular relacionada à idade. Ciência. 2005;308(5720):385-389.

Tan EK. Identificação de uma variante de risco genético comum (LRRK2 Gly2385Arg) na doença de Parkinson. Ann Acad Med Singapura. 2006;35(11):840-842.

Libioulle C, Louis E, Hansoul S, et al. Novel Crohn disease locus identified by genome-wide association maps to a gene desert on 5p13.1 and modulates expression of PTGER4. PLoS Genet. 2007;3(4):e58.

Stephens PJ, Greenman CD, Fu B, et al. Reorganização genômica maciça adquirida em um único evento catastrófico durante o desenvolvimento do câncer. Célula. 2011;144(1):27-40.

Jones S, Zhang X, Parsons DW, et al. Caminhos centrais de sinalização em cancros pancreáticos humanos revelados por análises genómicas globais. Ciência. 2008;321(5897):1801-1806.

Parsons DW, Jones S, Zhang X, et al. Uma análise genómica integrada do glioblastoma multiforme humano. Ciência. 2008;321(5897):1807-1812.

Timmermann B, Kerick M, Roehr C, et al. Perfis de mutação somáticos de câncer colorretal de MSI e MSS identificados por sequenciamento de toda a próxima geração e análise bioinformática. PLoS Um. 2010;5(12):e15661.

Varela I, Tarpey P, Raine K, et al. O sequenciamento de exomas identifica a mutação frequente do gene complexo SWI/SNF PBRM1 no carcinoma renal. Natureza. 2011;469(7331):539-542.

Ku CS, Cooper DN, Roukos DH. Relevância clínica da sequenciação do genoma do cancro. Mundo J Gastroenterol. 2013;19(13):2011–2018.

Kilpivaara O, Aaltonen LA. Sequenciamento genético diagnóstico do câncer e a contribuição de variantes da linha germinal. Ciência. 2013;339(6127):1559-1562.

Hudson TJ, Anderson W, Artez A, et al; International Cancer Genome Consortium. Rede internacional de projetos de genoma cancerígeno. Natureza. 2010;464(7291):993-998.

Gerlinger M, Rowan AJ, Horswell S, et al. Heterogeneidade do Intratumor e evolução ramificada revelada por sequenciação multi-regiões. N Engl J Med. 2012;366(10):883-892.

Ren SC, Qu M, Sun YH. Investigando a heterogeneidade intratumoral por seqüenciamento de célula única. Asiático J Androl. 2013;15(6):729-734.

Hieronymus H, Sawyers CL. Traversing the genomic landscape of prostate cancer from diagnosis to death (Atravessando o cenário genômico do câncer de próstata desde o diagnóstico até a morte). Nat Genet. 2012;44(6):613-614.

McLeod HL. Farmacogenómica do cancro: promessa precoce, mas é necessário um esforço concertado. Ciência. 2013;339(6127):1563-1566.

Abaan OD, Polley EC, Davis SR, et al. The exomes of the NCI-60 panel: a genomic resource for cancer biology and systems pharmacology. Cancer Res. 2013;73(14):4372-4382.

Weinstein JN. Descoberta de drogas: As linhas celulares combatem o cancro. A natureza. 2012;483:544-545.

Shahmirzadi L, Chao EC, Palmaer E, Parra MC, Tang S, Gonzalez KD. Decisões dos pacientes para revelação de achados secundários entre os 200 primeiros indivíduos submetidos ao seqüenciamento de exomos para diagnóstico clínico. Genet Med. Epub October 10, 2013.

Flicek P, Amode MR, Barrell D, et al. Ensembl 2011. Nucleic Acids Res. 2011;39:D800-D806.

Pruitt KD, Tatusova T, Klimke W, Maglott DR. NCBI Reference Sequences: status atual, política e novas iniciativas. Res. Ácidos Nucleicos 2009;37:D32-D36.

Deixe uma resposta

O seu endereço de email não será publicado.