Perguntas & Respostas
A seguir, encontra-se a dúvida que não foi respondida durante o Encontro Online.
Enriquecimento, no contexto do sequenciamento de nova geração (NGS), refere-se a técnicas utilizadas para selecionar regiões específicas do genoma antes do sequenciamento. Isso é feito para aumentar a cobertura e a profundidade de leitura dessas regiões de interesse, reduzindo os custos e a complexidade computacional associados ao sequenciamento de genomas inteiros.
Normalmente, o termo enriquecimento é utilizado para a estratégia de Captura por Hibridização, que emprega sondas oligonucleotídicas biotiniladas complementares às regiões-alvo de interesse no genoma. Essas sondas hibridizam com as sequências de interesse, que são então isoladas usando esferas revestidas com estreptavidina. Essa técnica permite a captura de regiões flanqueadoras, mas pode também isolar regiões não desejadas, reduzindo a cobertura nas regiões de interesse.
O processo de enriquecimento gera uma métrica que pode ser avaliada durante o sequenciamento: a proporção de sequências que correspondem às regiões-alvo em relação ao total de sequências geradas. Normalmente, esse valor fica em torno de 70% a 85%. Por exemplo, um enriquecimento de 80% indica que 80% das sequências geradas correspondem às regiões que se pretendia capturar, enquanto os outros 20% são de regiões não-alvo.
Como o processo não é perfeito, sempre haverá uma porcentagem de sequências fora do interesse (off-target). Quanto maior o enriquecimento, mais otimizado é o sequenciamento, pois maximiza a cobertura das regiões de interesse e minimiza a geração de dados irrelevantes. Isso resulta em uma análise mais eficiente e econômica, permitindo uma detecção mais precisa de variantes genéticas nas regiões estudadas.
Referências (questão 1):
Guidelines for Validation of Next-Generation Sequencing-Based Oncology Panels: A Joint Consensus Recommendation of the Association for Molecular Pathology and College of American Pathologists. Jennings LJ, Arcila ME, Corless C, et al. The Journal of Molecular Diagnostics. 2017;19(3):341-365. doi:10.1016/j.jmoldx.2017.01.011.
Comparison of Three Targeted Enrichment Strategies on the SOLiD Sequencing Platform.
Hedges DJ, Guettouche T, Yang S, et al. PLoS One. 2011;6(4).doi:10.1371/journal.pone.0018595.
Não necessariamente. A metagenômica envolve o sequenciamento massivo e não direcionado do material genético presente em uma amostra, permitindo a identificação e análise de todos os micro-organismos ou componentes genéticos presentes, sem a necessidade de cultivo ou conhecimento prévio. Embora seja frequentemente associada a amostras ambientais, a metagenômica também é amplamente aplicada em amostras clínicas, como plasma e líquido cefalorraquidiano (líquor), para a detecção de vírus desconhecidos ou outros patógenos.
Exemplos de metagenômica em amostras clínicas:
- Metagenômica do plasma ou líquido cefalorraquidiano: Utilizada para identificar vírus, bactérias ou outros patógenos desconhecidos em pacientes com infecções de origem indeterminada.
- Análises de microbiomas humanos: Estudos que investigam a composição das comunidades microbianas no intestino, pele, boca e outras partes do corpo, relacionando-as com doenças ou estados de saúde.
A metagenômica pode ser considerada um sequenciamento sem premissas, onde não se direciona a análise para um organismo ou gene específico. Em vez disso, o objetivo é obter uma visão abrangente do material genético presente na amostra, permitindo que os dados revelem quais organismos ou sequências estão presentes.
Por outro lado, quando se sequencia um gene específico usando NGS, geralmente está se realizando um sequenciamento direcionado ou amplicon, focado em uma região particular do genoma. Esse método requer conhecimento prévio sobre o gene ou organismo de interesse e não é considerado metagenômica, pois não fornece informações sobre outros organismos ou sequências presentes na amostra.
Portanto, para ser considerada uma análise metagenômica, o sequenciamento deve ser abrangente e não direcionado, permitindo a identificação de múltiplos organismos ou componentes genéticos sem premissas prévias. Sequenciar apenas um gene específico não caracteriza uma abordagem metagenômica.
Referências (questão 2):
Advances in Metagenomics and Its Application in Environmental Microorganisms.
Zhang L, Chen F, Zeng Z, et al. Frontiers in Microbiology. 2021;12:766364. doi:10.3389/fmicb.2021.766364.
From Genomics to Metagenomics in the Era of Recent Sequencing Technologies.
Benz S, Mitra S. Methods in Molecular Biology. 2023;2649:1-20. doi:10.1007/978-1-0716-3072-3_1.
STROBE-metagenomics: A STROBE Extension Statement to Guide the Reporting of Metagenomics Studies. Bharucha T, Oeser C, Balloux F, et al. The Lancet Infectious Diseases. 2020;20(10). doi:10.1016/S1473-3099(20)30199-7.
Recent Advances in Metagenomic Approaches, Applications, and Challenges.
Lema NK, Gemeda MT, Woldesemayat AA. Current Microbiology. 2023;80(11):347. doi:10.1007/s00284-023-03451-5.
Metagenomic Data Assembly – The Way of Decoding Unknown Microorganisms.
Lapidus AL, Korobeynikov AI. Frontiers in Microbiology. 2021;12:613791. doi:10.3389/fmicb.2021.613791.
What Is Metagenomics Teaching Us, and What Is Missed? New FN, Brito IL. Annual Review of Microbiology. 2020;74:117-135. Doi:10.1146/annurev-micro-012520-072314.
Regiões de baixa cobertura em resultados de sequenciamento de nova geração (NGS) podem ser causadas por diversos fatores, conforme evidenciado na literatura médica:
- Composição da sequência, especialmente o conteúdo de GC (Guanina/Citosina):
Regiões ricas em GC são notoriamente difíceis de sequenciar e frequentemente resultam em baixa cobertura, menor qualidade de base e dificuldades no mapeamento, além de alto viés de fita, comprometendo a sensibilidade na detecção de variantes.
Elementos repetitivos e duplicações segmentares também estão associados a regiões de baixa cobertura.
- Metodologia de preparação da biblioteca:
A forma como a biblioteca de sequenciamento é preparada pode influenciar significativamente a cobertura.
Certos kits de preparação de biblioteca estão associados a um viés de cobertura dependente do conteúdo de GC, especialmente em espécies bacterianas com baixo conteúdo de GC.
Métodos de fragmentação de DNA, como a sonicação, podem introduzir vieses não aleatórios que afetam a uniformidade da cobertura.
- Limitação de mapeabilidade de leituras curtas:
A dificuldade em mapear leituras curtas em regiões específicas do genoma pode resultar em cobertura não uniforme.
Isso pode ser um problema significativo em plataformas de sequenciamento de exoma (WES) e genoma completo (WGS), onde a complexidade do genoma pode dificultar o alinhamento preciso das leituras.
- Qualidade e quantidade do ácido nucleico inicial:
Ácidos nucleicos de baixa qualidade ou quantidade insuficiente podem levar a uma cobertura inadequada.
Eficiência dos métodos de captura e amplificação:
O viés de amplificação é uma limitação conhecida em abordagens baseadas em amplicons de PCR, o que pode resultar em desempenho inferior de certos amplicons.
Portanto, a baixa cobertura em NGS pode ser atribuída a uma combinação de fatores relacionados à composição da sequência, métodos de preparação da biblioteca, mapeabilidade das leituras, qualidade do ácido nucleico e eficiência dos métodos de captura e amplificação.
Referências ( questão 3):
Standards and Guidelines for Validating Next-Generation Sequencing Bioinformatics Pipelines: A Joint Recommendation of the Association for Molecular Pathology and the College of American Pathologists. Roy S, Coldren C, Karunamurthy A, et al. The Journal of Molecular Diagnostics. 2018;20(1):4-27. doi:10.1016/j.jmoldx.2017.11.003.
Coverage Analysis in a Targeted Amplicon-Based Next-Generation Sequencing Panel for Myeloid Neoplasms. Yan B, Hu Y, Ng C, et al. Journal of Clinical Pathology. 2016;69(9):801-804. doi:10.1136/jclinpath-2015-203580.
The Efficiency of Tagmentation Depends on G and C Bases in the Binding Motif Leading to Uneven Coverage in Bacterial Species With Low and Neutral GC-content. Segerman B, Ástvaldsson Á, Mustafa L, Skarin J, Skarin H. Frontiers in Microbiology. 2022;13:944770. doi:10.3389/fmicb.2022.944770.
Novel Metrics to Measure Coverage in Whole Exome Sequencing Datasets Reveal Local and Global Non-Uniformity. Wang Q, Shashikant CS, Jensen M, Altman NS, Girirajan S.
Scientific Reports. 2017;7(1):885. doi:10.1038/s41598-017-01005-x.
Non-Random DNA Fragmentation in Next-Generation Sequencing. Poptsova MS, Il’icheva IA, Nechipurenko DY, et al. Scientific Reports. 2014;4:4532. doi:10.1038/srep04532.
Systematic Dissection of Biases in Whole-Exome and Whole-Genome Sequencing Reveals Major Determinants of Coding Sequence Coverage. Barbitoff YA, Polev DE, Glotov AS, et al. Scientific Reports. 2020;10(1):2057. doi:10.1038/s41598-020-59026-y.
Conforme prometido, seguem as principais referências que abordam protocolos de validação e verificação em NGS:
Validation and Benchmarking of Targeted Panel Sequencing for Cancer Genomic Profiling.
Wang D, Wang S, Zhang Y, et al. American Journal of Clinical Pathology. 2023;160(5):507-523. doi:10.1093/ajcp/aqad078.
Standards and Guidelines for Validating Next-Generation Sequencing Bioinformatics Pipelines: A Joint Recommendation of the Association for Molecular Pathology and the College of American Pathologists. Roy S, Coldren C, Karunamurthy A, et al. The Journal of Molecular Diagnostics. 2018;20(1):4-27. doi:10.1016/j.jmoldx.2017.11.003.
Assembling and Validating Bioinformatic Pipelines for Next-Generation Sequencing Clinical Assays. SoRelle JA, Wachsmann M, Cantarel BL. Archives of Pathology & Laboratory Medicine. 2020;144(9):1118-1130. doi:10.5858/arpa.2019-0476-RA.
Comprehensive Analysis to Improve the Validation Rate for Single Nucleotide Variants Detected by Next-Generation Sequencing. Park MH, Rhee H, Park JH, et al.
PLoS One. 2014;9(1). doi:10.1371/journal.pone.0086664.
Human Papillomavirus Detection by Whole-Genome Next-Generation Sequencing: Importance of Validation and Quality Assurance Procedures. Mühr LSA, Guerendiain D, Cuschieri K, Sundström K. Viruses. 2021;13(7):1323. doi:10.3390/v13071323.
Minimal Requirements for ISO15189 Validation and Accreditation of Three Next Generation Sequencing Procedures for SARS-CoV-2 Surveillance in Clinical Setting.
Maschietto C, Otto G, Rouzé P, et al. Scientific Reports. 2023;13(1):6934. doi:10.1038/s41598-023-3408