El Dr. Gustavo Barra, magíster en farmacología molecular y coordinador del sector de genómica en Sabin Medicina Diagnóstica, abordó la introducción a la Secuenciación de Nueva Generación (NGS); las tecnologías y plataformas de NGS disponibles en el mercado; las aplicaciones clínicas del NGS en el diagnóstico molecular y otros aspectos relevantes sobre el tema.
Preguntas y Respuestas
A continuación, se presenta la duda que no fue respondida durante el Reunión Online.
Enriquecimiento, en el contexto de la secuenciación de nueva generación (NGS), se refiere a técnicas utilizadas para seleccionar regiones específicas del genoma antes de la secuenciación. Esto se realiza para aumentar la cobertura y la profundidad de lectura de estas regiones de interés, reduciendo los costos y la complejidad computacional asociados a la secuenciación de genomas completos.
Normalmente, el término enriquecimiento se utiliza para la estrategia de Captura por Hibridación, que emplea sondas oligonucleotídicas biotiniladas complementarias a las regiones objetivo de interés en el genoma. Estas sondas hibridan con las secuencias de interés, que luego son aisladas usando esferas recubiertas con estreptavidina. Esta técnica permite la captura de regiones flanqueantes, pero también puede aislar regiones no deseadas, reduciendo la cobertura en las regiones de interés.
El proceso de enriquecimiento genera una métrica que puede evaluarse durante la secuenciación: la proporción de secuencias que corresponden a las regiones objetivo en relación con el total de secuencias generadas. Normalmente, este valor se sitúa entre el 70 % y el 85 %. Por ejemplo, un enriquecimiento del 80 % indica que el 80 % de las secuencias generadas corresponden a las regiones que se pretendía capturar, mientras que el otro 20 % son de regiones no objetivo.
Como el proceso no es perfecto, siempre habrá un porcentaje de secuencias fuera del interés (off-target). Cuanto mayor sea el enriquecimiento, más optimizada será la secuenciación, ya que maximiza la cobertura de las regiones de interés y minimiza la generación de datos irrelevantes. Esto da lugar a un análisis más eficiente y económico, permitiendo una detección más precisa de variantes genéticas en las regiones estudiadas.
Referencias (pregunta 1):
Guidelines for Validation of Next-Generation Sequencing-Based Oncology Panels: A Joint Consensus Recommendation of the Association for Molecular Pathology and College of American Pathologists. Jennings LJ, Arcila ME, Corless C, et al. The Journal of Molecular Diagnostics. 2017;19(3):341-365. doi:10.1016/j.jmoldx.2017.01.011.
Comparison of Three Targeted Enrichment Strategies on the SOLiD Sequencing Platform. Hedges DJ, Guettouche T, Yang S, et al. PLoS One. 2011;6(4). doi:10.1371/journal.pone.0018595.
No necesariamente. La metagenómica implica la secuenciación masiva y no dirigida del material genético presente en una muestra, lo que permite la identificación y análisis de todos los microorganismos o componentes genéticos presentes, sin necesidad de cultivo o conocimiento previo. Aunque a menudo se asocia con muestras ambientales, la metagenómica también se aplica ampliamente en muestras clínicas, como plasma y líquido cefalorraquídeo (líquido), para la detección de virus desconocidos u otros patógenos.
Ejemplos de metagenómica en muestras clínicas:
– Metagenómica del plasma o líquido cefalorraquídeo: Utilizada para identificar virus, bacterias u otros patógenos desconocidos en pacientes con infecciones de origen indeterminado.
– Análisis de microbiomas humanos: Estudios que investigan la composición de las comunidades microbianas en el intestino, piel, boca y otras partes del cuerpo, relacionándolas con enfermedades o estados de salud.
La metagenómica puede considerarse un secuenciamiento sin premisas, donde no se dirige el análisis a un organismo o gen específico. En su lugar, el objetivo es obtener una visión amplia del material genético presente en la muestra, permitiendo que los datos revelen qué organismos o secuencias están presentes.
Por otro lado, cuando se secuencia un gen específico usando NGS, generalmente se está realizando un secuenciamiento dirigido o de amplicón, enfocado en una región particular del genoma. Este método requiere conocimiento previo sobre el gen o organismo de interés y no se considera metagenómico, ya que no proporciona información sobre otros organismos o secuencias presentes en la muestra.
Por lo tanto, para ser considerada un análisis metagenómico, la secuenciación debe ser amplia y no dirigida, permitiendo la identificación de múltiples organismos o componentes genéticos sin premisas previas. Secuenciar solo un gen específico no caracteriza un enfoque metagenómico.
Referencias (pregunta 2):
Advances in Metagenomics and Its Application in Environmental Microorganisms.
Zhang L, Chen F, Zeng Z, et al. Frontiers in Microbiology. 2021;12:766364. doi:10.3389/fmicb.2021.766364.
From Genomics to Metagenomics in the Era of Recent Sequencing Technologies.
Benz S, Mitra S. Methods in Molecular Biology. 2023;2649:1-20. doi:10.1007/978-1-0716-3072-3_1.
STROBE-metagenomics: A STROBE Extension Statement to Guide the Reporting of Metagenomics Studies.
Bharucha T, Oeser C, Balloux F, et al. The Lancet Infectious Diseases. 2020;20(10). doi:10.1016/S1473-3099(20)30199-7.
Recent Advances in Metagenomic Approaches, Applications, and Challenges.
Lema NK, Gemeda MT, Woldesemayat AA. Current Microbiology. 2023;80(11):347. doi:10.1007/s00284-023-03451-5.
Metagenomic Data Assembly – The Way of Decoding Unknown Microorganisms.
Lapidus AL, Korobeynikov AI. Frontiers in Microbiology. 2021;12:613791. doi:10.3389/fmicb.2021.613791.
What Is Metagenomics Teaching Us, and What Is Missed?
New FN, Brito IL. Annual Review of Microbiology. 2020;74:117-135. doi:10.1146/annurev-micro-012520-072314.
Las regiones de baja cobertura en los resultados de secuenciación de nueva generación (NGS) pueden ser causadas por diversos factores, como se evidencia en la literatura médica:
Composición de la secuencia, especialmente el contenido de GC (Guanina/Citosina):
Las regiones ricas en GC son notoriamente difíciles de secuenciar y frecuentemente resultan en baja cobertura, menor calidad de base y dificultades en el mapeo, además de un alto sesgo de cadena, comprometiendo la sensibilidad en la detección de variantes.
Elementos repetitivos y duplicaciones segmentarias también están asociados a regiones de baja cobertura.
Metodología de preparación de la biblioteca:
La forma en que se prepara la biblioteca de secuenciación puede influir significativamente en la cobertura.
Ciertos kits de preparación de biblioteca están asociados a un sesgo de cobertura dependiente del contenido de GC, especialmente en especies bacterianas con bajo contenido de GC.
Los métodos de fragmentación de ADN, como la sonicación, pueden introducir sesgos no aleatorios que afectan la uniformidad de la cobertura.
Limitación de mapeabilidad de lecturas cortas:
La dificultad para mapear lecturas cortas en regiones específicas del genoma puede resultar en una cobertura no uniforme.
Esto puede ser un problema significativo en plataformas de secuenciación de exoma (WES) y genoma completo (WGS), donde la complejidad del genoma puede dificultar la alineación precisa de las lecturas.
Calidad y cantidad del ácido nucleico inicial:
Ácidos nucleicos de baja calidad o cantidad insuficiente pueden llevar a una cobertura inadecuada.
Eficiencia de los métodos de captura y amplificación:
El sesgo de amplificación es una limitación conocida en enfoques basados en amplicones de PCR, lo que puede resultar en un rendimiento inferior de ciertos amplicones.
Por lo tanto, la baja cobertura en NGS puede atribuirse a una combinación de factores relacionados con la composición de la secuencia, métodos de preparación de la biblioteca, mapeabilidad de las lecturas, calidad del ácido nucleico y eficiencia de los métodos de captura y amplificación.
Referencias (pregunta 3):
Standards and Guidelines for Validating Next-Generation Sequencing Bioinformatics Pipelines: A Joint Recommendation of the Association for Molecular Pathology and the College of American Pathologists.
Roy S, Coldren C, Karunamurthy A, et al. The Journal of Molecular Diagnostics. 2018;20(1):4-27. doi:10.1016/j.jmoldx.2017.11.003.
Coverage Analysis in a Targeted Amplicon-Based Next-Generation Sequencing Panel for Myeloid Neoplasms.
Yan B, Hu Y, Ng C, et al. Journal of Clinical Pathology. 2016;69(9):801-804. doi:10.1136/jclinpath-2015-203580.
The Efficiency of Tagmentation Depends on G and C Bases in the Binding Motif Leading to Uneven Coverage in Bacterial Species With Low and Neutral GC-content.
Segerman B, Ástvaldsson Á, Mustafa L, Skarin J, Skarin H. Frontiers in Microbiology. 2022;13:944770. doi:10.3389/fmicb.2022.944770.
Novel Metrics to Measure Coverage in Whole Exome Sequencing Datasets Reveal Local and Global Non-Uniformity.
Wang Q, Shashikant CS, Jensen M, Altman NS, Girirajan S. Scientific Reports. 2017;7(1):885. doi:10.1038/s41598-017-01005-x.
Non-Random DNA Fragmentation in Next-Generation Sequencing.
Poptsova MS, Il’icheva IA, Nechipurenko DY, et al. Scientific Reports. 2014;4:4532. doi:10.1038/srep04532.
Systematic Dissection of Biases in Whole-Exome and Whole-Genome Sequencing Reveals Major Determinants of Coding Sequence Coverage.
Barbitoff YA, Polev DE, Glotov AS, et al. Scientific Reports. 2020;10(1):2057. doi:10.1038/s41598-020-59026-y.
Como prometido, aquí están las principales referencias que abordan protocolos de validación y verificación en NGS:
Validation and Benchmarking of Targeted Panel Sequencing for Cancer Genomic Profiling.
Wang D, Wang S, Zhang Y, et al. American Journal of Clinical Pathology. 2023;160(5):507-523. doi:10.1093/ajcp/aqad078.
Standards and Guidelines for Validating Next-Generation Sequencing Bioinformatics Pipelines: A Joint Recommendation of the Association for Molecular Pathology and the College of American Pathologists.
Roy S, Coldren C, Karunamurthy A, et al. The Journal of Molecular Diagnostics. 2018;20(1):4-27. doi:10.1016/j.jmoldx.2017.11.003.
Assembling and Validating Bioinformatic Pipelines for Next-Generation Sequencing Clinical Assays.
SoRelle JA, Wachsmann M, Cantarel BL. Archives of Pathology & Laboratory Medicine. 2020;144(9):1118-1130. doi:10.5858/arpa.2019-0476-RA.
Comprehensive Analysis to Improve the Validation Rate for Single Nucleotide Variants Detected by Next-Generation Sequencing.
Park MH, Rhee H, Park JH, et al. PLoS One. 2014;9(1). doi:10.1371/journal.pone.0086664.
Human Papillomavirus Detection by Whole-Genome Next-Generation Sequencing: Importance of Validation and Quality Assurance Procedures.
Mühr LSA, Guerendiain D, Cuschieri K, Sundström K. Viruses. 2021;13(7):1323. doi:10.3390/v13071323.
Minimal Requirements for ISO15189 Validation and Accreditation of Three Next Generation Sequencing Procedures for SARS-CoV-2 Surveillance in Clinical Setting.
Maschietto C, Otto G, Rouzé P, et al. Scientific Reports. 2023;13(1):6934. doi:10.1038/s41598-023-3408.