Enhancing Microbial Genome Reconstruction in Complex Environments by combining Short-and Long-read Sequencing
Améliorer la reconstruction du génome microbien dans des environnements complexes en combinant le séquençage à lecture courte et à lecture longue
Résumé
Soil is one of the most diverse microbial ecosystems, yet a significant portion of its microbial "dark matter" remains uncharacterised. Sequencing technologies have improved our understanding, but challenges persist in comprehensively characterising soil microbial diversity. In this study, we employed PacBio HiFi long-read (LR) and Illumina short-read (SR) whole-genome sequencing (WGS) to reconstruct metagenome-assembled genomes (MAGs) from a soil sample. Metabarcoding analyses complemented our approach by assessing microbial diversity and evaluating the proportion of taxa captured by WGS. Our results demonstrate that LR sequencing significantly enhances genome contiguity and completeness compared to SR methods, which yield more fragmented assemblies. By integrating SR and LR data, we improved binning accuracy, leading to a more precise taxonomic resolution of soil microbial diversity. While long-read sequencing provides the most comprehensive WGS representation, our findings highlight that low-abundant microbial taxa remain undetected due to sequencing depth limitations.
Le sol est l'un des écosystèmes microbiens les plus diversifiés, mais une grande partie de ces communautés reste inexplorée. Les technologies de séquençage ont amélioré notre compréhension, mais des défis subsistent pour caractériser pleinement cette diversité microbienne. Dans cette étude, nous avons utilisé le séquençage à longues lectures PacBio HiFi (LR) et de à lectures courtes Illumina (SR) en séquençage de génome entier (WGS) afin de reconstruire des génomes métagénomiques assemblés (MAGs) à partir d’un échantillon de sol. Des analyses de métabarcoding ont complété notre approche en évaluant la diversité microbienne et en quantifiant la proportion de taxons capturés par le WGS. Nos résultats montrent que le séquençage LR améliore considérablement la continuité et la complétude des génomes par rapport aux méthodes SR, qui produisent des assemblages plus fragmentés. L’intégration des données SR et LR a permis d’accroître la précision du binning, conduisant à une résolution taxonomique plus fine de la diversité microbienne du sol. Bien que le séquençage à lectures longues fournisse une meilleure représentation de la diversité du sol, nos résultats soulignent que certains taxons microbiens peu abondants restent non détectés en raison des limitations de la profondeur de séquençage.
Origine | Fichiers produits par l'(les) auteur(s) |
---|