基因组组装(Genome Assembly)

基因组组装(Genome assembly)是指使用测序方法将待测物种的基因组生成序列片段(即read),并根据reads 之间的重叠区域对片段进行拼接,先拼接成较长的连续序列(contig),再将contigs 拼接成更长的允许包含空白序列(gap)的scaffolds,通过消除scaffolds 的错误和gaps,将这些scaffolds 定位到染色体上,从而得到高质量的全基
因组序列(图1)。
随着第三代测序技术的不断成熟,对其组装方法的研究也越来越多。第三代测序技术组装的过程一般包括reads 数据纠错、组装、组装之后的序列修补以及最后的scaffolds 锚定。由于第三代测序准确度较低,要保证最后的组装质量,通常需要较深的测序深度,并在组装之前对其进行纠错。在完成纠错之后通过组装工具对片段进行组

基因组组装(Genome Assembly)
图1 基因组测序组装过程
Fig.1 Process of genome sequencing and assembly

 

基因组组装(Genome Assembly)