5 基因组去冗余的选择

请问一下老师,我用hifi数据组装了一个植物基因组大小是307Mb左右,然后有330条contig。后面我用purge_dups和purge_haplotigs分别去冗余了,但purge_dups去冗余后有28条contig,purge_haplotigs去冗余后有69条contig,两种结果的BUSCO评估是一样的,前者处理后的比后者的基因组小了4Mb,我应该用哪个结果用于后续的分析呢?

请先 登录 后评论

1 个回答

Ti Amo

在BUSCO没有太大改变的情况下(即完整性没有太大差异),建议选择连续性更好的组装进行后续的分析,也可以继续通过merqury做一下QV打分,看看是否有差异(组装和测序数据的QV高一些更好)。关于这两个软件的选择,有文章《Identifying and removing haplotypic duplication in primary genome assemblies》进行了比较,文中认为是purge_dups的效果更好一些。

请先 登录 后评论