基因组组装BUSCO多拷贝过高

物种用流式做出来是3.6G左右,用kmer估计也是3.6G左右,用HiFiasm默认参数组装也是3.6G,但是BUSCO的D数目过高,|C:99.2%[S:3.1%,D:96.1%],F:0.2%,M:0.6%,n:1614 。这个是什么原因呢?后面需要怎么操作

请先 登录 后评论

2 个回答

Ti Amo

1. kmer评估中杂合度为多少?高杂合是否组装为两套染色体?高杂合未区分,D高
2.物种是否为多倍体?有全基因组复制事件?如果存在,D高是正常情况。
3.参考近缘种,与其他人busco的结果进行比较,看差异大不大,如果近缘种都是这样的结果可能是物种本身特性。

后续处理,要么用hifiasm做出来的单倍型进行后续分析,或者采用 Purge Haplotig做杂合去除:GitHub - skingan/purge_haplotigs_multiBAM: branch of purge haplotigs that inputs multiple bam files

请先 登录 后评论
幻影

好的,我用kmer分析Hi-C数据,结果是这样的aa:89.5% ab:10.5%

Model converged het:0.105 kcov:45.7 err:0.000733 model fit:128 len:Inf   。这个是什么原因呢,还请老师解答下
请先 登录 后评论