不需要执行这么复杂的操作,“cat ../01.jcvi/pangene_filter.*.last | grep -v "^#" > last.txt”,这一步是为了合并所有的比对文件并且删除掉"#"开头得行,主要是为了下一步去执行python的脚本。那你不合并,直接从原来的last文件里面删除 "#"开头的行,然后执行python的脚本就可以了。 for i in `find ../01.jcvi -nam...
回答于 2025-03-06 09:54
图没有贴出来,也没看到分析流程总结。大小不均匀可以看一下近缘物种是否存在这个现象。超级染色体内部Hi-C信号都很强吗?可以根据3D-DNA的juice box进行手动的切割划分试试
回答于 2025-03-04 17:52
处理大文件时,Seqtk 可能会占用大量内存,导致系统资源不足或程序崩溃,根据具体需求,调整 Seqtk 的参数以减少内存使用。例如,使用 -C 参数折叠长行
回答于 2025-02-20 11:57
下图的结果是基因集构建的另外一个结果,基因集构建会出来两个结果,其中final.last.gene.pair.txt是符合泛基因家族需求的结果
回答于 2025-01-23 17:58
dadi生成sfs频谱文件的时候参数要修改成自己的群体投射值,参考easySFS的使用 - 组学大讲堂问答社区 (omicsclass.com),课程里也讲了。模型不对说明前面的python那一步需要调整 -m 后面的参数,指定其他模式。
回答于 2025-01-13 11:06
建议附上合并之后的vcf截图,需要info列的截图和后面的基因型截图。 sv的vcf其“存在与否”信息在info列,可以根据info列自行进行基因型的转换,变成正常0/0 1/1这种基因型之后进行后续分析。
回答于 2025-01-03 15:53
ONT进行组装前建议矫正。11.smartdenovo.sh中完成组装之后,和近缘物种的线粒体序列进行blast,选择比对次数较多的contig进行后续分析。
回答于 2025-01-03 15:40
进行自比对去除冗余、blast去除细胞器的组装,如果大小还是没到预期标准可以采用purge_dups进行过滤:GitHub - dfguan/purge_dups: haplotypic duplication identification tool 不太清楚两个单倍型差异如何。如果两个单倍型差异较大,你直接用hifi组装的话会导致基因组偏大。
回答于 2024-12-23 11:25
同一套数据不同软件组装结果也会有差异,不同数据本身也存在差异。如果ont数据是采用nextdenovo组装的,可以试着用 hifiasm再组一次。hifi数据普遍会比ont数据更碎一些,在去除冗余、细胞器基因组之后差距会缩小一点。
回答于 2024-12-18 11:05