图2前面都有“#”说明是gff的注释行,显示的内容是你这个gff的contig名称,空格键往下翻就能看到gff的文本内容。你用的这个水稻的gff应该不是我们提供的,我们提供的水稻gff是这样的:
回答于 2024-12-18 10:43
首先主要需要关注的结果是merqury_out.qv这个文件,我看你的一致性都很高,说明组装得蛮好的。 其次你提问的这个文件里面第二列表示的是“基因组中特有的kmer”,这个数目是0说明染色体所有的kmer都可以在测序数据里面找到,也是表示这个染色体组装一致性高的意思。
回答于 2024-12-13 16:00
高杂合基因组没有提及,只说了高度重复的话需要用ALLHIC的 prune这一步 nextdenevo数据矫正结果在 输出文件夹/02.cns_align/01.seed_cns.sh.work/seed_cns*/cns.fasta
回答于 2024-11-28 11:06
PASA运行的时候调用到Transdecoder这一步产生的报错,你需要确保输入进去的evm.gff3文件位置信息(phase)是正确的。检查一下这个gene:evm.Tu.chr01.1319 的cds是不是位置上有问题
回答于 2024-11-15 17:18
看一下比对的日志文件里面有没有报错说”将氨基酸序列(pep)转换为核酸序列(nuc)时发现了不一致性“,如果有的话,你找到对应基因ID的cds和蛋白序列检查他们之间是不是3倍关系。如果数量不多,可以把这样的基因对删除。 需要paraAT比对的log文件报错信息进一步确认。
回答于 2024-11-01 16:34
换成这个指令,先生成sam再排序:hisat2 --dta --new-summary -p $threads -x $contig -1 $fq1 -2 $fq2 > rnaseq.sam 2>hisat2.log && samtools sort -@ 10 rnaseq.sam > rnaseq.bam
回答于 2024-09-27 16:38