对gff文件进行处理,保留注释信息中能编码蛋白的基因,上面的步骤没有发现问题。
得到的结果文件‘.protein_coding.gff3’是空的(上图和下图),是什么原因?应该怎么办?22个品系都出现了这个问题。
检查一下gff文件的格式是否标准,是不是9列。截图是格式有问题
上传到服务器中共22个品系,
(一)21个品系是gff压缩文件‘WNZ.gff.gz’,是从茶树泛基因组发表的文章链接中下载,其中WNZ的gff文件格式见下图
(二)另一个品系是压缩文件‘SCZ.gff3.gz’,是从茶树基因组网站下载,格式见下图
你要核对的是 : GFF文件格式没问题,以及核对第一列染色体ID和基因组文件染色体ID是否一致;如果核对没有问题,你把当前文件夹文件清空之后再重新运行命令,AGAT检测到有输出文件存在会退出;
如果觉得我的回答对您有用,请随意打赏。你的支持将鼓励我继续创作!