请教:基因与mRNA的对应关系分析不正确

我的物种序列只有NCBI上有公布,在做mRNAgeneID对应关系输出的时候出现问题,请问怎么解决?

 

下面是gff文件的信息:

attachments-2019-09-oWyCJJ995d7e31412f028.png



rna文件信息如下,ID是以XM_开头。

attachments-2019-09-uNvFl8wQ5d7e315d0b7dc.png


protein文件信息如下,ID是以XP_开头。

attachments-2019-09-6qmVYYIX5d7e31745bb06.png


gff文件进行处理时,我用的两条命令是:

#sed –i  's#gene-##' gff文件名

#sed –i  's#rna-##' gff文件名

 

然后,获取基因与mRNA的对应关系,命令同w.sh文件里的命令,得到的结果如下,出现这种情况怎么办?

attachments-2019-09-NzbdvdV15d7e31915ab1c.png

请先 登录 后评论

3 个回答

Leo

您好,我也遇到了这个问题,想请问一下,你的这种问题怎么解决的呢?

请先 登录 后评论
omicsgene - 生物信息
擅长:重测序,遗传进化,转录组,GWAS

这种情况 你需要自己编写程序  根据gff文件的内容把基因的ID于蛋白ID修改一致;

脚本参考:https://www.omicsclass.com/article/566

请先 登录 后评论
Daitoue

基因和转录本还是可以对应上的呀,反而你的蛋白好像不对应 ,不过你的那个怎么是xp_然后显示拟南芥的ID了

请先 登录 后评论