基因组数据版本更新导致无法根据旧的蛋白ID或基因locus提取相应序列,如何解决?

老师您好,我在基因家族鉴定时,

在blastp这一步,想下载前人鉴定出的其他物种中的该蛋白进行blastp,

由于文献是2015年的,

根据文献补充数据给出的蛋白ID和locus号(下图左),已经无法匹配现有的蛋白序列文件(下图右)了,老版本蛋白序列文件已经删除,只剩cds和gff文件。

新版本的基因和蛋白ID命名与老版本相比已有较大改动,感觉联系不是很大。(基因组网站是文献给出的

s?func=mbox:getComposeData&sid=DAEmItDDxDKJtnoHdIDDZQFPXnewvFwi&composeId=1539506973560&attachId=1

请问在这种情况下,我还有什么方法获得2015年文献中鉴定蛋白的序列吗?还是放弃这个物种,直接用拟南芥和水稻进行blastp就可以啦?

希望老师不吝赐教,万分感谢!



请先 登录 后评论

2 个回答

小鹿kity

刚想到网页里会不会可以直接search,发现用老的ID号也能检索到蛋白序列,只不过只能一个一个检索,不能批量。。。不过总算还是有方法,打扰啦!

请先 登录 后评论
omicsgene - 生物信息
擅长:重测序,遗传进化,转录组,GWAS

没有看到图片;

以前的基因,你最好找到以前版本的基因组对应的版本下载下来;然后再找到相应的基因序列;

自己去对应比较麻烦;



请先 登录 后评论