可到基因组数据库当中下载: 参照JGI数据库网站:https://www.omicsclass.com/article/50 ensembl基因组数据库网站:https://www.omicsclass.com/article/58 如何利用基因组数据库视频课程:https://www.omicsclass.com/video/16
回答于 2018-08-25 21:44
你贴的图片不是正宗的GFF格式的文件吧。 看你的文件基因的位置信息已经有了,你excel筛选一下第三列是gene的列就好。 gff文件格式参见:https://www.omicsclass.com/article/66 和 https://www.omicsclass.com/article/306 如果是GFF文件可请参照这篇文章修改一下:https://www.omicsclass.com/article/175
回答于 2018-08-25 21:41
®是国际上通用的注册商标标记,是英语单词“register”首写大写字母,表示已经注册的意思。在word中打注册商标R标志的方法如下:首先打开在Word,同时按下Alt+Ctrl+R 组合键 即会出现注册商标符号®。
回答于 2018-08-24 15:34
可以适当删除一些差异较大的gap区域,然后构建进化树,如果是一个基因家族的基因,肯定有相对保守的区域; 你可以只用保守区域构建进化树,和只是删除一些gap区域构建进化树对比一下; 目前我看到的关于基因家族的文献里面都没有详细说明差异大的区域的处理方法;如果你有看到可以留言交流; https://www.omicsclass.c...
回答于 2018-08-24 13:39
看脚本和文件都没有问题,你输入的位置信息文件:gen-weizhi.txt 检查一下这个文件每一列是不是用一个tab分隔的; 我看截取的时候报的输入的不是数字;split分隔文件可能错了; 确保分隔符正确,可将文件内容张贴到excel,然后另存为: 制表符分隔的txt文件:
回答于 2018-08-24 11:41
NCBI上的基因组数据库,会对基因组的染色体,基因编号等等重新命名编号,截图中已经有注释说明,请仔细看; 你要是不嫌麻烦可以根据GFF的注释信息提取ID的对应关系。 拟南芥建议上ensembl上下载基因组信息,会有更友好一些:https://www.omicsclass.com/article/58
回答于 2018-08-24 11:22
所有基因家族的PFAM号,可到PFam数据库里面直接得到,目前最新的是31版本: pfam数据库主页:http://pfam.xfam.org/ 所有基因家族的hmm模型: ftp://ftp.ebi.ac.uk/pub/databases/Pfam/releases/Pfam31.0/Pfam-A.hmm.gz
回答于 2018-08-22 12:11