如果只是需要:“出现两个菌种的部分一行拆成两行” 那直接用perl的正则表达式捕获功能就好了; 读取文件建议用while循环,逐行处理文件: open IN,"inflile";while(<IN>){ chomp $_; #do something }close(IN);
回答于 2018-10-16 10:24
get_fa_by_id.pl 这个脚本是根据第一个文件信息的第一列ID信息,提取第二个文件fasta文件的中对应的序列信息,存储到第三个文件当中;所有两个文件当中的ID对应才能得到想要的序列; 分析代码: 代码中这个地方 给ID都加了个".1" 你看看你的gff 文件里面的第一列ID都加 .1 后的基因ID,与你提供的所有蛋白质序列里面的序...
回答于 2018-10-15 13:02
是用我们的biolinux做的吗?应该cd到MCScanX的安装目录,再运行代码: 检查一下gff文件是不是存在,以及格式是否正确;
回答于 2018-10-15 10:29
这个根据自己的基因数量以及长度,bootstrap值的大小和选用的构树方法,基因数量越多,长度越长,bootstrap值越大,用时越久。 构树方法:最大似然法用时最长,NJ法用时最短。 计算机配置不高,用时一天以上也是有可能的;
回答于 2018-10-14 19:21
一般序列较多,bootstrap设置1000次构建进化树需要的时间较长;这个和自己的电脑配置有关,以前做过500个基因,bootstrap 设置1000,用时1天时间,不过我们是在大型计算机上完成的; 普通计算机用时会更长。 还有就是选用的方法,ML方法用时最长,NJ法用时会少一些;
回答于 2018-10-14 19:17