kobas 有现成的物种可以选择当然最好,但是,如果没有现成的物种应该分析不了,你需要重新注释自己物种里面的所有基因,对应到KEGG里面的通路,才可以分析;
回答于 2019-10-11 15:32
看脚本还有文件都没有问题,应该是文件格式问题,在linux系统中的换行符是\n 而在windows中的换行符为\r\n 有时候不小心编辑过GFF文件,编程windows中的换行符,所以导致程序无法正确找到基因的ID,因此出错。 解决办法:使用editplus或者notepad++把对应的\r 搜索删除掉,记得勾上正则表达式: 为避免以后再出现...
回答于 2019-10-09 11:07
输入的GFF文件里面的空格你搜索删除一下,可能是不必要的空格导致程序出错: 或者试试新脚本: 脚本下载:colline_v3.pl 使用方法: #准备circos绘图数据文件,脚本从gff里面获得位置信息并整理数据perl ../script/colline_v3.pl -gff ../MCScanX/AT.gff -list WRKY.collinear.pairs -colline AT.collinearity -od data...
回答于 2019-10-09 10:06
fasta序列处理截取反向互补,建议用bioperl: 一般基因组都会提供基因的CDS序列,很少自己去截取。 代码参考如下:parse_gff 和 get_bed_cds 这个两个方法,你看看吧; 建议学习perl高级里面有讲解bioperl:perl入门到精通、perl语言高级 #!/usr/bin/perl -wuse strict;use Cwd qw(abs_path getcwd);use Getopt::Long;...
回答于 2019-10-08 21:10
你的文件具体是怎么样的,如果只有几行,自己手动转换就好了; 如果较多需要批量转换建议自己编写程序解决,例如:perl python等等都可以; 相关课程推荐: perl入门到精通、perl语言高级 python语言入门到精通
回答于 2019-10-08 20:58
musle 和clustalw都是多序列比对软件,都可以对蛋白质和DNA序列基因多序列比对,但是个人觉得蛋白质musle好些,DNA比对clustalw会好些;
回答于 2019-10-08 13:38
你看看你基因的注释信息gff文件,mRNA和cds有啥区别;如果有区别:mRNA序列有可能比cds序列多UTR部分; 串联重复分析有两种方法:blast方法,和mcscanX方法任选其一。
回答于 2019-10-08 10:50
这个得自己查阅相关文献,这里有人回答:https://www.omicsclass.com/question/1318 双子叶的可以参考:https://www.omicsclass.com/question/896
回答于 2019-10-06 11:03