利用KaKs_Calculator2.0计算两个基因的kaks时出现:Error. The size of two sequences in 'Bra011162.1&AT4G30080.1' is not equal.

利用KaKs_Calculator2.0计算两个基因的kaks时出现:Error. The size of two sequences in 'Bra011162.1&AT4G30080.1' is not equal.

报错原因分析:


要计算两个基因之间的kaks值,一般步骤:1.利用clustalw进行多序列比对,2.将比对结果转换成KaKs_Calculator2.0需要的格式axt文件(转换用到的软件为KaKs_Calculator2.0提供的AXTConvertor工具),之后就可以计算了:

attachments-2019-01-Uv2q3zTU5c526fa3391c6.jpg

有时候会报错:Error. The size of two sequences in 'Bra011162.1&AT4G30080.1' is not equal. 说两个输入fasta序列不相等,但是,我通过clustalw多序列比对的之后结果应该是相等的,怎么转换过后就不相等呢? 

这里我仔细推断得知:由于AXTConvertor工具转换过程中出现错误,也就是软件bug,仔细对比clustalw出来的aln文件和转换后的axt文件的差别序列发现:

红色箭头处的gap出现在行尾的话,AXTConvertor在转换的时候就少一个-;所以导致我第一条序列在axt文件中短了两个碱基;

attachments-2019-01-bNjUM0mO5c52711e58bf0.jpg

我在对应的位置补充上这两个-,重新计算kaks。正常出结果。


解决bug办法:


1.重新用clustalw多序列比对的时候建议输出phy格式的,默认clustalw输出的aln格式的文件:

设置方法如下:选择9输出格式

attachments-2019-01-U4OMUQNr5c5272509d727.jpg

开启格式phy格式,按4回车:

attachments-2019-01-GmRvpfQg5c5272edbb340.jpg

2.转换格式的时候,利用phy格式的结果转换:

AXTConvertor re.phy re2.axt


之后就不会出现BUG;

如果还是出现这个报错,请检查:

1.序列比对总长度是不是3的整倍数,如果不是3的倍数可能计算不出结果

2.看看两条序列是否都含有起始密码子ATG,如果没有可能也会报错

遇到上述两条原因解析:可能基因组注释的不好,有些基因不是很完整,建议筛选条件严格一些,比如相似性和比对率都提高一些;


更多生物信息课程:

1. 文章越来越难发?是你没发现新思路,基因家族分析发2-4分文章简单快速,学习链接:基因家族分析实操课程基因家族文献思路解读

2. 转录组数据理解不深入?图表看不懂?点击链接学习深入解读数据结果文件,学习链接:转录组(有参)结果解读转录组(无参)结果解读

3. 转录组数据深入挖掘技能-WGCNA,提升你的文章档次,学习链接:WGCNA-加权基因共表达网络分析

4. 转录组数据怎么挖掘?学习链接:转录组标准分析后的数据挖掘转录组文献解读

5. 微生物16S/ITS/18S分析原理及结果解读OTU网络图绘制cytoscape与网络图绘制课程

6. 生物信息入门到精通必修基础课:linux系统使用perl入门到精通perl语言高级R语言画图

7. 医学相关数据挖掘课程,不用做实验也能发文章:TCGA-差异基因分析GEO芯片数据挖掘 GEO芯片数据不同平台标准化 、GSEA富集分析课程TCGA临床数据生存分析TCGA-转录因子分析TCGA-ceRNA调控网络分析

8.其他,二代测序转录组数据自主分析NCBI数据上传二代测序数据解读

  • 发表于 2019-01-31 11:49
  • 阅读 ( 2346 )
  • 分类:软件工具

5 条评论

请先 登录 后评论
omicsgene
omicsgene

生物信息

288 篇文章

作家榜 »

  1. omicsgene 288 文章
  2. 安生水 215 文章
  3. Daitoue 168 文章
  4. 生物女学霸 120 文章
  5. 红橙子 37 文章
  6. landy 37 文章
  7. 生信老顽童 35 文章
  8. CORNERSTONE 32 文章