CSVTK,即CSV工具包,是一个用于处理逗号分隔值(CSV)文件的实用命令行程序。由于其简单性、灵活性和效率,对于经常处理CSV文件的人来说,特别是在数据科学、生物信息学以及任何需要数据分析的...
运行命令makeblastdb -in all.pep.fa -dbtype prot -title all.pep.fa 时卡住报错,生成all.pep.fa.pdb-lock 空文件。 解决:makeblastdb 工具版本问题,从2.13.0版本改成2.6.0版本,就可以...
bedtools 对bed 文件进行排序
BLAST (Basic Local Alignment Search Tool) 是我们常用的短序列比对工具,直接输入fasta格式的序列文件就可进行比对
计算RNASeq 的Power值
构建一致性序列
使用python2运行lefse软件的时候报错这是因为当前LEfSe依赖的R包rpy2的版本与你的R版本不兼容,你可以尝试更新一个rpy2的小版本,比如我更新了 pip2 install rpy2==2.8.6 随后就可以直接使用...
minimap2是生信大牛Heng Li在2018年发表的三代序列比对工具。与传统的bwa相比,Minimap2可以用于三代测序, 也支持 splicing awared 比对;与一些传统三代比对工具相比,Minimap2 速度非常快,...
MNP标记设计中DP的算法
MNP标记设计
这个其实很多办法都可以做到,基本就是靠zcat后接awk,sed,或者wc命令,不过速度差强人意,比如这个 awk应该是这几个里最快的,但一个3个G左右的文件仍然运行了接近2分钟,考虑到还有几个30个...
如果某fq_clean文件的其中一端出现了错误,我们手里还持有他的原始数据,那我们就可以用以下方法处理1,首先提取clean文件另一端的id,我用了python脚本 import gzipimport argparsedef extrac...
三代测序在检测基因组结构变异方面有着很大的优势,但是由于数据分析算法、软件还处于不断开发更新中,当前还没有公认推荐的软件。这里为大家推荐一款国人开发的三代数据SV检测软件—cuteSV。该...
使用vcftools对vcf文件做滑窗处理
统计每个窗口内SNP变异位点数量
linux使用ossutil下载阿里云数据
muscle新版,旧版使用的一些差别
从fasta基因组中提取反向互补序列,借助bedtools工具。 bedtools getfasta -fi Dlong_asm_chr.fasta -bed DlNIP.bed -s -fo DlNIP.bed.fa -fi 基因组文件 -bed 基因位置 共6列:【染色...
大部分植物的叶绿体基因组具有典型的四分体结构,即由LSC、SSC以及一对IR区域构成,IR和SSC区域的收缩与扩张是常见的进化事件。通过irscope工具可以将多个物种叶绿体的区域边界进行可视化对比...
对vcf文件排序