minimap2是生信大牛Heng Li在2018年发表的三代序列比对工具。与传统的bwa相比,Minimap2可以用于三代测序, 也支持 splicing awared 比对;与一些传统三代比对工具相比,Minimap2 速度非常快,...
MNP标记设计
构建一致性序列
BLAST (Basic Local Alignment Search Tool) 是我们常用的短序列比对工具,直接输入fasta格式的序列文件就可进行比对
VCF 是一种常用的生物信息学文件格式,用于存储基因组中的遗传变异数据,特别是单核苷酸多态性(SNP)和小插入/缺失(Indel)等变异。 VCF 文件通常由文本格式组成,可以用文本编辑器进行查看...
使用NCBI自带的工具实现蛋白序列的批量下载
在前一篇文章里写了使用OthroFinder软件构建物种同源基因分析的工作原理的介绍,这次就利用Orthofinder结果中的数据来绘制物种系统发育树(Phylogenetic tree)。 在Orthofinder结果文件中有一...
Orthofinder是做直系同源基因分析时常用软件,除此之外,还可以使用OrthoMCL,今天主要介绍Orthofinder软件的工作流程。 1. Orthofinder发表的工作流程如上图: 1.1 (a)将所有物种的...
Dsuite软件安装时编译报错
位点频谱SFS (site frequency spectrum),用来显示一个种群中特定基因座上各个等位基因所占的频率。easySFS是一种高效构建位点频谱的工具,它可用于将VCF转换为dadi/fastsimcoal/momi2可接纳的格式进行人口统计分析。
Seqtk工具地址:https://github.com/lh3/seqtk Seqtk工具命令: 操作举例: 01. 将FASTQ格式文件转换成FASTA格式; seqtk seq -a in.fq.gz > out.fa 02. 将FASTQ(Illumina 1.3+)格式...
使用Seqkit进行核苷酸到蛋白质序列的转换
REPuter可注释叶绿体重复序列,包括4种类型,Forward(F), Reverse (R), Complement (C), Palindromic (P)。 REPuter 是可在线注释, 详情可参考文献 REPuter: the manifold applications of...
CandiHap是一款应用于全基因组关联分析(GWAS)后,快速分析基因单倍型来鉴定候选基因的一款友好软件。研究者可通过该软件对单个基因,或者对GWAS显著关联位点LD范围内所有基因进行单倍型分析,发现与性状显著关联的单倍型和候选基因。
在生信分析时,经常会做一下蛋白多序列比对。对于比对结果中,一些不保守的列,我们可以选择剪切掉。再进行之后的分析,比如构建进化树,进化树的构建会容易很多。 剪切序列时有一个非常好用的...
三代组装软件Flye安装及使用
bedtools 对bed 文件进行排序
gatk报错 An index is required but was not found for file drivingVariantFile。 bcftools报错 index: the file is not BGZF compressed, cannot index