blast+在linux上的用法

blast+在Linux的用法

下面简要介绍一下BLAST+的使用：

建库

makeblastdb -in db.fasta -dbtype prot -parse_seqids -out dbname -title dbtitle -logfile filename

参数说明:

-dbtype：数据库类型，prot或nucl
-parse_seqids：解析序列标识（建议加上）
-out：数据库名
-title：数据库名（略）
-logfile：日志文件，默认输出到屏幕
更多参数 makeblastdb -help

蛋白序列比对蛋白数据库（blastp）

blastp -query seq.fasta -out seq.blast -db dbname -outfmt 6 -evalue 1e-5 -num_descriptions 10 -num_threads 8

参数说明:

-query：输入文件路径及文件名

-out：输出文件路径及文件名

-db：格式化了的数据库路径及数据库名

-outfmt：输出文件格式，总共有12种格式，6是tabular格式对应BLAST的m8格式

-evalue：设置输出结果的e-value值

-num_descriptions：tabular格式输出结果的条数

-num_threads：线程数

附：Blast结果m8格式意义

进行Blast比对，用参数-m 8可以以列表的方式输出结果，结果中从左到右每一列的意义分别是：

[1] Query id [1]查询ID (所研究物种的ID)

[2] Subject id [2] 参考基因组的ID

[3] % identity [3] 表示相同匹配的百分比

[4] alignment length [4] 序列对齐长度

[5] mismatches [5] 错配数量

[6] gap openings [6] 缺口

[7] q. start [7] 和查询序列开始对齐位置

[8] q. end [8] 和查询序列结束对齐位置

[9] s. start [9] 和参考基因序列开始对齐位置

[10] s. end [10] 和参考基因序列结束对齐位置

[11] e-value [11] 期望值

[12] bit score [12] bit分数

核酸序列比对核酸数据库（blastn）以及核酸序列比对蛋白数据库（blastx）

与上面的blastp用法类似：

blastn -query seq.fasta -out seq.blast -db dbname -outfmt 6 -evalue 1e-5 -num_descriptions 10 -num_threads 8

blastx -query seq.fasta -out seq.blast -db dbname -outfmt 6 -evalue 1e-5 -num_descriptions 10 -num_threads 8

0 条评论