blast+在linux上的用法

blast+在linux上的用法

blast+在Linux的用法

下面简要介绍一下BLAST+的使用:

建库

makeblastdb -in db.fasta -dbtype prot -parse_seqids -out dbname -title dbtitle -logfile filename

参数说明:

-dbtype:数据库类型,prot或nucl
-parse_seqids:解析序列标识(建议加上)
-out:数据库名
-title:数据库名(略)
-logfile:日志文件,默认输出到屏幕
更多参数 makeblastdb -help


蛋白序列比对蛋白数据库(blastp)

blastp -query seq.fasta -out seq.blast -db dbname -outfmt 6 -evalue 1e-5 -num_descriptions 10 -num_threads 8

参数说明:

-query: 输入文件路径及文件名

-out:输出文件路径及文件名

-db:格式化了的数据库路径及数据库名

-outfmt:输出文件格式,总共有12种格式,6是tabular格式对应BLAST的m8格式

-evalue:设置输出结果的e-value值

-num_descriptions:tabular格式输出结果的条数

-num_threads:线程数

附:Blast结果m8格式意义

进行Blast比对,用参数-m 8可以以列表的方式输出结果,结果中从左到右每一列的意义分别是:

[1] Query id    [1]查询ID (所研究物种的ID)

[2] Subject id    [2] 参考基因组的ID

[3] % identity    [3] 表示相同匹配的 百分比

[4] alignment length    [4]   序列对齐长度

[5] mismatches    [5] 错配数量

[6] gap openings    [6]  缺口

[7] q. start    [7] 和查询序列开始对齐位置

[8] q. end    [8] 和查询序列结束对齐位置

[9] s. start    [9] 和参考基因序列开始对齐位置

[10] s. end    [10] 和参考基因序列结束对齐位置

[11] e-value    [11]  期望值

[12] bit score    [12]   bit分数


核酸序列比对核酸数据库(blastn)以及核酸序列比对蛋白数据库(blastx)

与上面的blastp用法类似:

blastn -query seq.fasta -out seq.blast -db dbname -outfmt 6 -evalue 1e-5 -num_descriptions 10 -num_threads 8

blastx -query seq.fasta -out seq.blast -db dbname -outfmt 6 -evalue 1e-5 -num_descriptions 10 -num_threads 8

  • 发表于 2022-09-21 10:24
  • 阅读 ( 53 )
  • 分类:linux

你可能感兴趣的文章

相关问题

0 条评论

请先 登录 后评论
生信阿姨
生信阿姨

6 篇文章

作家榜 »

  1. omicsgene 560 文章
  2. 安生水 256 文章
  3. Daitoue 167 文章
  4. 生物女学霸 120 文章
  5. 红橙子 78 文章
  6. CORNERSTONE 72 文章
  7. 生信老顽童 50 文章
  8. landy 37 文章