blast 中的e-value值如何理解?

对e-value值的by chance 进行解释

最近在使用blast进行序列检索的时候,有两个比较重要的评价标准,即Max score和e-value:

attachments-2024-01-xaT9k4bx65af7516f3208.png

score值很好理解,即根据不同的打分矩阵,对序列间的匹配程度进行打分,得分矩阵比如PAM和BLOSUM(氨基酸):

attachments-2024-01-q0Sgo2ig65af75f94f7f3.pnge-value值的概念看起来就相对的比较模糊了,官方的定义是e-value:the number of hits you expect to see by chance/false positive .

对于定义里面的“by chance”,也就是随机情况下指的是什么意思不是很了解,随后查阅了一下文献,是这样解释的:

by chance means:

①real but non-homologous sequences

②real sequences that are shfflued to preserve compositional properties

③sequences that are generated randomly based on a DNA or protein sequence model

也就是说要求匹配到的序列之间具有生物学意义上的联系,即具有同源性。


  • 发表于 2024-01-23 16:32
  • 阅读 ( 236 )

你可能感兴趣的文章

相关问题

0 条评论

请先 登录 后评论
每天学习一点点
每天学习一点点

28 篇文章

作家榜 »

  1. omicsgene 652 文章
  2. 安生水 321 文章
  3. Daitoue 167 文章
  4. 生物女学霸 120 文章
  5. 红橙子 78 文章
  6. CORNERSTONE 72 文章
  7. rzx 63 文章
  8. xun 61 文章