5 二代测序数据的质控标准是什么?

请先 登录 后评论

最佳答案 2018-07-22 15:00

:为保证后续分析的准确性,诺禾致源会严格把控clean data的筛选标准,具体标准如下:
       (1) 去除带接头(adapter)的paired reads;
       (2) 当单端测序read中含有的N的含量超过该条read长度比例的10%时,需要去除此对paired reads;
       (3) 当单端测序read中含有的低质量(Q ≤ 5)碱基数超过该条read长度比例的 50% 时,需要去除此对paired reads。

  adapter:接头,用于上机测序。建库时引入的接头序列与测序芯片(flow cell)上固定的接头相互识别。
       index:测序的标签,用于测定混合样本,通过每个样本添加的不同标签进行数据区分,鉴别测序样品。
       Q20,Q30:Phred 数值大于20、30的碱基占总体碱基的百分比,其中Phred=-10log10(e),e为错误率。
       raw data/raw reads:测序下机的原始数据。

       clean data/clean reads:对原始数据进行过滤后,剔除了低质量数据的剩余数据。后续分析均基于clean data。

二代测序原理及fastq数据详细讲解《illumina测序原理及fastq数据讲解



请先 登录 后评论

其它 0 个回答

  • 1 关注
  • 0 收藏,9452 浏览
  • 提出于 2018-07-02 08:52