Pacbio三代全长转录组(Iso-Seq ) 采用CD-HIT合并转录本

CD-HIT合并pacbio转录本

Pacbio三代全长转录组采用isoseq3 进行了转录本的筛选,聚类和校正之后得到高质量的转录本序列,可以对序列再进行一定的合并操作。

采用cDNA_Cupcaake 文档中提供的cd-hit方案,运行命令如下:

cd-hit-est -i <input> -o <output> -c 0.99 -T 6 -G 0 -aL 0.90 -AL 100 -aS 0.99 -AS 30

参数说明:

input: 是pacbio 的isoseq 3 输出的高质量转录本序列文件

output: 输出的合并序列文件

-c : 序列相似性,99%的相似性

-T : 线程数,6个线程

-G: 采用的比对策略,默认是1,采用全局比对。这地方设置为0,将采用局部比对策略。

-aL: 长序列的覆盖度,设置为90%

-AL: 长序列覆盖区域的长度,设置为最小100bp

-aS: 短序列的覆盖度,设置为99%

-AS: 短序列覆盖区域的最小长度,设置为30bp

  • 发表于 2018-09-19 10:41
  • 阅读 ( 5160 )
  • 分类:三代测序

1 条评论

请先 登录 后评论
microRNA
microRNA

115 篇文章

作家榜 »

  1. omicsgene 658 文章
  2. 安生水 328 文章
  3. Daitoue 167 文章
  4. 生物女学霸 120 文章
  5. 红橙子 78 文章
  6. CORNERSTONE 72 文章
  7. xun 67 文章
  8. rzx 67 文章