Pacbio三代全长转录组(Iso-Seq ) 进行转录本的合并

Pacbio三代全长转录组(Iso-Seq ) 进行转录本的合并

三代转录组,当多个样本进行常规的分析之后需要将多个样品中的转录本合并成一套unigene, 这个可以采用Cupcake 中的“chain_samples.py” 这个脚本来分析。
该脚本的运行命令如下:

usage: chain_samples.py [-h] [--fuzzy_junction FUZZY_JUNCTION]
                        [--allow_5merge]
                        config_file
                        {norm_fl,norm_nfl,norm_nfl_amb,count_fl,count_nfl,count_nfl_amb}

输入文件需要一个配置文件即可。

1. 制备配置文件

该脚本的运行需要配置文件,配置文件的格式非常的重要,如下(# 是注释,请忽略):

# sample name 是不同样本的名称
# path  是不同样本进行isoforms collapse分析的目录
# prefix 是文件的前缀,需要保持在不同样品的分析目录中一致
SAMPLE=<sample name>;<path>
SAMPLE=<sample name>;<path>

GROUP_FILENAME=<prefix>.group.txt
GFF_FILENAME=<prefix>.gff
COUNT_FILENAME=<prefix>.count.txt
FASTQ_FILENAME=<prefix>.rep.fastq


2. 参数选项

--fuzzy_junction FUZZY_JUNCTION :  这个是设置链接点处的允许不同碱基的最大数量

--allow_5merge: 这个是设置,是否允许对5'不一致的转录本进行截断

  • 发表于 2018-08-10 14:03
  • 阅读 ( 3637 )
  • 分类:三代测序

0 条评论

请先 登录 后评论
microRNA
microRNA

115 篇文章

作家榜 »

  1. omicsgene 658 文章
  2. 安生水 328 文章
  3. Daitoue 167 文章
  4. 生物女学霸 120 文章
  5. 红橙子 78 文章
  6. CORNERSTONE 72 文章
  7. xun 67 文章
  8. rzx 67 文章