三代全长转录组鉴定红花黄酮类次代物合成相关相关基因-原文献下载链接:红花三代转录组.pdf(请点击下载)
文献解读:
三代全长转录组现在做的很多,但所见文章很多是有参物种,所关注分析内容也较多,如基因结构优化、新基因发现、可变剪接、融合基因等;那对于无参物种或者参考基因组较差物种,三代转录组文章一般都挖掘数据写论文呢?下面我们一起学习一篇2018年7月发表在BMC Genomics上题为:Full-length transcriptome sequences and the identification of putative genes for flavonoid biosynthesis in safflower 的红花三代全长转录组文章。
背景:
红花(拉丁学名:Carthamus tinctorius L.),别名:红蓝花 、刺红花,菊科、红花属植物,具有活血化瘀,散湿去肿的功效,是一味传统名贵中药材。
目前红花基因组测序应该已完成,但精细基因组序列及文章仍未公开,网上仅有红花基因组草图(文章链接:https://www.researchgate.net/publication/303551846_Genetic_Mapping_of_Millions_of_SNPs_in_Safflower_Carthamus_tinctorius_L_via_Whole_Genome_Re-sequencing),该草图仅建一个小片段文库,测序深度21×,参考价值较差;红花主要有效成分为黄酮类次生代谢物。所以本文作者利用三代全长转录组主要是鉴定与红花黄酮类次生代谢物合成相关的基因。
材料与方法:
取红花根茎叶及花期第一、三、五天的花瓣,共6个组织,每个组织来自于5单株,提取后混合建库。
三代测序仪选择Pacific Bioscience RS II ,共建3个长度片段文库:1–2, 2–3, 和3–6 k。
结果:
1. 转录组本组装及去冗余
混样三代转录组共获得10.43Gb的clean data,组装得到共79,926 条转录组本,其中高质量60,894 条,低质量19,032 条。去冗余作者用了两种方法,一是与红花基因组草图比对;二是无法比对到基因组草图的通过聚类方法去冗余;最终得到38,302条去冗余转录组本。
2. 转录本的功能注释
对以上去冗余后的38302条转录组本进行功能注释,数据库有:GO、KOG、KEGG、COG、Pfam、Nr等,此处仅是总体介绍下注释情况,不再详述,见下图。
3. 鉴定与黄酮类次代物合成相关基因
根据KEGG注释结果,筛选到44个与黄酮类合成有关的转录本;由于水稻、拟南芥中黄酮合成相关基因研究更为清楚,所以作者又将该44个转录本与水稻及拟南芥中黄酮合成相关基因进行了blast比对,构建系统发育树,根据比对结果对红花中黄酮合成相关基因进行命名,并将其划分为8个家族:C3H, C4H, OMT,LAD, HCT, CHI, CHS和 F3H。
接下来作者为进一步阐明以上基因的功能,又进一步对基因的保守motif 结构进行分析,详见下表。
4. 黄酮类次代物合成相关基因的表达分析
由于本文没有做二代测序,所以通过半定量PCR分别对6个组织中候选的的黄酮合成相关基因进行表达定量分析,结果显示不同基因表达有很大差异 ,并且某些基因在不同组织中表达具有组织特异性,如下图:
由于红花花入药,所以作者筛选了在花中表达量高或特异性表达的基因,作为可能参与黄酮类是次代物的合成的重点候选基因。
5. 外源茉莉酸甲酯处理下黄酮类次代物合成相关基因表达模式分析
茉莉酸甲酯是植物内源信号分子,前人研究用茉莉酸甲酯外源处理红花能提高红花内主效成分含量,所以作者又对花期3天的红花进行茉莉酸甲酯处理,并设对照,处理6h后取样并通过QRT-PCR检测以上44个候选基因的表达模式变化。详见下图:
6. SSR标记开发及LncRNA鉴定
三代全长转录组很适合开发SSR标记;作者又用4种方法鉴定出1247个
LncRNA。
总结:
作者通过一个三代转录组,得到了较为完整的红花转录本数据库,并从中鉴定出44个可能参与红花黄酮类次生代谢物合成的转录组本,并通过这些基因在在花瓣中表达特异性,筛选出重点候选基因12个,再结合茉莉酸甲酯处理实验,最终确定5个最有可能参与黄酮类次生代谢物合成的基因,为进一步挖掘红花黄酮类次生代谢基因资源奠定了基础。
文章亮点:
1. 借助红花基因组草图,三代全长转录组去冗余;对于无参物种只能通过聚类的方式去冗余了,不过对发文章影响应该也不大。
2. 分析黄酮类合成相关基因时,通过构建系统发育树划分成8个基因家族,后分析motif结构及后续每个家族内基因在不同样本中表达量信息;此种将三代转录组与基因家族分析内容结合起来很是加分,值得借鉴。
3.结果4中:半定量PCR分别对6个组织中候选的黄酮合成相关基因进行表达定量分析中,作者将系统发育树、motif结构和基因定量数据三个内容整合在了一张图里,很是漂亮,我这里给大家推荐一篇类似的作图文章:进化树+基因结构+motif—1张图全显示!学习下吧!把论文里的图做漂亮!
日常科研中你我经会常遇到看不懂的图表,不会挖掘的数据,没有思路的文章,沟通不畅的个性化分析,求人不如求己,一切痛点都能解决:
1. 单细胞/空间转录组正在大火,高分文章必备,0基础学单细胞/空间转录组分析,做更牛的个性化分析,绘更漂亮的图,点这个链接:单细胞/空间转录组分析实操
2. 2区文章发文新思路,0实验就能发文章,省钱省时间,套路化内容好写易发表,0基础学习最新版基因家族分析/泛基因家族分析链接:最新基因家族分析 ;最新版泛基因家族分析
3. 转录组越做越普遍,实验必备,看不懂结果?不会深入分析?自学都可以搞定,学习链接:有参转录组自主分析实操 ;转录组与代谢组结果解读/个性化数据分析 ;
4. 代谢组分析硬件要求不高,个人电脑就可以分析,0基础学习链接:代谢组分析实操
3. 现在才是发表T2T基因组/泛基因组文章的好时机,成本低,好发表,做好高级个性化分析发表高分1区不是梦!T2T基因组/比较基因组/泛基因组分析学习链接:T2T基因组组装与注释分析;动植物泛基因组分析 ;比较基因组分析
4. 群体重测序遗传进化分析+GWAS文章,篇篇10+分,缩短分析周期,提升文章亮点,勇敢冲击NGS顶刊,学习链接:群体遗传进化GWAS分析 ;
5. 传统图位克隆研究方法经久不衰,有遗传群体,有性状,自己就可以做,学习链接:遗传图谱构建与QTL分析
6. 微生物16S/18S/ITS多样性分析和宏基因组分析,学习链接:宏基因组分析 ;微生物16S/18s/ITS多样性分析
7. 细胞器基因组与比较基因组分析是真正的无需实验就可以发表2区期刊的文章思路,成本低,文章好发,性价比极高,学习链接:线粒体基因组分析实操 ;叶绿体基因组分析实操
8. 数据分析硬件利器,个人分析能力的倍增器,好用便宜的云生信服务器,专门为高通量测序数据分析而生,了解链接:云生信服务器
9. 免费好课,个人能力提升,生信入门,不可错过,内容涵盖:生信语言与工具基础、R语言绘图、常见科研绘图、数据处理技能等,免费好课总入口:
10. 更多学习内容:linux、perl、R语言画图,更多免费课程请点击进入组学大讲堂网校学习
如果觉得我的文章对您有用,请随意打赏。你的支持将鼓励我继续创作!