生物汪天天和基因打交道,不过总有人分不清CDS、cDNA、ORF、外显子、内含子等等的概念和关系,今天小编就梳理一下,希望对您的科研有所帮助!
真核生物:
下面先从真核生物开始,小编在网上找了个图片,希望原作者不要见怪。
大多数真核基因都是由蛋白质编码序列和非蛋白质编码序列两部分组成的。基因中的编码序列称为外显子(exon),而基因中的非编码序列称为内含子(intron)。在一个结构基因中,编码某一蛋白质不同区域的各个外显子并不是连续地排列在一起的,而是常常被长度不同的内含子所隔离,形成镶嵌排列的断裂方式。
我们常说的“基因”严格来讲是指:负载特定生物遗传信息,能够产生一条多肽链或功能RNA所必需的DNA分子片段,不但包括编码区,还包括5'-端和3'-端两侧特异性序列,虽然这些序列不编码氨基酸,但在基因表达的过程中起着重要的作用。
1. mRNA:
大家平时接触较多的转录组测得是mRNA,并不是严格意义上的基因,而是基因信息的载体,称作Messenger RNA (mRNA)--信使核糖核酸,如下如所示:
真核生物mRNA一般由5′端帽子结构、5′端UTR区、编码区、3′端UTR区和3′端聚腺苷酸尾巴构成,真核生物mRNA通常都有相应的前体。从DNA转录产生的原始转录产物可称作 原始前体(或mRNA前体)。一般认为原始前体要经过hnRNA核不均-RNA的阶段,最终才被加工为成熟的mRNA。所以,生物汪嘴里经常说的什么启动子、增强子、沉默子、顺式作用元件等都是DNA序列上的结构概念,mRNA里面是不包含的!
2. cDNA:
cDNA是以mRNA为模板,在适当引物的存在下,由mRNA经过反转录而得到的DNA,是mRNA链互补的DNA链,其内部已无内含子等结构,值得说明的是,目前火热的二代测序均是先将RNA反转录组成cDNA再进行测序的。
3. CDS与ORF:
这是一个经常被人混淆的两个概念;CDS是Coding sequence的缩写,是指编码一段蛋白产物的序列,是与蛋白质密码子一一对应的序列,注意其与mRNA序列的差异;ORF是open reading frame的缩写,翻译成开放阅读框,是指从一个起始密码子开始到一个终止密码子结束的一段序列,但并不是所有读码框都能表达出蛋白产物;CDS必定是一个ORF,但也可能包括多个ORF,相反,每个ORF不一定都是CDS。
4. 单拷贝基因与基因家族
单拷贝基因指在基因组中只出现一次,多是编码蛋白质的基因,真核生物中有25%~50%的基因是以单个基因存在的,而其余编码蛋白质的基因以基因家族形式存在;基因家族是来源于同一个祖先,由一个基因通过基因重复而产生两个或更多的拷贝而构成的一组基因,它们在结构和功能上具有明显的相似性,编码相似的蛋白质产物,欲更详细了解基因家族形成、特征请参见课程:基因家族分析实操课程。
5. 假基因
假基因也叫伪基因,他是基因家族在进化过程中形成的无功能的残留物。它与正常基因相似,但丧失正常功能的DNA序列,往往存在于真核生物的多基因家族中,一般情况都不被转录,且没有明确生理意义。
原核生物:
原核基因组结构较真核生物要简单很多,一般只有一个环状的DNA分子,基因组中无内含子,少有的重复序列,多为单拷贝基因。
原核生物( 包括病毒) 的mRNA 多是多顺反子,即可以有几个基因同时被转录成一个mRNA,共同使用一个启动调控区,而真核生物多是单顺反子,即一次只转录出一个基因;原核生物mRNA与真核不同,无5′端帽子结构和3′端聚腺苷酸尾巴。
好了,今天就先介绍下这些,假如还有需要整理的信息请下方留言,小编希望与您共同学习进步!
总有同学咨询基因家族分析类文章可以投哪些期刊,闲暇之余,小编就整理了一下接收过基因家族分析类文章的期刊,供您投稿时参考!
此Excel包含信息如下:期刊名称、期刊名缩写、影响因子、中科院分区、大小学科分类、录用比例、审稿周期、期刊主页网址,部分期刊列表见下方截图(领取方法见文末):
如您需要此汇总表,请关注组学大讲堂公众号,转发该文章至您的朋友圈并截图,然后在公众号对话框内发送截图并留言关键词:期刊,即可获得该excel统计表(注意关键词需写全)。
假如您想自学基因家族分析技能或者想分析某家族基因都可以联系本公众号小编微信:llcheng1314.
日常科研中你我经会常遇到看不懂的图表,不会挖掘的数据,没有思路的文章,沟通不畅的个性化分析,求人不如求己,一切痛点都能解决:
1. 单细胞/空间转录组正在大火,高分文章必备,0基础学单细胞/空间转录组分析,做更牛的个性化分析,绘更漂亮的图,点这个链接:单细胞/空间转录组分析实操
2. 2区文章发文新思路,0实验就能发文章,省钱省时间,套路化内容好写易发表,0基础学习最新版基因家族分析/泛基因家族分析链接:最新基因家族分析 ;最新版泛基因家族分析
3. 转录组越做越普遍,实验必备,看不懂结果?不会深入分析?自学都可以搞定,学习链接:有参转录组自主分析实操 ;转录组与代谢组结果解读/个性化数据分析 ;
4. 代谢组分析硬件要求不高,个人电脑就可以分析,0基础学习链接:代谢组分析实操
3. 现在才是发表T2T基因组/泛基因组文章的好时机,成本低,好发表,做好高级个性化分析发表高分1区不是梦!T2T基因组/比较基因组/泛基因组分析学习链接:T2T基因组组装与注释分析;动植物泛基因组分析 ;比较基因组分析
4. 群体重测序遗传进化分析+GWAS文章,篇篇10+分,缩短分析周期,提升文章亮点,勇敢冲击NGS顶刊,学习链接:群体遗传进化GWAS分析 ;
5. 传统图位克隆研究方法经久不衰,有遗传群体,有性状,自己就可以做,学习链接:遗传图谱构建与QTL分析
6. 微生物16S/18S/ITS多样性分析和宏基因组分析,学习链接:宏基因组分析 ;微生物16S/18s/ITS多样性分析
7. 细胞器基因组与比较基因组分析是真正的无需实验就可以发表2区期刊的文章思路,成本低,文章好发,性价比极高,学习链接:线粒体基因组分析实操 ;叶绿体基因组分析实操
8. 数据分析硬件利器,个人分析能力的倍增器,好用便宜的云生信服务器,专门为高通量测序数据分析而生,了解链接:云生信服务器
9. 免费好课,个人能力提升,生信入门,不可错过,内容涵盖:生信语言与工具基础、R语言绘图、常见科研绘图、数据处理技能等,免费好课总入口:
10. 更多学习内容:linux、perl、R语言画图,更多免费课程请点击进入组学大讲堂网校学习
如果觉得我的文章对您有用,请随意打赏。你的支持将鼓励我继续创作!