进行gsea分析的时候需要gmt文件,需要到官网进行下载。官网需要注册一下才可以进行下载。
官网网址:https://www.gsea-msigdb.org/gsea/index.jsp
直接进入http://www.gsea-msigdb.org/gsea/downloads.jsp路径的话会有很多内容,不好找自己要下载的东西:

需要下载的话可以到这个网址,大部分情况下,如果做human相关的分析可以选择我标出来的这两个下载:https://www.gsea-msigdb.org/gsea/msigdb/index.jsp

其中C2是人工整理的基因集(7561 个基因集)
C2 集合分为以下两个子集:化学与遗传扰动(Chemical and genetic perturbations, CGP)和经典通路(Canonical pathway, CP)。
CGP:化学与遗传扰动
CGP 子集的大部分数据来源于生物医学文献的整理工作。通过微阵列和测序研究,已鉴定出许多重要生物学和临床状态(如癌症转移、干细胞特性、耐药性)的特征基因集。与旨在反映细胞过程通用描述的通路数据库不同,CGP 主要提供源自扰动实验的特定靶向特征集。其中多组基因集成对出现:xxx_UP(及 xxx_DN)基因集分别代表受扰动诱导(及抑制)的基因。大多数 CGP 集均从出版物中整理而来,包含 PubMed 引文链接、基因集具体来源(如表 1)以及 GEO 或 ArrayExpress 数据库中对应原始数据的链接。当基因集涉及遗传扰动时,其简要描述会包含 NCBI(Entrez)基因数据库中该基因条目的链接;若涉及化学扰动,则描述中包含 NCBI PubChem Compound 数据库相应化合物条目的链接。
CP:经典通路
这个基因集是通过多个在线数据库整理而来。
BioCarta pathway database
KEGG MEDICUS pathway database
PID pathway database
Reactome pathway database
Wikipathways pathway database
KEGG pathway database (canonical pathways gene sets)
参考:https://cloud.tencent.com/developer/article/2538767
如果觉得我的文章对您有用,请随意打赏。你的支持将鼓励我继续创作!