3 老师,想请教一下TCGA基因表达数据的问题,我从xena.ucsc网页上下载了基因表达数据TCGA-CESC.htseq_counts.tsv;然后发现该数据中只有Ensembl格式的基因ID ,没有SYMBOL格式的。所以接下来进行基因ID格式转换,却发现同一个SYMBOL ID对应的多个Ensembl格式的ID,想问下老师,这种情况该怎么处理?同一个SYMBOL ID所对应的多个Ensembl格式ID的基因表达数据应该留下哪一个?

attachments-2021-10-RalXMAAS61766587a272d.png


请先 登录 后评论

1 个回答

omicsgene - 生物信息
擅长:重测序,遗传进化,转录组,GWAS

TCGA 中的 ensembl ID 和基因symbol ID 对应表下载地址:https://gdc.cancer.gov/about-data/gdc-data-processing/gdc-reference-files  

相同的可以取平均值或者最大值;


TCGA数据下载与分析:TCGA免疫浸润分析课程:https://study.163.com/course/introduction/1211864801.htm?share=1&shareId=1030291076

请先 登录 后评论