关于TCGA的下载,学了课程还是遇到点问题,求老师指点

老师的课程是讲的胆管癌,样本少,用老师的代码也没问题。但是自己实操中,遇到情况就有点复杂,不会用了。

我是要结肠癌和直肠癌,并且要腺癌的样本数据,有点复杂,这是我网页筛选条件,代码不知道怎么写。

attachments-2019-11-mzL5sBbs5dc9026b0f366.png

attachments-2019-11-EbhOynnp5dc90283a5510.png

看了论坛里老师筛选原发位点的帖子

attachments-2019-11-TBv27NAO5dc902b0c0ae9.png我想先根据原发位点筛一下

> library(GenomicDataCommons)

> resp = cases() %>% filter(~ {project.project_id=="TCGA-COAD"|project.project_id=="TCGA-READ"}&{primary_site =="colon"|primary_site="rectum"}) %>% GenomicDataCommons::select(c(default_fields(cases()),'samples.sample_type')) %>% response_all()

报错了。。。。。Error: No method asJSON S3 class: formula

然后其实也不明白就是获得了sample_download,后边的代码怎么写,请老师看看是这样么?

GDCdownload(query = sample_download,files.per.chunk=6, method='client')

data <- GDCprepare(query=sample_download)

data_expr <- assay(data)   


因为我最终需要的是结直肠癌腺癌基因表达数据。我也想过先结肠癌、直肠癌一个个下载下来,然后手动删掉不是腺癌的。可是老师的代码都是基于query,就是我手动整理好我也不知道后边代码怎么写。比如GDCprepare(?)

请先 登录 后评论

1 个回答

omicsgene - 生物信息
擅长:重测序,遗传进化,转录组,GWAS

数据下载,可根据TCGA网站的筛选条件添加GDCquery()参数,详情见:

https://www.omicsclass.com/article/1060

请先 登录 后评论