找到约 15 条结果

文章 R语言数据筛选整理包dplyr 分类汇总

...文包括一些示例和如何使用使用dplyr软件包来清理和转换数据。这是一个关于数据操作和数据处理的完整教程。 什么是dplyr? dplyr是一个强大的R软件包,用于处理,清理和汇总非结构化数据。简而言之,它使得R中的数据探索和...

文章 如何按照影响因子筛选文章--PubMed文献搜索技巧

...可少的基本技能。 在搜索文献时,我们常常会用到PubMed数据库。通过关键词搜索文献是最简单也最常用的方法,比如搜索和"transcriptome"相关的文章,搜索结果是50437篇文章。如此多的文章,我们该如何找到我们想要的呢? ...

问题 老师,您好。我完全按照视频课程整理好自己的数据,按照相同的操作,案例数据可以出图,自己的数据却不行。您可以指导一下么?我的OTU ID不对么?还是我的丰度值太大呢?我没有搞明白我的数据错在哪里还是说筛选的时候要更改设置?感谢!

文章 如何将GEO芯片注释文件整理成GSEA能使用的芯片注释文件?

在作GSEA分析时,有时候我们会使用GEO数据库中的芯片数据,使用芯片数据分析就必须要有芯片注释文件,下面就跟大家分享如何将GEO数据库中的注释文件整理成GSEA软件可以使用的芯片注释文件。 下图是GSEA分析需要的芯片注释...

问题 代谢物分子注释结果的筛选

非靶向代谢组学数据,progenesis QI软件的下机数据有两部分,一个measurements的定量文件和一个identifications的定性文件。 问题是这样的: 在定量文件里,compound列的每个值是唯一的,但在定性文件里,compound列与注释得到的分子名...

文章 如何下载TCGA中指定Primary Site的样本数据

...析》课程中,我们介绍了采用TCGAbiolinks 去下载GDC上的TCGA数据。但是最近有学员想基于“Primary Site” 筛选一下样本,只对其中的一种类型进行分析。 如下图所示: 我查看了一下TCGAbiolinks的文档,发现该软件包不支持对Primary Si...

文章 如何用R筛选出高表达的基因,低表达基因

基因表达数据矩阵,输入数据截图: 代码部分: myfpkm<-read.table("All_gene_fpkm.txt",header=TRUE,comment.char="",sep = "\t",check.names=FALSE,row.names=1)head(myfpkm)myfpkm[order(rowSums(myfpkm),decreasing=T)[1:5000],]  #筛选表达量高的前5000个基因myfpkm[rowSum...

文章 转录组数据分析

转录组差异基因的筛选 关键代谢通路的筛选 转录组数据的质控 转录组(transcriptome)是指特定生物体在某种状态下所 有基因转录产物的总和,转录组研究是功能基因组研究的 一项重要内容。转录组是连接基因组遗传信息与生...

问题 老师您好:关于TCGA的生存分析,用训练集train来做单因素的生存分析筛选有意义的基因,为什么在鲁棒性分析的时候不用训练集,而是整个数据集exprSet呢?

文章 胃癌免疫侵润预后Signature数据挖掘-糖酵解

...oi:10.3389/fonc.2020.01778. eCollection 2020. 文章分析分析思路 数据:TCGA数据库中375例胃癌表达数据用于模型构建,GEO数据库3个数据集用于模型验证, GSE26253 (n = 394), GSE26901 (n = 109), GSE66229 (n =300) ,对于生存期<30天的样本进行删除,...

文章 使用官方gdc-client软件下载TCGA数据

要是有gdc-client软件下载数据,需要以下三步才能完成: 1、GDC筛选检索下载需要数据的Manifest文件 TCGA改版后,下载方式变得大为不同,数据都整合在GDC(Genomic Data Commons)的DATA PORTAL中,网址:https://portal.gdc.cancer.gov/ 建议大...

问题 有关基因家族鉴定学习课程的问题:在利用hmmer软件鉴定基因家族成员的过程中,domain脚本运用时需要输入的域值是一定的吗?不是的话是怎么设定呢?(讲解的课程上是1e-20)那之后的将最终生成的txt文件数据复制在表格中进行筛选的域值 (拟南芥筛选的是0.01)跟之前的设定域值有关系吗?

文章 GEO、TCGA多数据库联合挖掘胰腺导管腺癌预后关键基因

...低于5%,是目前主要致死的癌症之一。如何结合多个公开数据数据分析和挖掘此类癌症临床诊断和预后的关键基因呢?这里就给大家介绍一篇文献:基于共表达分析鉴定胰腺导管腺癌进展与预后的10个关键基因。 数据来源基于...

问题 motif筛选的条件

你好老师,我想问一下motif的长度最短应该根据什么来定,最长是否需要比pfam数据库中观测到的长度要长

文章 2019年国自然基金热点方向——CRISPR/Cas9技术

...果已经公布了, 这个预测准不准呢?额,可能暂且还没有数据来证明, 但是——众所周知,SCI是国自然的敲门砖,CRISPR/Cas自诞生以来,迅速发展,已经成为生命科学领域最耀眼、最有前景的技术, 并且,据统计,使用了CRISPR...