$Rscript ../scripts/mclust_analysis.r -h
usage: ../scripts/mclust_analysis.r [-h] -i gene_data -m metadata [--mclust]
[-g group] [-n model_name] [-o outdir]
[-p prefix]
mclust analysis:https://www.omicsclass.com/article/1580
optional arguments:
-h, --help show this help message and exit
-i gene_data, --gene_data gene_data
input data file path[required]
-m metadata, --metadata metadata
input clinical information file path[required]
--mclust whether to cluster the samples[optional,default:False]
-g group, --group group
Group the samples into several
categories[optional,default:3]
-n model_name, --model_name model_name
input the model category to use[optional,default:VVE]
-o outdir, --outdir outdir
output file directory[optional,default cwd]
-p prefix, --prefix prefix
out file name prefix[optional,default metadata]
-i 输入基因的表达数据:
| ID | TCGA-A3-3319-01A-02R-1325-07 | TCGA-A3-3323-01A-02R-1325-07 |
| YTHDC2 | 16.5128725081007 | 20.6535652352011 |
| ELAVL1 | 44.3876796198438 | 31.8729000784291 |
-m 输入样本的临床信息:
| barcode | patient | TCGA_Study |
| TCGA-A3-3319-01A-02R-1325-07 | TCGA-A3-3319 | KIRC |
| TCGA-A3-3323-01A-02R-1325-07 | TCGA-A3-3323 | KIRC |
--mclust 是否对样本进行聚类
第一次运行脚本不进行聚类,通过返回的BIC(贝叶斯信息判别标准)结果选择合适的聚类数和模型类别
-n 输入选择的模型类别
mclust包中提供了14种模型(EII、VII、EEI、VEI、EVI、VVI、EEE、EVE、VEE、VVE、EEV、VEV、EVV、VVV)
-g 输入合适的聚类数
#第一次运行不指定g和n,通过BIC结果选择合适的g和n
$Rscript ../scripts/mclust_analysis.r -i m6a_gene_TPM.tsv -m ../metadata_surv_immu.tsv
#再次运行指定g和n,进行聚类
Rscript ../scripts/mclust_analysis.r -i m6a_gene_TPM.tsv \
-m ../metadata_surv_immu.tsv --mclust -g 3 -n VVE

含有样本聚类结果的文件:metadata_group.tsv
如果觉得我的文章对您有用,请随意打赏。你的支持将鼓励我继续创作!