$Rscript ../scripts/mclust_analysis.r -h
usage: ../scripts/mclust_analysis.r [-h] -i gene_data -m metadata [--mclust]
                                    [-g group] [-n model_name] [-o outdir]
                                    [-p prefix]
mclust analysis:https://www.omicsclass.com/article/1580
optional arguments:
  -h, --help            show this help message and exit
  -i gene_data, --gene_data gene_data
                        input data file path[required]
  -m metadata, --metadata metadata
                        input clinical information file path[required]
  --mclust              whether to cluster the samples[optional,default:False]
  -g group, --group group
                        Group the samples into several
                        categories[optional,default:3]
  -n model_name, --model_name model_name
                        input the model category to use[optional,default:VVE]
  -o outdir, --outdir outdir
                        output file directory[optional,default cwd]
  -p prefix, --prefix prefix
                        out file name prefix[optional,default metadata]
-i 输入基因的表达数据:
| ID | TCGA-A3-3319-01A-02R-1325-07 | TCGA-A3-3323-01A-02R-1325-07 | 
| YTHDC2 | 16.5128725081007 | 20.6535652352011 | 
| ELAVL1 | 44.3876796198438 | 31.8729000784291 | 
-m 输入样本的临床信息:
| barcode | patient | TCGA_Study | 
| TCGA-A3-3319-01A-02R-1325-07 | TCGA-A3-3319 | KIRC | 
| TCGA-A3-3323-01A-02R-1325-07 | TCGA-A3-3323 | KIRC | 
--mclust 是否对样本进行聚类
第一次运行脚本不进行聚类,通过返回的BIC(贝叶斯信息判别标准)结果选择合适的聚类数和模型类别
-n 输入选择的模型类别
mclust包中提供了14种模型(EII、VII、EEI、VEI、EVI、VVI、EEE、EVE、VEE、VVE、EEV、VEV、EVV、VVV)
-g 输入合适的聚类数
#第一次运行不指定g和n,通过BIC结果选择合适的g和n
$Rscript ../scripts/mclust_analysis.r -i m6a_gene_TPM.tsv -m ../metadata_surv_immu.tsv
#再次运行指定g和n,进行聚类
Rscript ../scripts/mclust_analysis.r -i m6a_gene_TPM.tsv \
    -m ../metadata_surv_immu.tsv --mclust -g 3 -n VVE 

含有样本聚类结果的文件:metadata_group.tsv
 
                如果觉得我的文章对您有用,请随意打赏。你的支持将鼓励我继续创作!