在理想的状态我们希望数据没有缺失值。不幸的是,由于各种原因,缺失值会时有发生。这会带来问题。无法在不完整的数据矩阵上进行聚类分析。
Husson和Josse写了一个称为missMDA的包,可以用imputePCA()函数进行缺失值的填充。
library("missMDA")
df=read.table("aa.txt",header = T,row.names = 1,sep="\t")
df=log1p(df)
res.comp <- imputePCA(df,ncp=2)
clustering <- hclust(dist(res.comp$completeObs), method = "complete")
plot(clustering)

如果觉得我的文章对您有用,请随意打赏。你的支持将鼓励我继续创作!
