我用BLINK模型做GWAS发现,分别将pca=3、pca=5、pca=10作为协变量,曼哈顿图峰越来越明显,但是P值在逐渐降低,而且显著位点也越来越少。PCA的数量该怎么选呢?用群体结构得到的Q矩阵会更好一点吗?
1. 当你增加PCA数量时,模型引入了更多的协变量来校正群体结构,使得模型对表型变异的解释更加严格,这会导致你p越来越大。2. 背景噪音被有效校正,也会导致峰越来越明显。3. PCA数目选择标准可以基于qq图,如果大部分散点紧贴对角线,只有少数极端值偏离,说明模型拟合良好。4. 群体结构得到的Q矩阵进行矫正效果没有显著优于PCA。除非你的研究群体是高度分化的、界限分明的几个亚群,且你明确知道K值。
老师,这三张图依次是PCA=3、5、10的QQ图,PCA=3时尾部上翘更明显,是否说明PCA=3要优于其他两个?