1: VanRaden是最经典的,但是很多r包比如rrBLUP反而是用的ncol(X)这里的这个逻辑,因为对很多数据集来说计算难度还有数据集完整度也是需要考虑的
使用我们这里的计算方法,数学意义更直观(对角线都是1),生物学意义则是会被削弱
但是不影响育种应用相关的结果(相关系数,排名选择准确性),会影响方差组分的绝对值
2:
final_fm$mu 是群体均值
final_fm$ETA[[1]]$u 是每个训练集个体的育种值
solve(G11) 训练集个体间的亲缘关系矩阵(剥掉个体间共享的亲缘背景)
G21 预测集个体x训练个体的亲缘关系
最后实际上是
预测值 = 群体均值 + 亲缘加权 × 训练集真实遗传效应
和贝叶斯不一样,但是本质上等价于 先反推出标记效应,再乘回新基因型,只是用矩阵运算一步完成
因为gblup不估计标记效应而是直接估计育种值,只能绕一下