基因交流分析是群体遗传学中研究种群间基因流动和历史关系的重要工具。本文将为你介绍几种关键的统计量,帮助理解它们的独特作用。
D统计量,又称ABBA-BABA检验,是检测基因交流的基础方法。
原理:通过比较四个种群的(P1, P2, P3, 外群),检测"ABBA"和"BABA"模式的不平衡性。显著偏离零的D值表明P2/P3或者P1/P3之间存在基因交流。
ABBA:等位基因在 P3 和 Outgroup 中匹配,但与 P1 和 P2 不同(支持 P1-P3 基因流)。
BABA:等位基因在 P2 和 Outgroup 中匹配,但与 P1 和 P3 不同(支持 P2-P3 基因流)
计算公式:
显著性检验:
结果解读:D≈0:无显著基因交流 ;D显著>0:P2与P3有基因交流 ;D显著<0:P1与P3有基因交流。
在群体中的计算公式:
基于各个群体的衍生等位基因频率进行D统计分析,前提条件是pi4=0。
f4统计量是D统计量的扩展,提供了更灵活的基因交流检测框架。它衡量的是两对群体(A, B)和(C, D)之间的等位基因频率差异的相关性。计算公式:f4(A,B;C,D)=E[(a−b)(c−d)]f4(A,B;C,D)=1/2(f2(A,D)+f2(B,C)-f2(A,C)-f2(B,D))结果:f4显著<0:A/D或者B/C之间存在基因流;f4显著>0:A/C或者B/D之间存在基因流。注意:当A作为Outgroup的时候,就变成了D统计,BCD分别为P3、P2、P1。若f4>0,则B与D之间有基因流;若f4<0,则B与C之间有基因流。
f4-ratio利用f4统计量的比值来估计混合比例,由Joe Pickrell和David Reich团队开发。
原理:以P2和P3完全一致的情况作为分母(此时把P3分成两个亚群,分别为P3a和P3b),计算当前群体间P2和P3之间的基因流程度。S是D统计值的分子。
计算公式:
fbranch
在一个研究中,我们通常会沿着同一个系统发育树的结构抽取种群子集进行P1/P2/P3/O这样的树的结构计算,会得到许多高度相关的D值和f4-ratio的值。f-branch通过比较不同分支上的基因共享程度,帮助确定基因流的具体方向。
计算公式:
其中B是b衍生的群体或分类群;A是b的姐妹分支衍生的后代。固定下来O和P3之后,在A和B里面随机抽取个体,进行f4 ratio的计算。先固定下来A,计算B里面两个样本的f4 ratio,取最小值固定下来,接下来计算A里面三个样本的f4 ratio的中位数,就得到了fb。
结果展示:
fdm
fdm(f-distance method)是一种基于遗传距离的基因交流检测方法。原理:计算观测种群间的遗传距离(f统计量)与无基因流情况下的期望距离,通过比较观测值与期望值的偏差来检测基因流。计算公式:
结果解读:fdm>0:定位P2和P3之间的渗入;fdm<0:定位P1和P3之间的渗入几种统计方法汇总:
参考资料:
f4:https://reich.hms.harvard.edu/sites/reich.hms.harvard.edu/files/inline-files/preprints202003.0237.v2.pdf
fb:https://www.nature.com/articles/s41559-018-0717-x
Dsuite:https://onlinelibrary.wiley.com/doi/epdf/10.1111/1755-0998.13265
如果觉得我的文章对您有用,请随意打赏。你的支持将鼓励我继续创作!