vcf基因组坐标区间采用了“倒位 断点上游 + 倒位区间 + 下游”的记录,ANNOVAR 使用 SV 的基因组坐标区间,你的 INV 被记录为覆盖从 GeneA 附近 到 GeneB 附近,注释按这个区间来。
一个断点在 GeneA,另一个断点在 GeneB(或两者分别靠近两个基因),注释就会显示该 SV 影响 GeneA 和 GeneB。
你可以检查一下断点是否在两个基因的外显子/剪切区?也可以在IGV加载 BAM + VCF确定倒位仅为 65 bp,而非 19 kb 。
如果是按照现在你的描述去解释的话:该变异为 65 bp 的小规模倒位,其 5′ 和 3′ 断点分别位于 GeneA 和 GeneB 的外显子区域,导致两基因编码序列被破坏。ANNOVAR 注释显示影响两基因是基于 SV 断点所跨基因组区间。