泛基因组 结构变异 注释

结构变异的vcf文件,一个倒位,长度为65bp,但是在ref位置上存在19kb的碱基,alt位置上也存在约19kb的碱基,且这两者的差值-1刚好等于65bp。经过annovar注释,该倒位影响了两个基因,获得终止密码子,导致基因功能丢失,然而一个只有65bp长度的倒位是无法同时影响两个距离在1kb左右的两个基因,请问该如何解读这个情况?

请先 登录 后评论

1 个回答

Ti Amo

vcf基因组坐标区间采用了“倒位 断点上游 + 倒位区间 + 下游”的记录,ANNOVAR 使用 SV 的基因组坐标区间,你的 INV 被记录为覆盖从 GeneA 附近 到 GeneB 附近,注释按这个区间来。
一个断点在 GeneA,另一个断点在 GeneB(或两者分别靠近两个基因),注释就会显示该 SV 影响 GeneA 和 GeneB。
你可以检查一下断点是否在两个基因的外显子/剪切区?也可以在IGV加载 BAM + VCF确定倒位仅为 65 bp,而非 19 kb 。
如果是按照现在你的描述去解释的话:该变异为 65 bp 的小规模倒位,其 5′ 和 3′ 断点分别位于 GeneA 和 GeneB 的外显子区域,导致两基因编码序列被破坏。ANNOVAR 注释显示影响两基因是基于 SV 断点所跨基因组区间。

请先 登录 后评论
  • 0 关注
  • 0 收藏,32 浏览
  • 仰望天空 提出于 13小时前