bcftools建索引报错:Chromosome blocks not continuous

bcftools建索引时报错“染色体区段不连续”

bcftools建索引时报错了(Chromosome blocks not continuous):

attachments-2024-03-FAVgRO7365e5421ddf76d.png

此时并不知道报错内容中所指的“染色体区段不连续”是什么问题

查看vcf文件前几行:

attachments-2024-03-bAunJoMN65e542609c463.png

发现VCF文件似乎排序有问题,于是提取了前几行建索引:

zcat filter2.vcf.gz|head -n 100 >filter6.vcf.gz

bcftools index -t filter6.vcf.gz

结果也是成功的:

attachments-2024-03-iADB9Wcl65e542dbe8a92.png

怀疑报错所说的“染色体区段不连续”是指:①染色体没有根据顺序进行排列,②部分变异位点没有根据在染色体上的位置进行排序,所以对VCF文件进行排序(尝试使用bcftools、picard和tassel排序,发现bcftools较快):

nohup bcftools sort  test.vcf.gz  -o  test.sort.vcf &

报错问题解决。

  • 发表于 2024-03-04 11:46
  • 阅读 ( 202 )
  • 分类:重测序

你可能感兴趣的文章

相关问题

0 条评论

请先 登录 后评论
每天学习一点点
每天学习一点点

32 篇文章

作家榜 »

  1. omicsgene 658 文章
  2. 安生水 328 文章
  3. Daitoue 167 文章
  4. 生物女学霸 120 文章
  5. 红橙子 78 文章
  6. CORNERSTONE 72 文章
  7. xun 68 文章
  8. rzx 67 文章