对vcf文件的一些问题

老师您好,vcf文件中样本下边如果是.您的意思是表示缺失,那我生成snp表示它的碱基用什么表示,如果一个样本的GT为0/1杂合子,那生成snp表时用0还是1呢老师

请先 登录 后评论

2 个回答

omicsgene - 生物信息
擅长:重测序,遗传进化,转录组,GWAS

做什么分析需要输出SNP表格?

如果一定要输出可以参考这个编码标准: https://www.omicsclass.com/article/409 

缺失用N 代替

请先 登录 后评论
Crossover

attachments-2021-04-mJt44WwC6077e6daa625c.png老师您好,我得问题是这样的,这是我拿到的VCF文件,我想生成SNP表来进行GWAS分析,我有一下几个问题:

1.REF和ALT如果显示碱基数量大于一个,但是只有一个有差异,那我在生成SNP表格的时候是按照那个不一样的表示吗?

2.关于样本的命名:每一个前面都有sm的标号,这个文件里有188sm 90sm和9sm,老师请问不同sm标号是因为他们测序时分批测得吗?是不是可以理解为188sm命名得那一组属于一个时间段测序的。

3:老师,样本下的GT如果为杂合子0/1,请问老师这个SNP位点的碱基参考的是REF还是ALT

4:老师,有的样本下面为.表示什么意思?在生成SNP表时有什么表示呢?

谢谢老师

请先 登录 后评论