Evening
Evening

性别: 注册于 2024-07-30

向TA求助
13金币数
370 经验值
0个粉丝
主页被访问 1164 次

3 个回答

1 赞同

GWAS分析绘制QQ图时,Observed值与Expected值相差较大

整整两天,梳理了两三遍数据,原来是因为表型数据的样本名称和.vcf文件的样本名称不匹配(-和_不统一),从而导致模型拟合度很差,P值填充的NaN值比例高达44%,而正常绘图的NaN值比例仅为10%左右,下面这两张曼哈顿图也是同样的原因

回答于 2025-05-19 10:46

0 赞同

根据覆盖度及比对率如何剔除样品、gatk VariantFiltration过滤

好的老师,我根据您的回答又去百度了一下,直接删除覆盖度低、比对率的样本过于粗暴,它们或许含有很重要的变异位点,-在vcftools中设置-max-missing 0.7 --minDP 4参数删除下低质量变异位点就行,谢谢您啦

回答于 2025-01-13 12:00

0 赞同

老师,您好,我在运行gatk的HaplotypeCaller时,因为样本过多(...

老师您好,应该就是我占用内存太多了,上传的任务太多了。 老师,我还想请教一下, 我去问了我们学院做重测序的师弟,他说最多也就放5个,他是2G基因组,也是10X的,但是他一个样本就是占用400%的CPU,七八个小时就结束了,我的基因组是1.37G的,10X的测序,我现在的一个样本是差不多150%-200%的CPU,按之前的经验也要两天...

回答于 2024-10-23 12:07