LD衰减分析

您好,课程的数据demo关于GWAS中的LD衰减分析中的脚本是PopLDdecay -InVCF  ../00.filter/all.varFilter.vcf.gz \

        -SubPop  popid.txt -MaxDist 500 -OutStat ld.stat。然而在群体遗传进化LD衰减分析中的脚本是 PopLDdecay -InVCF  $workdir/00.filter/clean.vcf.gz \

        -SubPop  ${i}_popid.txt -MaxDist 500 -OutStat ${i}.stat

    Plot_OnePop.pl -inFile ${i}.stat.gz -output ${i}.ld。请问具体分析中是使用all.varFilter.vcf.gz文件还是clean.vcf.gz ?同样使用示例的水稻的数据进行LD衰减分析时发现,all.varFilter.vcf.gz文件和clean.vcf.gz文件绘制出的图是不一样的。第二个问题是:请问老师LD衰减分析中bin.gz文件是怎么生成的?结果文件中好像只有stat.gz文件。

请先 登录 后评论

1 个回答

omicsgene - 生物信息
擅长:重测序,遗传进化,转录组,GWAS

过滤条件不一样得到的vcf文件不一样,自己选择好过滤条件,用那个vcf都行;

Plot_OnePop.pl 会自动对结果取bin平滑曲线生成:*.bin.gz 文件,你也可以查看他的帮助,自己设置bin


Usage:    Plot_OnePop.pl  -inFile  LDdecay.stat.gz  -output OUT
Options
-inFile    <s> :  Input PopLDDecay OutPut Stat File
-inList    <s> :  Input FileList if multi-File of PopLDDecay OutPut Stat
-output    <s> :  Output Figure File Prefix
-bin1      <n> :  the size bin for mean r^2/D' of Short Dist[10]
-bin2      <n> :  the size bin for mean r^2/D' of Long Dist [100]
-break     <n> :  break point to distinguish Short or Long Dist[100]
-maxX      <n> :  max X coordinate Dist to plot LDdecay[kb] [maxDist]
-measure   <s> :  use the [r2/D/both] to measure LD decay [r2]
-method    <s> :  Plot methold (MeanBin/HW/MedianBin/PercentileBin)[MeanBin]
-percent   <f> :  percent ratio(0-1) for PercentileBin method [0.5]
-keepR         :  keep the R script for draw the LDdecay Fig
-help          :  show this help
请先 登录 后评论