不同物种构建泛基因组的时候需要用到Progressive Cactus
参考文章:Dense sampling of bird diversity increases power of comparative genomic
软件github:https://github.com/ComparativeGenomicsToolkit/cactus
选择的是Pre-compiled Binaries Linux Tarball这个版本:
wget https://github.com/ComparativeGenomicsToolkit/cactus/releases/download/v2.9.9/cactus-bin-v2.9.9.tar.gz
# 解压缩
tar -xzf cactus-bin-v2.9.9.tar.gz
# 进入文件夹
cd cactus-bin-v2.9.9
# 要构建 python virtualenv 并激活,执行以下步骤。这需要 Python 版本 >= 3.9
# 在当前文件夹下面创建了一个venv-cactus-v2.9.9的文件夹,以后激活也得记得环境所在的路径
virtualenv -p python3 venv-cactus-v2.9.9
# 把现在的环境给到虚拟环境
printf "export PATH=$(pwd)/bin:\$PATH\nexport PYTHONPATH=$(pwd)/lib:\$PYTHONPATH\nexport LD_LIBRARY_PATH=$(pwd)/lib:\$LD_LIBRARY_PATH\n" >> venv-cactus-v2.9.9/bin/activate
如何使用:
# 激活环境
source venv-cactus-v2.9.9/bin/activate
# 执行一些下载的指令
python3 -m pip install -U setuptools pip wheel
python3 -m pip install -U .
python3 -m pip install -U -r ./toil-requirement.txt
# 某些工具需要 ,并且不包括在内,必须单独下载
# 这个时候还在cactus-bin-v2.9.9这个文件夹下
cd bin
# 要给可执行的权限
for i in wigToBigWig faToTwoBit bedToBigBed bigBedToBed axtChain pslPosTarget bedSort hgGcPercent mafToBigMaf hgLoadMafSummary hgLoadChain; do
wget -q http://hgdownload.cse.ucsc.edu/admin/exe/linux.x86_64/${i};
chmod +x ${i};
done
总体参考:
cactus/BIN-INSTALL.md 在 v2.9.9 ·ComparativeGenomicsToolkit/cactus ·GitHub
如果下载的是源代码或者在docker里面使用可以参考这个:
cactus/README.md 在 v2.9.9 ·ComparativeGenomicsToolkit/cactus ·GitHub
source venv-cactus-v2.9.9/bin/activate
# 看看能不能找到
which cactus
# 看看版本编号
cactus --version
可以尝试运行作者给出的小示例:
cactus ./jobstore ./examples/evolverMammals.txt ./evolverMammals.hal
# evolverMammals.hal是产生的结果
# ./examples/evolverMammals.txt是运行必须的配置文件,其中第一行是物种树,后面每一行是两列,第一列是ID,第二列是数据所在路径
后续处理可以参考:
如果觉得我的文章对您有用,请随意打赏。你的支持将鼓励我继续创作!