seqkit根据序列ID筛选fasta文件

#根据序列ID特点筛选对应ID序列
$ zcat hairpin.fa.gz | seqkit grep -r -p ^hsa
>hsa-let-7a-1 MI0000060 Homo sapiens let-7a-1 stem-loop
UGGGAUGAGGUAGUAGGUUGUAUAGUUUUAGGGUCACACCCACCACUGGGAGAUAACUAU
ACAAUCUACUGUCUUUCCUA
>hsa-let-7a-2 MI0000061 Homo sapiens let-7a-2 stem-loop
AGGUUGAGGUAGUAGGUUGUAUAGUUUAGAAUUACAUCAAGGGAGAUAACUGUACAGCCU
CCUAGCUUUCCU
#多次使用
$ zcat hairpin.fa.gz | seqkit grep -r -p ^hsa -p ^mmu -v
#根据ID提取序列
$ seqkit grep -f id.txt seqs.fq.gz -o result.fq.gz

# ignore case
$ seqkit grep -i -f id.txt seqs.fq.gz -o result.fq.gz

更多使用方法见：https://bioinf.shenwei.me/seqkit/usage/

发表于 2022-08-09 11:05
阅读 ( 4703 )
分类：linux

seqkit根据序列ID筛选fasta文件

你可能感兴趣的文章

相关问题

0 条评论

作家榜 »