还是要确保在第一步 基因家族初次鉴定 以及 在线数据库中二次确认时 基因家族结构域 的存在。对于结构域残缺的基因可以考虑删减。 也可以多看一些相关基因家族文献,看一下文献中该基因家族结构域的保守程度。
回答于 2024-08-26 16:50
结果文件genome.len中有两列,一列是输入序列文件的序列ID,一列是输入文件的序列长度。 你输入的序列文件中序列ID就是CAJGY开头的ID。代码运行的没有问题。 如果想要修改染色体ID,可以在最终配置文件 map_to_chr.txt中手动修改或者结果图中手动修改。注意修改之后保持整个分析中染色体ID一致
回答于 2024-08-26 12:35
可以在保留蛋白编码基因这一步时将--attribute biotype选项中biotype改成gbkey;--value protein_coding选项中protein_coding改成mRNA。尝试一下对原始gff文件过滤。你现在应该是没有完成过滤,protein_coding.gff3文件中还有非编码蛋白 不过这不影响后续分析。可以直接进行后续分析
回答于 2024-08-22 13:21
相似度更高,结果更好的。不过具体可以看一下模板序列和自己序列比对上的区域。另外PSIblast也可以调大-max_target_seqs参数看有没有比对上你想要的模板
回答于 2024-07-26 11:24
把“Intron”选项那里“intron rescale”参数改成No rescale。正常标尺就出来了。然后在AI上把正标尺改为负标尺。还不行就直接在Ai上画标尺。导出图片用SVG导出,然后另存为网页。
回答于 2024-07-26 11:05
是在上一步生成sam文件时出现问题。 命令: minimap2 -ax map-ont RNAseq.min RNA.clean.fa.gz >RNA.sam 在这一步中使用的测序结果数据RNA.clean.fa.gz是fasta格式的,错误。应该是fastq格式的才可以
回答于 2023-10-12 11:55