1.你看下你的CDS序列ID在不在GFF里面,检查一下;如果不在说明两个文件有问题。 2.你的GFF文件第三列只有mRNA信息,缺失GENE信息建议添加一下:https://www.omicsclass.com/article/816 如果检查完毕,就可以继续往下分析了;
回答于 2019-11-11 16:47
通常只有的网络错误,都很诡异,毕竟长城在这里。 解决方式也简单,加上代码: options( 'download.file.method.GEOquery' = 'libcurl' ) 即可! 再次运行后如下: > options( 'download.file.method.GEOquery' = 'libcurl' )> ###获取数据> gset = getGEO(GSE, GSEMatrix =TRUE, AnnotGPL=TRUE,destdir=workdir)...
回答于 2019-11-11 16:42
数据下载,可根据TCGA网站的筛选条件添加GDCquery()参数,详情见: https://www.omicsclass.com/article/1060
回答于 2019-11-11 16:00
可以查看hmmsearch的帮助,自定义设置搜索参数:官方说明 http://eddylab.org/software/hmmer/Userguide.pdf
回答于 2019-11-11 15:57
可以用MCScanX做比较基因组分析,看看其他地方是否有同源区域,具体操作过程可看基因家族实操课程:学习链接:基因家族分析实操课程、
回答于 2019-11-11 13:55
查看自己的GFF格式是否标准,主要看第二列,和最后一列; 第二列得有gene,mRNA信息,最后一列的ID要与CDS里面的转录本ID一致。就能适用课程中的脚本: https://www.omicsclass.com/article/816
回答于 2019-11-11 13:53
只要是ID列表就行,都可以使用的,程序主要读取文件第一列ID数据 除非是要截取结构域所在的位置,domain序列需要后续的位置信息。
回答于 2019-11-11 10:22
是性状或者表型数据吧, 这个是样品的一些调查数据,如果你的样品没有表型数据就不能做关联数据
回答于 2019-11-11 10:21