找到约 15 条结果

问题 合并提取后的domain序列之后,linux系统中的clustalw不能读出蛋白信息

...个,依次类推 perl script/domain_xulie.pl WRKY_hmm_out.txt Arabidopsis_thaliana.TAIR10.pep.all.fa WRKY_domain.fa 1.2e-28 把WRKY_domain.fa和WRKY_domain2.fa的序列copy到同一个fasta文件中(用Editplus软件,复制两个文件的序列粘贴到一个新建文件中),clustalw不...

文章 ggplot中用字符窜传递变量名称列名等

... group=column ) ) } Another option (ggplot2 > 3.0.0) is to use the tidy evaluation pronoun .data to slice the chosen variable/column from the rates.by.groups data frame. library(ggplot2) theme_set(theme_classic(base_size = 14)) # created by @Moody_Mudskipper rates.by.grou...

文章 吐血推荐!来自科研老司机的国庆7天出游指南!

...们, 作为过来人劝你们几句,还是老老实实地 家里游 or 学校游吧。。。 最后, 如果大家一定要出去玩儿的话, 那么到底去哪儿人少又便宜?小众而又彰显学术实力?还能震慑整个朋友圈? 只有一个答案: 哈哈,开...

文章 转录组差异基因为什么要进行聚类分析?

...   聚类使用的为R中的聚类软件包,所针对的数据为union_for_cluster(差异基因的并集),以基因的相对表达水平值log2(ratios) 进行聚类。其采用相应的距离算法,算出每个基因之间的距离,然后通过反复迭代,计算基因之间的相对...

问题 基因家族分析,提取一个物种信息后,再次取提取另一物种cds 用基因的ID,作为序列的ID,总是无法运行,显示脚本不存在,但是LL查看脚本是存在的。

Can't open per1 script ''/work/gene_family/scripts//get_gene_longest_fa.p1'':No such file or directory

文章 uniref50 数据库下载及格式化

...l split_taxid_uniref.pl division.dmp nodes.dmp uniref90.fasta.gz ./ for i in PLN MAM INV PHG PRI ROD SYN UNA VRL VRT ENV BCT ;do diamond makedb --in ${i}_uniref90.fa -d  ${i}_uniref90.fa done

问题 R语言,KNN补值函数impute.knn函数

...         rng.seed = 362436069)  {   rng.state <- NULL   if (exists(".Random.seed")) {     rng.state <- .Random.seed   }   set.seed(rng.seed)   x <- data   p <- nrow(x)   col.nas <- drop(rep(1, p) %*% is.na(x))  #matrix multiplication   #count NA number in eac...

问题 重测序中SNP分析

...生成了pdf文件,没有jpg文件,报错提示如下:--> Q&A for bioinformatics, please visit the website: https://www.omicsclass.com/ --> R beginners ? I suggest your  learning  R language: https://study.omicsclass.com/index  SNP-Density Plotting. Error in seq.default(0, chor...

问题 重测序中SNP分析

...生成了pdf文件,没有jpg文件,报错提示如下:--> Q&A for bioinformatics, please visit the website: https://www.omicsclass.com/ --> R beginners ? I suggest your  learning  R language: https://study.omicsclass.com/index  SNP-Density Plotting. Error in seq.default(0, chor...

文章 docker 工具高级用法

... OFFICIAL AUTOMATED biocontainers/samtools Tools for manipulating next-generation seque… 11 [OK] mgibio/samtools-cwl Image containing samtools, for use in cwl wo… 3 [OK] pegi3...

文章 eggNOG 注注释报near "WITHOUT": syntax error

..., in initcurs.execute("PRAGMA synchronous=OFF;")sqlite3.DatabaseError: malformed database schema (prots) - near "WITHOUT": syntax error""" 解决办法,是centos7 系统中的sqlite 版本太低,需要单独安装sqlite3,并添加到环境变量中 I found solution for CentOS7 users.Bec...

文章 awk统计文件某列中某关键词出现次数

...计文件test.txt中第2列不同值出现的次数 awk '{sum[$2]+=1}END{for(i in sum)print i"\t"sum[i]}' test.txt 运行结果: 00 201 102 1 2、只统计文件test.txt中第2列"00"或"01"出现的次数 如只统计文件test.txt中第2列"00"或"01"出现的次数,命令可写为 awk...

文章 TWAS分析的原理和工具

...dixcan Gamazon,E.,Wheeler,H.,Shah,K.et al.A gene-based association method for mapping traits using reference transcriptome data. Nat Genet 47, 1091–1098 (2015). Predixcan是于2015年由一群芝加哥学者研发的,适用于个体级别的GWAS数据的TWAS分析软件,作者认为基因表...

文章 单细胞转录组数据挖掘流程记录-UM葡萄膜黑色素瘤(GSE139829)

...​ wget -c "https://www.ncbi.nlm.nih.gov/geo/download/?acc=GSE139829&format=file" -O GSE139829_RAW.tar #解包 tar xvf GSE139829_RAW.tar #不同批量重命名文件,并连接到不同文件夹 ​for i in BSSR0022 UMM041L UMM059 UMM061 UMM062 UMM063 UMM064 UMM065 UMM066 UMM067L UMM069;do ...

文章 单细胞转录组数据挖掘流程记录-BRCA乳腺癌(GSE161529)

...载 wget -c "https://www.ncbi.nlm.nih.gov/geo/download/?acc=GSE161529&format=file" -O GSE161529_RAW.tar wget -c "https://ftp.ncbi.nlm.nih.gov/geo/series/GSE161nnn/GSE161529/suppl/GSE161529%5Ffeatures.tsv.gz" -O GSE161529_features.tsv.gz​ #解压 tar xvf GSE161529_RAW.tar #由于数据是...