找到约 15 条结果

问题 如何修改perl脚本从cds文件中提取上游序列呢?(有些cds中的scaffold可能不足1500)

...t->close(); (上面是脚本的代码) 我用该代码运行我的数据是会显示 请问我应该怎么修改脚本去完成上游序列的提取呢?

问题 蛋白三维结构预测遇到问题:当在swiss-model中选择使用模板的方法时,在上传模板的时候发现因为以下问题没法上传

...otein sequences.txt   4mla.pdb。 利用黄老师讲的方法,从PDB数据库中下载经过PSI-BLAST比对获得的模板的PDB格式文件,在swiss-model中,使用自己模板的方法进行三维结构预测,结果在上传文件的时候遇到以上的问题,请问怎么解决。 ...

文章 用R做蛋白互作分析

...析 cat("Total deg genes:", dim(degs)[1]) # 将基因的ID map 到string 数据库中, 不一定每个基因都能map上 deg_mapped <- string_db$map( degs, "gene", removeUnmappedRows = TRUE ) # 查看有多少ID map 上了 cat("Total String id mapped :", dim(deg_mapped)[1]) # 设置绘图...

文章 seqkit序列处理神器的常用命令

seqkit是一个序列处理神器,有统计、格式转换、长度筛选、质量值转换、翻译、反向互补、抽样、去重、滑窗、拆分等功能。 seqkit 一共有37个可用的命令,详细内容如下: amplicon        通过引物检索扩增子(或其周围的特定...

问题 视频课程已经学完,有一个问题,视频中演示的搜索拟南芥的NB-ARC基因家族,这里的拟南芥指的是拟南芥属吗,是有很多不同种的拟南芥组成的吗?

...不同的种的蛋白质序列下载下来搜索呢?  因为我ensembl数据库下载了一个细菌的基因组,hmmsearch搜索保守蛋白质结构域,只出现了一列蛋白保守结构域对应的id及后面的信息 那我要研究该基因家族的话,是不是要把这个细菌的...

文章 feature 重要性排序棒棒糖图

...ary(data.table)  # 使用 fread 读取表格# ================== 3. 创建数据 ==================df <- data.table::fread("Feature        Gain        Cover    FrequencyUQCRC2 0.0688893642 0.0649316036 0.0415455633MTCH2 0.0324376628 0.0273261500 0.0213711746TBK1 0.0279487991 0.03397155...

文章 RagTag:同源锚定延伸

...  4. merge 在scaffolding过程中,可能会根据不同参数或图谱数据产生多个版本的基因组组装结果,该步骤可以将多个结果根据权重进行最终组装结果的生成。 ragtag.py merge <asm.fa> <scf1.agp> <scf2.agp> [...]  <asm.fasta>  ...

文章 ELISA实验做不好怎么办?QuicKey ELISA试剂盒来帮你!

...量OD值,计算结果。 传统ELISA和QuicKey ELISA对比: 典型数据: QuicKey Human MAU(Microalbuminuria) ELISA Kit 中文名:QuicKey-人尿微量白蛋白(MAU)酶联免疫吸附测定试剂盒 产品货号:E-TSEL-H0005 价格更优惠!常规ELISA试剂盒的经济替代...

问题 KNN补值函数knnImputation函数的距离计算问题

...按照行而非列进行的缺失值填补,但是蛋白组或者基因组数据一般都是列是样本行是蛋白/基因特征名称。是按照行(特征)进行近邻k个参考的距离计算并进行缺失值填补,而非按照列(样本)进行距离计算的,我想问下您,KNN...

问题 vcftools过滤除了等位基因选项外,其他参数通通没用

老师您好,我按照重测序课程的流程一步步处理数据,到最后一步vcftools过滤时出现了问题,起初按照该参数过滤: vcftools --gzvcf all.varFilter.vcf.gz --recode --recode-INFO-all --stdout \     --maf 0.05  --max-missing 0.4  --minDP 4  --maxDP 1000  \ ...

文章 R语言文件目录操作

在批量处理数据时,通常需要对文件或文件夹进行操作,下面将R语言中处理文件和文件夹的常用函数整理一下。 1、工作路径 getwd()        列出当前工作路径; setwd(dir)    设置工作路径,参数dir是要设置的路径。 2...

文章 GWAS模型介绍

...e: 残差 GWAS分析一直需要解决两个问题,一个是随着测序数据量的不断增加,计算速度已经是影响GWAS分析的一个重要问题。二是统计的准确率能不能再增加一些。因此发展出了很多其他的模型,请看下面的图形,图中的河流代...

问题 gset = getGEO(GEO='GSE12417', destdir=".",getGPL = F) 下载不了这个GEO文件,应该如何处理?

..._sx/exercise")#设置路径 ###获取表达矩阵### ?getGEO #下载数据#getGPL = F表示不下载注释文件。可能网络不太好,自己去平台下载。(这一串代码的run之后,文件下载失败了。) gset = getGEO(GEO='GSE12417', destdir=".",getGPL = F) #直接下载...

文章 Bio-Linux中的生物信息学软件

...便地访问到其生物分析文档系统及对测试程序有用的样本数据。用于处理新型序列数据类型的Bio-Linux软件包可额外安装。 下面是我们我们打包好的bolinux的ova包,在根目录下的biosoft文件夹下有增加的软件。 链接:https://pan.baid...

文章 IBD分析

...先时间 检测群体结构或隔离 二、分析流程 1. 基因型数据的过滤 1.1 缺失率过滤,最高能接受20%的缺失 vcftools --vcf .vcf --max-missing 0.95 --maf 0.01 --recode  --stdout    1.2 LD过滤 plink --vcf clean.vcf --indep-pairwise 50 10 0.2 --out tmp.ld   ...