sklearn中使用pipeline重复处理测试集

pipeline 实现了对全部步骤的流式化封装和管理,可以很方便地使参数集在新数据集上被重复使用。 可以用于下面几处: 模块化 Feature Transform 自动化 Grid Search 自动化 Ensemble Generat...

  • 0
  • 0
  • xun
  • 发布于 2022-11-07 15:06
  • 阅读 ( 1992 )

singularity 利用docker 镜像压缩包构建 sif文件

singularity 利用docker 镜像压缩包构建 sif文件

  • 1
  • 0
  • omicsgene
  • 发布于 2022-11-05 20:22
  • 阅读 ( 4256 )

runc 与 containerd.io 冲突安装不上runc

/etc/yum.repos.d/docker-ce.repo

  • 0
  • 0
  • omicsgene
  • 发布于 2022-11-05 20:14
  • 阅读 ( 4611 )

Perl——正则表达式之贪婪模式和非贪婪模式

Perl——正则表达式之贪婪模式和非贪婪模式

  • 0
  • 0
  • 安生水
  • 发布于 2022-11-04 15:59
  • 阅读 ( 2769 )

跟着文献学做图 | 用蛋白质序列做主成分分析(PCA)

提到主成分分析,一般我们都是使用Plink,GCTA等软件基于SNP数据来操作,那么如果我们用蛋白质序列,能不能做主成分分析,如何做呢? 答案是可以做,让我们一起来学习怎样做出与文献一样的图吧~

  • 0
  • 0
  • 星莓
  • 发布于 2022-11-03 16:49
  • 阅读 ( 5725 )

DELL R430服务器用U盘安装Linux步骤

DELL R430服务器用U盘安装Linux步骤

  • 0
  • 0
  • omicsgene
  • 发布于 2022-11-03 16:25
  • 阅读 ( 1840 )

Braker 有转录组数据预测基因 多样本转录组

多样本转录组

  • 0
  • 0
  • omicsgene
  • 发布于 2022-11-02 17:31
  • 阅读 ( 2646 )

基因组注释分析方法

基因组注释分析方法

  • 1
  • 0
  • omicsgene
  • 发布于 2022-11-02 10:42
  • 阅读 ( 2257 )

GATK4对于大量样品的项目进行变异检测

GATK4

  • 0
  • 0
  • 安生水
  • 发布于 2022-10-31 12:49
  • 阅读 ( 2746 )

使用DNA序列做主成分分析(PCA)——R语言adegenet包

提到主成分分析,一般我们都是使用Plink,GCTA等软件基于SNP数据来操作,那么如何用DNA序列做主成分分析呢? 思路是先比对,之后使用R语言的adegenet包把比对的数据转换成snp数据,用到的函数是fasta2genlight(),再进行PCA分析及绘图。

  • 0
  • 0
  • 星莓
  • 发布于 2022-10-31 11:33
  • 阅读 ( 6841 )

qiime2 安装-使用国内镜像避免网络原因报错:

qiime2 安装-使用国内镜像避免网络原因报错:

  • 0
  • 0
  • omicsgene
  • 发布于 2022-10-29 10:07
  • 阅读 ( 3936 )

Biopython之序列输入

Biopython

  • 0
  • 0
  • 安生水
  • 发布于 2022-10-25 10:19
  • 阅读 ( 1936 )

GATK4进行变异检测是否可以多线程

GATK4

  • 0
  • 0
  • 安生水
  • 发布于 2022-10-25 09:50
  • 阅读 ( 2867 )

python操作大文件删除某行

删掉文件其中一行,非常简单,不过如果一个文件很大以至于无法读到内存里,又该怎么操作呢 其实我们可以使用 open() 方法把需要修改的文件打开为两个文件,然后逐行读入内存,找到需要删除的行...

  • 0
  • 0
  • xun
  • 发布于 2022-10-24 16:10
  • 阅读 ( 2258 )

Perl方法对文档全文进行字符串对应替换

举个例子:从数据库中下载基因组数据,基因组.gff文件中染色体ID较为复杂(第一列) 从全基因组序列.genome.fa文件中找到染色体ID对应简写 想将gff文档中染色体ID全部替换成第二列LC*命名...

  • 0
  • 0
  • rzx
  • 发布于 2022-10-24 14:38
  • 阅读 ( 1979 )

sort 按照染色体排序后按位置坐标排序

经常会遇到对bed文件或其他相关数据的排序,记录一下如何先按照染色体号排序,然后按照坐标位置排序。 sort -k1,1 -k2n file1 > file2 排序完成后如下:

  • 0
  • 0
  • 星莓
  • 发布于 2022-10-24 09:55
  • 阅读 ( 2829 )

pfam 隐马尔可夫模型序列最新下载方法

HMMER 隐马尔可夫模型序列最新下载方法

GeMoMa-1.9.jar 报错mbol: g_settings_backend_get_type

mbol: g_settings_backend_get_type

  • 0
  • 0
  • omicsgene
  • 发布于 2022-10-19 15:19
  • 阅读 ( 1748 )

用R语言快速合并大量表格文件

合并文件

  • 0
  • 0
  • omicsgene
  • 发布于 2022-10-14 10:33
  • 阅读 ( 2983 )

linux删除某用户下所有的进程命令

1. ps列出用户的pid,然后依次kill掉,比较繁琐 kill -9 `ps -uf username |awk '{ print $2 }'|grep -v PID` 或 ps -ef | grep username | awk '{ print $2 }' | xargs kill -9 2. pkill方...

  • 0
  • 0
  • 星莓
  • 发布于 2022-10-14 10:21
  • 阅读 ( 1944 )