为什么做生物信息分析需要学会linux

Linux系统生物信息分析必备利器。

最近看到一篇文章:《完全用Linux工作》感触挺深;

原文地址:https://www.douban.com/group/topic/12121637/

attachments-2018-04-5Eml4NBS5adc2ffd03134.jpg



文章很长,为节约大家的时间,在此总结一下我觉得有意思的观点:


1.你想想如果你没有用过 windows,你肯定会很习惯 /etc, /usr, /usr/local ,... 而不是 C:, D:, E:, ... 是不是?如果你只用过Linux,你第一次用 windows 时恐怕也会问:"/bin 目录哪里去了啊?"  ,所以说习惯成自然,linux并没有那么高深。


2.学 linux 绝对不是浪费时间。用过linux分析数据之后,才发现在linux系统上分析数据的效率是windows没法比的。虽然前期学习linux会花上一部分的时间和精力,但是,一但你学会和习惯了linux的工作方式,你会发现在后续的工作中你会觉得前期花费的时间是值得的。举例来说,你在windows上整理统计一个表格可能会花费你一天的时间,数据一但调整,需要重新分析的时候,又要花费你一天的时间,是不是很痛苦?而在linux上你可能只需要几条命令或者一个简短的脚本分分钟就能完成,即使数据有变动,只要稍稍改一改脚本或者命令,瞬间就能完成工作,是不是很牛。最重要的,这些分析步骤都可以记录,可溯源,不会像windows分析完了,过几天想检查一下,确总是不能重现原来的结果,科学无法严谨,发表论文大忌。所以,牛不是吹的,用过的人都知道;


3.Linux 的系统操作方法几十年都没有很大变化,这非但不是顽固,不进步的象征,反而是Linux的远见卓识的体现!而windows系统一直在不断的升级,每一次升级你都要花时间去适应和学习,而linux你学习一次受用终身。windows上的软件也是一样,例如office从2003,2007,2010每一次升级我们都需要去适应和学习,有时候真的讨厌但又无可奈何。相反,在linux系统就不是这样了,例如,vi 作为linux的一个文本编辑器, 伴随着 UNIX 的最初发行而诞生,直到今天还是世界上头两号编辑器之一,我认识的一位60多岁的老师,用vi都几十年了,没有变化一直在用,是不是很神奇!


attachments-2018-04-VWTjsyG15adc300c1549c.jpg


    然而在生物领域,大多数人都是用windows工作的,小编也是学生物出身,起初对linux系统也是一窍不通,甚至也持有那样的观点:linux是学计算机的人用的,我们不学计算机,不需要用linux;但是,随着对linux深入了解和日常使用体会,渐渐的发现linux在生物数据分析中具有巨大的优势:


因此在这里,我来总结一下在linux上做生物信息分析的好处:


1.可以实现自动化,相同,相近的工作可以编写代码或者脚本完成,遇到类似分析只要换换文件,改变一下参数,就能自动完成,这就是我们编写的pipline,分析流程。


2.几乎所有的生物信息分析软件最开始都是基于linux系统开发的,在windows上根本就没法用,在二代测序领域的分析软件尤为如此,像bwa,tophat等比对软件,组装软件等等在windows上就不能用;再有就是由于生物数据量越来越大,随便测个转录组都是上G数据,所以几十G甚至上T的数据都是家常便饭,对处理性能要求远远大于UI操作需求,那么windows就没有了用武之地,只能linux上场了。


3.发表论文中很多精美的图片,尤其是高水平的文章,很多都是用绘图语言完成的,而不是excel的图表功能就能完成的。

attachments-2018-04-VAxQWYyY5adc3020ee7eb.jpg



Linux 这么好用,我也想用,该如何入手呢? 别急,我们下期将会教大家如何搭建linux生物信息分析环境,简单易学,敬请期待。


更多生物信息课程:

1. 文章越来越难发?是你没发现新思路,基因家族分析发2-4分文章简单快速,学习链接:基因家族分析实操课程基因家族文献思路解读

2. 转录组数据理解不深入?图表看不懂?点击链接学习深入解读数据结果文件,学习链接:转录组(有参)结果解读转录组(无参)结果解读

3. 转录组数据深入挖掘技能-WGCNA,提升你的文章档次,学习链接:WGCNA-加权基因共表达网络分析

4. 转录组数据怎么挖掘?学习链接:转录组标准分析后的数据挖掘转录组文献解读

5. 微生物16S/ITS/18S分析原理及结果解读OTU网络图绘制cytoscape与网络图绘制课程

6. 生物信息入门到精通必修基础课:linux系统使用biolinux搭建生物信息分析环境linux命令处理生物大数据perl入门到精通perl语言高级R语言画图R语言快速入门与提高

7. 医学相关数据挖掘课程,不用做实验也能发文章:TCGA-差异基因分析GEO芯片数据挖掘 GEO芯片数据不同平台标准化 、GSEA富集分析课程TCGA临床数据生存分析TCGA-转录因子分析TCGA-ceRNA调控网络分析

8.其他,二代测序转录组数据自主分析NCBI数据上传二代fastq测序数据解读

9.全部课程可点击:组学大讲堂视频课程

  • 发表于 2018-04-22 14:48
  • 阅读 ( 9186 )
  • 分类:linux

2 条评论

请先 登录 后评论
omicsgene
omicsgene

生物信息

654 篇文章

作家榜 »

  1. omicsgene 654 文章
  2. 安生水 325 文章
  3. Daitoue 167 文章
  4. 生物女学霸 120 文章
  5. 红橙子 78 文章
  6. CORNERSTONE 72 文章
  7. rzx 67 文章
  8. xun 66 文章