boxplot绘图中的离群值Outliers 如何去除

箱形图(Box-plot)又称为盒须图、盒式图或箱线图,是一种用作显示一组数据分散情况资料的统计图。因形状如箱子而得名。在各种领域也经常被使用,常见于品质管理。它主要用于反映原始数据分布...


箱形图(Box-plot)又称为盒须图、盒式图或箱线图,是一种用作显示一组数据分散情况资料的统计图。因形状如箱子而得名。在各种领域也经常被使用,常见于品质管理。它主要用于反映原始数据分布的特征,还可以进行多组数据分布特征的比 较。箱线图的绘制方法是:先找出一组数据的最大值、最小值、中位数和两个四分位数;然后, 连接两个四分位数画出箱子;再将最大值和最小值与箱子相连接,中位数在箱子中间。



attachments-2019-05-u8ukgnSC5cd26e7d05b64.jpg
有时候我们需要对boxplot中的异常值进行去除,这个时候我们可以利用R语言的boxplot完成:


得到离群值的索引:

OutVals = boxplot(x)$out
which(x %in% OutVals)

如果想删除离群值:

x[! x %in% OutVals]


不想绘图,只想得到结果可以这样:

OutVals = boxplot(x, plot=FALSE)$out



生物信息入门到精通必修基础课:linux系统使用biolinux搭建生物信息分析环境linux命令处理生物大数据perl入门到精通perl语言高级R语言画图R语言快速入门与提高




  • 发表于 2019-05-08 13:59
  • 阅读 ( 2668 )
  • 分类:R

0 条评论

请先 登录 后评论
omicsgene
omicsgene

生物信息

306 篇文章

作家榜 »

  1. omicsgene 306 文章
  2. 安生水 215 文章
  3. Daitoue 168 文章
  4. 生物女学霸 120 文章
  5. CORNERSTONE 42 文章
  6. 红橙子 39 文章
  7. 生信老顽童 37 文章
  8. landy 37 文章