R语⾔作图——histogram(直⽅图)
原创:黄⼩仙高中读书笔记
最近⼩仙同学很是烦恼,本以为⾃⼰已经掌握了ggplot2作图的语法,⽤read.csv(), ggplot()+geom_point()/boxplot()/violinplot()…就可以画遍天下图表,结果却发现到真正画图的时候,还是会出现不少的⼩问题。
⽐如⼩仙最近要画⼀个直⽅图,最开始⽤hist()函数试了⼀下,看了下形状, 好像因为数据取值范围跨度太⼤(最⼤值104,724,最⼩值30),这个图画出来有点丑,于是决定⽤ggplot美化⼀下。
中秋佳节短信
调整之后好看是好看了,但是⼤家有没有看出什么不对的地⽅,明明bins=10但是只画出8个格⼦,之后调整bins的值,每次都会⽐我指定的值少2个格⼦。⽽且,图中第⼀个格⼦(取值范围0-1250)应该有700多个数据,但是图上显⽰只有不到300个,问题出在哪⾥呢?⼩仙同学百思不得其解。在geom_histogram()函数中,bins就是⽤来指定分组数⽬(格⼦),为什么总是会少两个?
数字四字成语
⼩仙同学考虑到⾃⼰能⼒有限,决定量⼒⽽⾏,另辟蹊径。
于是设置另外⼀个参数breaks,终于找回了丢失的格⼦
木瓜银耳羹
亚麻籽油怎么吃
经过此事,⼩仙同学深刻认识到了⾃⼰的有限⽔平,哈哈。不过还是分享⼀下,希望能帮助到⼤家。实际的数据可真是⽐书上的例⼦难处理呢。
离别按照惯例写⼀下整个作图的过程。
Step1. 绘图数据的准备
⾸先要把你想要绘图的数据调整成R语⾔可以识别的格式,建议⼤家在excel中保存成csv格式。
Step2. 绘图数据的读取
data<-read.csv(“your file path”, header = T)
#注释:header=T表⽰数据中的第⼀⾏是列名,如果没有列名就⽤header=F
Step3.绘图所需package的安装、调⽤贵州美食图片
library(ggplot2)我想学跳舞
#注释:package使⽤之前需要调⽤
Step4.绘图
p<-ggplot(data, aes(x=data$销量)) +
geom_histogram(breaks=q(0,10000,1000))+ xlim(0,10000) p
(公众号:⽣信了)