本内容是基于R for Data Science的学习总结;
ggplot2的数据可视化
基本绘图
ggplot2画图基本模型如下:1
2ggplot(data = <DATA>) + #生成一个空的图
<GEOM_FUNCTION>(mapping = aes(<MAPPINGS>)) #增加一个图层,其中涉及参数仅用于这一图层
GEOM_FUNCTION可划分为展示单变量,两个变量和三变量,连续型或离散型变量;
在ggplot2 中每一个GEOM_FUNCTION函数都包含有一个mapping
参数对应于aes(x,y,size,shape,color,alpha)
,以上参数对应值均为DATA数据中的变量,若需要手动设置,将参数写于aes外,此时的参数对应值如下:
其中shape图形中的外边界由colour指定(0到18)。内部填充由fill指定。
ggplot()中设置的aes相当于全局参数,为简化代码可将共有变量在ggplot中设置。若某一图层指定参数与次全局指定冲突,则在该图层使用geom指定的参数。基于这样的处理过程可以在不同的图层中指定不同的数据。
1 | ggplot(data = mpg, mapping = aes(x = displ, y = hwy)) + |
stat (statistical transformation)
每一个geom都会默认指定一个stat来对数据进行统计转换,如geom_bar()默认stat是count,即geom_bar(..,stat=”count”)。