今天的推文介绍一下下图的实现方法
image.png
用到的数据集是小麦种子的数据集,实验室测量了3个品种的小麦种子7个指标,探究是否可以根据这些指标来区分小麦种子的品种,这7个指标分别是
image.png
最后一个变量target是小麦所属种类,分别是0,1,2
数据集下载自kaggle网站,数据集大家可以自行下载,也可以在文末留言
实现文章开头提到的图用到的是
GGally
包中的ggpairs()
函数,对应的帮助文档是 https://ggobi.github.io/ggally/reference/ggpairs.html
seed <- read.csv("kaggle/Seed_Data.csv",header=T)
names(seed) <- c("Area", "Perimeter", "Compactness", "Length", "Width", "Asymetry.coef", "Grove.length", "Type")
head(seed)
seed$Type <- as.factor(seed$Type)
tibble::glimpse(seed)
image.png
library(GGally)
ggpairs(seed[,1:7])
image.png
因为是ggplot2的扩展包,ggplot2的主题设置都可以往上叠加
library(GGally)
library(ggplot2)
ggpairs(seed[,1:7])
ggpairs(seed, showStrips = T,ggplot2::aes(color=Type)) +
theme(axis.text = element_text(colour = "black", size = 11),
strip.background = element_rect(fill = "#d63d2d"),
strip.text = element_text(colour = "white", size = 12,
face = "bold"))
image.png
欢迎大家关注我的公众号
小明的数据分析笔记本
https://rpubs.com/nabiilahardini/wheatseed
扫码关注腾讯云开发者
领取腾讯云代金券
Copyright © 2013 - 2025 Tencent Cloud. All Rights Reserved. 腾讯云 版权所有
深圳市腾讯计算机系统有限公司 ICP备案/许可证号:粤B2-20090059 深公网安备号 44030502008569
腾讯云计算(北京)有限责任公司 京ICP证150476号 | 京ICP备11018762号 | 京公网安备号11010802020287
Copyright © 2013 - 2025 Tencent Cloud.
All Rights Reserved. 腾讯云 版权所有