01
select()变形函数
dplyr包的安装就不展示了,dplyr包是内含多函数且功能强大的数据处理包。
#导入表格数据给data
data<-read_excel("~/Desktop/Excel学习/表姐牌口罩销售数据.xlsx")
data
select(data, "销售城市", "产品类别", "销售员", "金额")
02
filter( )
filter( ) 函数 筛选数据框内容,选择产品类型是纯棉口罩的数据。
多条件筛选,只要在filter中多增加筛选条件即可
03
mutate( )
mutate( )函数用来创建新的数据框,创建新的1列为销售额。
04
arrange( )
arrange( ) 函数可用于创建一个新的数据框,这个数据框可以按照1个或多个变量进行排序。
desc( ) 函数表示降序排列。让上述表格按照金额和单价进行降序排列。
05
group_by( )+summarize()
group_by( ) 这个函数是用来创建分组的。summarize()用来汇总数据,汇总产品类别和销售城市,同时增加平均数量和均价。
06
%>%管道操作符
%>%管道操作符,这个是我在dplyr包中最喜欢的一个操作符了,它运用起来特别方便,能够连接前后两个步骤,实现嵌套使用简化代码的同时还能避免存储多余的中间值而节省内存空间。它的作用是把符号左侧返回的结果,作为符号右侧调用函数的第1个参数。实际上,x %>% f(...)相当于于f(x, ...)。