一、Introduction加载准备
nycflights13数据框
dplyr语法基础
(1) filter():依据观察值筛选行变量(2) arrange():排序(3) select():依据列名提取相应的列(4) mutate():依据已存在变量创建新的变量(5) summarize():统计(6) group_by():分组
二、Filter Rows with filter()
逻辑比较
, >=,
缺失值处理
三、Arrange Rows with arrange()
四、Select Columns with Select()
提取列时,字段匹配问题:
(1)start_with("abc"):匹配列名以"abc"起始的列
(2)end_with("xyz"):匹配列名以"xyz"结尾的列
(3)contains("ijk"):匹配列名包含"ijk"的列
(4)matches("(.)\1"):正则表达式
(5)num_range("x",1:3):匹配列名为x1,x2,x3的列
五、Add New Variable with mutate()
常用函数
六、Grouoed Summaries with summarize()
缺失值处理
计数
使用统计函数
领取专属 10元无门槛券
私享最新 技术干货