在R中,有几个变量的频率表:
freq()
:计算指定变量的频率,可以指定计算某个区间内的频率,例如:freq(x, from = 0, to = 100)
。table()
:计算指定变量的频率,直接使用table()
函数,例如:table(x)
。prop.table()
:计算指定变量的比例,可以指定计算某个区间内的比例,例如:prop.table(x, from = 0, to = 100)
。tabyl()
:综合了table()
和prop.table()
,可以同时显示频率和比例,例如:tabyl(x, prop = TRUE, summary = TRUE)
。dplyr::count()
:计算指定变量在各分组中的数量,例如:group_by(x) %>% count()
。dplyr::n()
:计算指定变量的总数量,例如:n(x)
。dplyr::sum()
:计算指定变量的总和,例如:group_by(x) %>% summarize(total = sum(y))
。dplyr::mean()
:计算指定变量的平均值,例如:group_by(x) %>% summarize(mean = mean(y))
。dplyr::median()
:计算指定变量的中位数,例如:group_by(x) %>% summarize(median = median(y))
。dplyr::quantile()
:计算指定变量的分位数,例如:group_by(x) %>% summarize(quantile = quantile(y, 0:100))
。dplyr::slice()
:从数据框中提取指定位置的元素,例如:slice(data, 1:3)
。dplyr::select()
:从数据框中提取指定列或表达式,例如:select(data, x, y, z)
。dplyr::rename()
:修改数据框中列的名称,例如:rename(data, x = Name, y = Age)
。dplyr::group_by()
:将数据框按照指定变量分组,例如:group_by(data, Category)
。dplyr::summarize()
:对分组后的数据进行汇总,例如:group_by(data, Category) %>% summarize(total = sum(Sales))
。dplyr::mutate()
:在分组后的数据中添加新变量,例如:group_by(data, Category) %>% mutate(Sales = Sales * 2)
。dplyr::filter()
:从数据中筛选出满足条件的数据,例如:filter(data, x > 10)
。dplyr::distinct()
:去除重复的数据,例如:distinct(data, Name)
。dplyr::select()
:从数据中提取指定列或表达式,例如:select(data, x, y, z)
。dplyr::rename()
:修改数据中列的名称,例如:rename(data, Name = Username, Age = Userage)
。dplyr::group_by()
:将数据按照指定变量分组,例如:group_by(data, Category)
。dplyr::summarize()
:对分组后的数据进行汇总,例如:group_by(data, Category) %>% summarize(total = sum(Sales))
。dplyr::mutate()
:在分组后的数据中添加新变量,例如:group_by(data, Category) %>% mutate(Sales = Sales * 2)
。dplyr::filter()
:从数据中筛选出满足条件的数据,例如:filter(data, x > 10)
。dplyr::distinct()
:去除重复的数据,例如:distinct(data, Name)
。dplyr::select()
:从数据中提取指定列或表达式,例如:select(data, x, y, z)
。dplyr::rename()
:修改数据中列的名称,例如:rename(data, Name = Username, Age = Userage)
。dplyr::group_by()
:将数据按照指定变量分组,例如:`group_领取专属 10元无门槛券
手把手带您无忧上云