DPLYR中的over(partition by )by函数

如何编写按函数执行分区的R代码例如，假设一个客户一天要做很多事务，而我必须使用dplyr逐个函数地查找客户在特定一天完成的第二高事务。

浏览 10提问于2019-09-20得票数 0

1回答

在R中创建累积和列with_order

、、、、

我正在使用查询解析器和tidyquery在R中与SQL教程一起工作，这一直进展顺利，直到有人要求我这样做：Tidyquery报告说它不支持OVER函数，所以我尝试用dplyr复制OVER (PARTITION BY...)函数。(PARTITION

浏览 9提问于2021-11-10得票数 1

回答已采纳

1回答

如何使用闪烁的窗口操作的星火-sql“范围之间”子句。

、、

上下文:我有一个有登录时间的大表。我希望在指定的时间内(例如，3600秒)内计算登录的滚动计数。在SQL/HQL中，我将将其指定为： PARTITION BY id ORDER BY logon_time PARTITION BY id ORD

浏览 6提问于2017-09-19得票数 0

2回答

在使用sparklyr调用collect_list时根据另一个变量保留顺序

、

这个问题本质上是对的重复，除了我在R中工作之外，这个问题的解决方案看起来很可靠，但我还没有找到如何在窗口函数上以同样的方式在sparklyr中应用collect_list。对5000名用户的测试中，3%的人没有按正确的顺序排列“城市”栏。 dplyr::group_by(userid) %>% dp

浏览 2提问于2019-05-10得票数 0

回答已采纳

1回答

在dplyr窗口函数中使用多列？

、、

从SQL开始，我希望我能够在dplyr中做类似以下的事情，这是可能的吗？# RSELECT Name, Email, DENSE_RANK() OVER (ORDERBY Name, Email) AS n FROM tbl 还有PARTITION BY的等价物吗？

浏览 4提问于2018-01-19得票数 4

回答已采纳

1回答

SparkR和dplyr:使用gapply的窗口函数计数()

、、

library(SparkR)df <- createDataFrame(iris)display(SparkR::sql("SELECT *, COUNT(*) OVER(PARTITION BY Species) AS RowCount FROM iris"))display由: EOFException: org.apache.spark.SparkExcep

浏览 10提问于2022-06-21得票数 0

2回答

用火花计算累积和

、、、、

我如何计算累积和的火花？dplyr：cumsum不是一个包含在火花中的函数，我怎样才能在火花中再现它呢我认为星星之火SQL应该是以下几点： *,FROMUPDATE:

浏览 6提问于2020-10-08得票数 0

回答已采纳

1回答

R的group_by是如何与其他dplyr动词交互的？

我来自SQL，正在努力理解R的group_by是如何工作的。阅读文档，它只是简单地“改变它与其他dplyr动词的行为方式”，并没有解释任何事情。在下面的代码片段中，我特别困惑于它与聚合函数max的交互方式： tbl("data_table") %>% # getend_date, na.rm=T)) %>% rename(field_

浏览 2提问于2021-02-17得票数 0

1回答

dplyr数据库后端的缓存结果

、、、

我在其他地方采取的一种方法就是 df %>% group_by(person_id) %>%FROM (SELECT

浏览 1提问于2017-03-02得票数 1

2回答

我可以为多个窗口函数调用使用一个分区定义吗？

、、、、

这是我的问题。对于14个结果列，我使用相同的窗口函数sum()，具有相同的分区定义： sum(totalsteps) OVER (PARTITION BY id, weekly) OVER (PARTITION BY id, weekly) as total_veryactive, sum(fairlyactiveminutes) OVER (PARTITION BY,

浏览 24提问于2022-02-17得票数 1

回答已采纳

1回答

关于"over* partition by“的麻烦*

、

我必须对预先存在的代码(java)进行更改，该代码使用以下类型的查询与DB进行交互： select distinct u.usestate,from services u 由于我不被允许进行单独的查询并通过java端工作关联结果或推翻查询(否则我将切换到亲爱的旧，但问题是，通过这种方式，当相同的"id_a

浏览 37提问于2019-04-11得票数 0

1回答

R中的SQL类型窗口函数(最好是dplyr)

、

我正在尝试寻找相当于SQL Server的窗口函数的return，它允许程序根据某些分组来查找COUNT、SUM、MIN、MAX，但不会减少返回的行数。在SQL Server中，它们的编写方式如下例所示： Account, Views, SUM( Views )

浏览 0提问于2018-03-18得票数 1

3回答

在窗口函数中使用Case ( OVER* (Partition))*

、、

我正在努力完成以下工作： *,FROM tbl a使用SQL Server中的窗口函数可以做到这一点吗？我可以在没有case语句的情况下完成以下工作： *, SUM(b.myField) OVER</e

浏览 1提问于2014-05-29得票数 5

5回答

、、

在Server中运行以下查询时，将收到一个错误： , payPercentage = SUM(GW) * 100.0 / SUM(SUM(GW)) OVER (partition bypw_partgroup by ID,CID,PPE,PTYPE,GW payPercentage=SUM(GW) * 100.0 / SUM(SUM(GW)) O

浏览 0提问于2021-05-14得票数 0

1回答

窗口函数的分组

我被困在这样的场景中:我有价格以及日期和产品id，并且在价格之上运行windows功能。当我做组的时候，它说我必须增加价格。 PARTITION by asin, date ) AS price,

浏览 5提问于2022-06-14得票数 0

点击加载更多

扫码

添加站长进交流群

领取专属 10元无门槛券

手把手带您无忧上云

在R中创建累积和列with_order

如何使用闪烁的窗口操作的星火-sql“范围之间”子句。

在使用sparklyr调用collect_list时根据另一个变量保留顺序

在dplyr窗口函数中使用多列？

SparkR和dplyr:使用gapply的窗口函数计数()

用火花计算累积和

R的group_by是如何与其他dplyr动词交互的？

dplyr数据库后端的缓存结果

我可以为多个窗口函数调用使用一个分区定义吗？

关于"over* partition by“的麻烦*

R中的SQL类型窗口函数(最好是dplyr)

在窗口函数中使用Case ( OVER* (Partition))*

SQL OVER()子句-什么时候以及为什么它是有用的？

条件加窗函数

不使用解析函数实现Rank

如何将SQL导入R的dplyr？

Oracle MIN作为分析函数-使用ORDER BY？

使用窗口函数和时所遇到的零误差除以

窗口函数的分组

扫码

相关资讯

热门标签

活动推荐

运营活动

社区

活动

资源

关于

腾讯云开发者

热门产品

热门推荐

更多推荐