我刚刚开始使用data.table来分析一些高维数据,其中我有几个集群和几个标记。我希望能够使用' by‘函数,但能够访问组之外的数据,即通过= !group。我正在尝试比较组和非组的统计数据。我看了一下文档,.SD看起来很吸引人,但似乎不能完全回答我的问题,因为它只允许访问分组的data.table。我确信我可以使用循环或apply来实现这一点,但我认为这不会像使用data.table那样快。library(data.table)
da
GROUP BY根据您给出的参数聚合或分组结果集。如果在查询中使用此子句,则可以对结果集执行聚合函数,以查找结果集上的统计信息,如查找平均值、(AVG())或频率(COUNT())。我的问题是:在没有伴随的聚合函数的情况下,由语句组成的组是否有任何用处?
Update使用GROUP BY作为DISTINCT的同义词(可能)是个坏主意,因为我怀疑它要慢一些。