我正在寻找一种从数据表中选择行的有效方法,以便为特定列中的每个唯一值有一个有代表性的行。
让我举一个简单的例子:
require(data.table)
y = c('a','b','c','d','e','f','g','h')
x = sample(2:10,8,replace = TRUE)
z = rep(y,x)
dt = as.data.table( z )
我的目标是通过对z列中的每一个字母a-h取样一行来子集数据表dt。
我正在使用data.table软件包。我有一个数据表,代表用户在网站上的行动。假设每个用户都可以访问一个网站,并在其上执行多个操作。我的原始数据表是操作(每行都是一个操作),我希望将这些信息聚合到一个新的数据表中,按用户访问分组(每次访问都有一个唯一的ID)。有一些字段是由同一次访问的操作共享的,例如用户名、用户状态、访问号等。每次访问的至少一个操作包含此信息(不一定是所有的操作)。对于每次访问(=具有相同访问ID的操作组),我希望检索该字段的值,并在“访问新数据表”中将其设置为“访问”。例如,如果我有以下原始数据表:
VisitID ActionNum UserName U
给定具有下列行的数据表。
POLICY START_DT END_DT AMOUNT TYPE
1000 08/01/2017 09/01/2017 -10.00 A
1000 08/01/2017 09/01/2017 30.00 C
预期结果:
POLICY START_DT END_DT AMOUNT TYPE
1000 08/01/2017 09/01/2017 20.00 A
我希望始终接受第一个类型值,并将其应用于分组行。
到目前为止我所拥有的是:
var results = f
我需要得到最后一行结果集的所有列值之和。这是我的SQL查询。
SELECT CS_YEAR AS YEAR,
CS_MNTH AS MONTH,
CS_WK AS WEEK_NO,
'Total' AS COST_CARRIER,
'Total' AS COST_CARRIER_CD,
SUM(CS_WG_CST) AS WAGE_COST,
SUM(CS_PART_CST) AS MATERIAL_COST,
SUM(CS_DH_CST) AS D
我有一个包含3列的数据表: ID、Type和Count。对于每个ID,我希望得到这个ID中顶部2计数的Type,并将结果扁平化为一行。例如,如果数据表如下所示:
ID Type Count
A 1 8
B 1 3
A 2 5
A 3 2
B 2 1
B 3 4
然后,我希望输出为两行,如下所示:
ID Top1Type Top1TypeCount Top2Type Top2TypeCount
A 1 8 2 5
我正在连接两个关于复合键的数据表,即帐号。和数量,但根据我附加的图片,我在加入后只得到了一行,但我应该得到2行。
var query = from dataRows1 in clearingDTAlias.AsEnumerable()
join dataRows2 in excelDT.AsEnumerable()
on new
{
Account_No = dataRows1.Field<string>("Account_No"),
我有一个数据表,其中包含"field“和"conc”列(这是集中度的缩写)。我正在尝试输出每种类型的字段(类别是cosmos,egs等)以及每种字段类型的conc统计量的中位数。 这是我尝试过的: SELECT field,percentile_cont(0.5)::numeric FROM galaxies GROUP BY conc LIMIT 5; 错误:函数percentile_cont(数字)不存在 第1行:选择字段,percentile_cont(0.5)::numeric FROM galaxies GR... 但是,我遇到了此错误,并且不确定如何提取每个字段类