腾讯云
开发者社区
文档
建议反馈
控制台
登录/注册
首页
学习
活动
专区
工具
TVP
最新优惠活动
文章/答案/技术大牛
搜索
搜索
关闭
发布
精选内容/技术社群/优惠产品,
尽在小程序
立即前往
文章
问答
(9999+)
视频
沙龙
3
回答
Groupby
和
join
值
,
但
保留
所有
列
、
、
、
我有这个Dataframe,我想在ID上分组并连接这些
值
。-----------002;005 | A_002 | I_002 df.to_csv('D:\joined.csv
浏览 5
提问于2019-09-03
得票数 1
回答已采纳
3
回答
python,pandas:如何指定多
列
并仅合并重复行的特定
列
、
、
可以通过执行以下操作连接多
列
重复行中的特定
列
值
,
但
groupby
中指定的
列
以外的
所有
列
都将消失。
列
title, thumbnail, name, created_at存在。检索具有重复title
和
thumbnail的行,如下所示,并连接重复行的name
列
的
值
,同时
保留
第一行。我想为它创建一个新的专栏。 但是,如前所述,
groupby
中指定的<e
浏览 201
提问于2021-11-22
得票数 2
回答已采纳
1
回答
(Pandas)按一
列
分组,并仅
保留
另一
列
为最大
值
的行
、
、
、
、
我有一个有6
列
的熊猫数据框,其中两
列
是“日期”
和
“时间”。对于每个日期,我只想
保留
具有最大时间
值
的行。例如,下面的日期在左边,时间在右边。我只想
保留
时间为1925的
所有
行。192520200109 183020200109 1830我尝试过很多排序
和
使用
groupby
的解决方案,比如dataframe.
gro
浏览 45
提问于2020-02-28
得票数 2
4
回答
GroupBy
列
和
筛选具有最大
值
的行
、
、
、
我几乎可以肯定之前有人问过这个问题,
但
a search through stackoverflow没有回答我的问题。不是[2]的副本,因为我想要最大
值
,而不是最频繁的项目。我是个新手,正在尝试做一些非常简单的事情:我想要
groupBy
"A“
列
,然后只
保留
列
"B”中具有最大
值
的每一组的行。如下所示: df_cleaned = df.
groupBy
("A").agg(F.max("B")) 不幸
浏览 106
提问于2018-02-16
得票数 44
回答已采纳
1
回答
在python中合并行
、
我有一个很大的.csv文件,需要根据订购数量对具有相同名称的产品进行分组,这是我通过
groupby
()完成的。但是,我需要使用文件中的
所有
7
列
,但是在连接这些行之后,只剩下qty_ordered
和
name_hash,其余的
列
都消失了。有没有办法在连接基于name_hash
和
qty_ordered的行的同时,将我的
所有
7
列
都
保留
在我的数据帧中?这是我的代码: data = pd.rea
浏览 15
提问于2021-06-09
得票数 0
2
回答
熊猫-合并多
列
和和
、
&B是相同的名称,但是主df包含许多次要df2不包含的
列
。我想对常见的
列
进行汇总,并
保留
其他
列
的原样。输出:5 5 7 87 15 4 4曾尝试过df.
join
、pd.merge
和
groupby
的变体,
但
目前没有运气。最后一次尝试: df.
groupby
('index').su
浏览 0
提问于2018-07-03
得票数 1
回答已采纳
3
回答
防止在大型DataFrame、Pandas中使用group()
和
agg()语句的前导
和
尾随逗号
、
、
我有一个很大的DataFrame,我需要根据其中一个ID
列
进行
groupby
(),并将其他
所有
内容放在一个csv列表中。我有一种方法可以很好地利用agg()方法。但是,我注意到,在单元格中有一个空(null)
值
的情况下,这种方法将
保留
带有前导或尾随逗号的空(null)。我需要防止这种情况发生。由于DataFrame的性质,用.lstrip(',')或.rstrip(',')一次替换每一
列
可能是不可能的。我还需要在源数据中
保留
空(n
浏览 18
提问于2021-05-21
得票数 0
回答已采纳
2
回答
基于
列
的聚合Python DF
、
、
我有一个大的dataframe (大约35
列
),其中1
列
- concat_strs是数据have中8
列
的连接。这是用来检测重复的。我想要做的是对
列
concat_strs具有相同
值
的行进行聚合(使用sum)。agg_attributes = {'val': 'sum', 'abs_val': 'sum', 'price': 'sum', 'abs_price':
浏览 5
提问于2020-01-13
得票数 0
回答已采纳
1
回答
spark structured将聚合数据帧连接到数据帧
、
、
.我执行了一个
groupBy
,agg collect_list来清理东西。"fruits")) as "fruitsA")val joinedDF = farmDF.
join
(myFarmDF, &quo
浏览 20
提问于2018-05-29
得票数 3
回答已采纳
2
回答
PySpark -如何选择在
groupby
中使用的
所有
列
、
、
、
我试图把
join
和
groupby
连接在一起。我想做的输入
和
操作如下所示。我想
groupby
所有
的
列
,除了在agg中使用的
列
。有没有办法做到这一点,而不列出
所有
的列名,如
groupby
("colA","colB")?我试过
groupby
(df1.*),
但
那不起作用。在这种情况下,我知道我想按df1中的
所有
列
进
浏览 3
提问于2022-03-25
得票数 0
回答已采纳
1
回答
按两
列
(或更多
列
)对pandas数据帧进行分组?
、
、
["a1", "a2", "a3", "b1", "b2", "c1"], "val": [1,5,1,1,2,10]})mydf.
groupby
("class").val.sum() 这是正确的行为,但我希望在生成的df中
保留
cat<e
浏览 1
提问于2014-01-21
得票数 11
回答已采纳
2
回答
GroupBy
,
但
仍
保留
所有
行
、
、
A b3 2 A a5 2 A c 我希望
groupby
(id,Main)仍然
保留
所有
行 期望输出 id Main Sub_steps lst1 1 A]4 2 A b [a,b,c] 5 2 A
浏览 19
提问于2020-07-07
得票数 3
回答已采纳
1
回答
groupby
和
join
文本
列
、
、
我有一个带有这个头text|business_id的csv文件我用了review_data=review_data.
groupby
(['business_id'])['text'].apply("".
join
) text \ 0
浏览 0
提问于2016-03-30
得票数 0
回答已采纳
1
回答
如何在Pandas中按
groupby
和
join
但
保留
原始行
、
我想创建一个新的数据框架,在一行中同时包含金额
和
这些金额的总和。sales cost sum1 key2 500 250 750
浏览 14
提问于2019-07-24
得票数 0
1
回答
如何在包含现有行的字符串中的单词的pandas数据框中创建新行?
、
我在pandas中有一个DataFrame,它有一个名为df.strings的
列
,其中包含文本字符串。我想要获取这些字符串在其自己的行上的单个单词,以及其他
列
的相同
值
。,
但
具有其他相同的
列
"The dog" --- "The" --- 4Pm word_lis
浏览 4
提问于2013-03-14
得票数 8
回答已采纳
2
回答
Groupby
列
保留
具有最小
值
的多行
、
、
我有一个由两
列
id
和
一
列
数值组成的dataframe。我想按第一个id
列
分组,并
保留
与第二
列
中最小
值
对应的
所有
行,以便在需要时
保留
多行。91 1 9 2 6 92 6 5 3 2 8 我尝试
保留
最小
值
,查找id2 ()或删除重复的
值
,
但
浏览 46
提问于2019-01-17
得票数 2
回答已采纳
1
回答
如何在Python中对
groupby
聚合求和
、
、
、
我有这样的
groupby
对象,它是通过对指定的
列
应用
和
来创建的:27 13 445224.2690003140 13 42309.500000 15 47163.157000 我想将第三个£
列<
浏览 0
提问于2018-02-08
得票数 0
1
回答
熊猫-使用
groupby
()时避免布尔结果
、
、
groupy(),但是将"investment_in_millions“
列
的结果过滤为平均值> 10或其他
值
。如果适用这一点:我
保留
了
groupby
(),但是它在投资
列
中返回一个布尔
值
。如果我用: filtered = df[df[
浏览 0
提问于2020-08-04
得票数 0
回答已采纳
1
回答
Groupby
熊猫数据格式
保留
一些
列
的唯一
值
,并列出其他
列
、
我希望通过material_id对以下输出进行分组,
保留
material_description
和
MPN的唯一
值
,
但
列出plant_id。='@search.score'].
groupby
('material_id').agg({lambda return df_ref 此当前按material_id分组,并列出其他
列
下面的代码用于保持按material_id分组的唯一
值
,但现在我缺少了plant_i
浏览 7
提问于2022-09-21
得票数 0
回答已采纳
1
回答
Laravel
groupBy
但
保留
其他
值
、
、
、
、
lang: 'hr' 现在,我试图基于service_id连接这些行,而不丢失或覆盖彼此的
值
。1, name_hr: 'Igre', name_en: 'Games', slug_hr: 'igre', slug_en: 'games' 或者类似的东西,主要是在不丢失其他数据的情况下基于id将
所有<
浏览 3
提问于2017-11-03
得票数 0
点击加载更多
扫码
添加站长 进交流群
领取专属
10元无门槛券
手把手带您无忧上云
相关
资讯
学习Rust设计模式6:使用take和replace来保留所有值
学习Rust设计模式6:使用take和replace来保留所有值
万亿级数据规模下的倾斜调优
Hive|如何避免数据倾斜
Pandas与SQL的数据操作语句对照
热门
标签
更多标签
云服务器
ICP备案
对象存储
腾讯会议
云直播
活动推荐
运营活动
广告
关闭
领券