腾讯云
开发者社区
文档
建议反馈
控制台
登录/注册
首页
学习
活动
专区
工具
TVP
最新优惠活动
文章/答案/技术大牛
搜索
搜索
关闭
发布
精选内容/技术社群/优惠产品,
尽在小程序
立即前往
文章
问答
(9999+)
视频
沙龙
1
回答
在
Pandas
Dataframe
中
,
两
列上
的
Groupby
和
其中
一
列上
的
bin
(
范围
)
、
、
我正在尝试根据特定
的
用户属性将我
的
数据隔离到存储桶
中
,我希望看到每个buckets.For
中
的
一
些计数,我已经将这些数据导入到熊猫数据帧
中
。 5-10 1 5-10 0
浏览 14
提问于2019-11-06
得票数 1
回答已采纳
2
回答
modin可以用来做什么?
、
、
、
我
一
直
在
寻找并行化
的
选项,并找到了ray
和
modin。经过
一
些测试后,我对使用modin
的
好处有点迷惑了。
两
个例子:但是df.
groupby
()
pandas
的
0.59对modin.
pandas
的
5.46
浏览 11
提问于2021-01-08
得票数 0
1
回答
总结单行
中
的
多个值
、
、
、
给定这样
的
数据框架,即使
一
行中有多个国家,是否有可能将国家
的
特定值相加?例如,对于第
一
行日本和美国,我希望值为Japan=1 USA=1import numpy as np 'Country':['Japan;USA',
浏览 1
提问于2021-05-05
得票数 3
回答已采纳
1
回答
如何对熊猫
DataFrame
中
的
每10 %进行分组?
、
期望
的
输出如下: Group count10-20 630-40 2350-6010 60-70 54 我尝试了下面的代码,但它没有给出我想要
的
格式。df.
groupby
('percent').count() 有没有人能教我如何每10%做
一
个群?
浏览 43
提问于2021-04-14
得票数 0
3
回答
当在几个
列上
应用时,熊猫独特
的
不做群对对象
的
工作
、
、
假设我有
一
个包含3列(
其中
一
列包含组)
的
dataframe
,我将为每个组收集其他
两
个列
中
的
值集合。df = pd.
DataFrame
({ 'group': [1, 1, 2, 3, 3, 3,
浏览 12
提问于2020-08-21
得票数 1
回答已采纳
2
回答
使用输入
列上
的
多个agg函数进行分组,聚合
、
、
我希望通过
dataframe
在
熊猫群上进行
一
些聚合,在那里我需要在多个
列上
应用几个不同
的
自定义函数。这个操作
在
R(使用data.table或dplyr)中非常容易,而且很习惯,但我很惊讶我发现在熊猫
中
它是如此
的
困难:data = pd.
DataFrame
({'x: x.A.mean() - x.B.mean()) data.
groupby
(
浏览 2
提问于2017-05-16
得票数 4
回答已采纳
1
回答
Python (MAPI)获得回复邮件
的
响应时间
、
我使用
的
是Inbox
中
的
邮件
和
Sent Items
中
的
邮件
的
Sent Items,假设对于我们回复
的
邮件is是相同
的
,
和
是
一
样
的
,但问题首先是电子邮件链(或者是电子邮件会话)。由于ID保持不变,而且即使过了几天人们也会继续回复,所以执行
一
个简单
的
datetime - datetime (具有相同
的
会话ID)就会得到输出,例如-1
浏览 3
提问于2020-07-01
得票数 0
1
回答
如何在熊猫系列
中
按多个栏目分组
pandas
.Series
groupby
方法使按另
一
个系列进行分组成为可能,例如:但是,通过使用
两
列,此方法不适用于组:ValueError: <em
浏览 4
提问于2019-12-02
得票数 0
1
回答
熊猫
DataFrame
群按
两
栏获得最大值
、
嗨,我
在
两
个
列上
使用
groupby
,产品
和
城市,因为它显示在下面的图像
中
,
其中
的
产品
的
数量顺序
在
一
个特定
的
城市。现在,我只想看到每个产品
的
数量最大
的
城市。city_grp = df.
groupby
(["Product","City"]) p_
浏览 2
提问于2022-07-28
得票数 0
1
回答
如何将Sklearn SVM实现应用于使用SPARK ML计算
的
特征( Spark ML
中
缺少多类SVM )
、
、
、
、
我有220 GB
的
数据。我已经将其作为
两
列读取到spark
dataframe
中
: JournalID
和
Text。现在,我
的
数据帧
中
缺少27行。使用NGram类,我
在
dataframe
中
添加了另外
两
个列Unigram
和
Bigram,
其中
包含文本列
中
的
单字
和
双字。然后,我使用
一
元
和</e
浏览 1
提问于2018-12-17
得票数 0
1
回答
列上
的
Pandas
Multiindex
Groupby
、
、
、
有没有办法
在
多索引
中
的
列上
使用
groupby
。我知道您可以在行上,在这方面有很好
的
。然而,我似乎不能在
列上
分组。我唯
一
的
解决方案就是调换数据帧。#generate data (copied from
pandas
example) arrays=[['bar', 'bar', 'baz', 'baz', 'foo',
浏览 7
提问于2016-11-22
得票数 10
回答已采纳
1
回答
pd.pivot_table()无法计算datetime64[ns]上
的
统计信息
下面的代码创建
一
个包含
两
列date
和
category
的
pd.
DataFrame
。date列被设置为使用datetime64[ns]类型。>>> df = pd.
DataFrame
(data={'date': pd.Series(['2021-01-01', '2021-01-02', '2021-01-03'], dtype='date
浏览 41
提问于2021-08-12
得票数 1
4
回答
如何合并索引
和
列上
的
两
个数据帧
、
、
问题是:我知道如何在索引或
列上
合并
两
个
DataFrame
,但我不能同时
在
索引
和
列上
合并它们。 我有
两
个
DataFrame
,我想在索引(它们是日期)
和
列id上合并它们。我创建了
一
些样本数据来更好地解释我
的
问题。from datetime import dateimport
pandas
as pd da
浏览 64
提问于2020-05-09
得票数 0
回答已采纳
1
回答
为什么按聚合分组不按列分组返回
、
、
我有带columns: [order_id, uid, payment_channel, user_paid_amount, vertical]
的
空数据但是当我使用df.
groupby
vertical']).user_paid_a
浏览 6
提问于2020-02-28
得票数 0
1
回答
熊猫:
一
次
在
两
栏上使用agg。
、
、
我正在将
一
些pySpark代码迁移到
Pandas
中
,并坚持
在
两
列上
实现collect_set。pySpark代码如下所示:我可以很容易地通过
浏览 4
提问于2021-06-27
得票数 0
回答已采纳
1
回答
如何根据停止条件对排序
的
DataFrame
进行分组?
、
假设我有熊猫
DataFrame
,下面已经
在
A
列上
排序了。import
pandas
as pd 'B': range(5)*3}# just incase:生成
的
dataframe
如下所示:-----1 | 1
浏览 1
提问于2016-05-18
得票数 2
回答已采纳
1
回答
Python -使用
groupby
和
条件语句
、
如何根据
一
列对
DataFrame
进行分组,检查每个组(或任何其他条件)
中
另
一
列上
的
最高值,并使用分组期间找到
的
所有值
的
行创建
一
个新
的
DataFrame
?如果我
在
感兴趣
的
列上
使用
groupby
,然后检查我想要
的
条件,我将得到
的
唯
一
结果是
一
个包含
两</e
浏览 27
提问于2020-04-30
得票数 0
1
回答
熊猫如何在没有绝对价值
范围
的
情况下进行包装
和
分组
、
、
、
我有大量
的
纬度
和
经度值,我想把它们放在
一
起,以便在热图上显示它们(ipyleaflet似乎只允许热图中
的
2000点左右,而且当使用大数据时,这也会更有效)。我实际上是
在
使用vaex,但是用
pandas
来回答也很好。
pandas
pd.cut函数
在
绑定方面似乎很有用,但是它生成
一
个分类列(category dtype),它看起来像
bin
中所有值
的
列表。是否有办法将其更改为标识每个垃圾箱
的</
浏览 5
提问于2021-03-24
得票数 1
回答已采纳
3
回答
Dask-
Dataframe
列
中
的
唯
一
值数
、
、
、
我有
一
个从csv文件读取
的
Dataframe
文件,有大约100万条记录
和
120个特性/列,我想在每
一
列中计算唯
一
值
的
数量。我可以使用for -循环分别为每
一
列执行此操作:dask_df = dd.read_csv("train.csv") print(dask_df[c
浏览 4
提问于2021-11-11
得票数 0
2
回答
pd.df.plot.box()
和
pd.df.boxplot()之间
的
区别
、
、
为什么熊猫有
两
个Boxplot功能:
pandas
.
DataFrame
.plot.box()
和
pandas
.
DataFrame
.boxplot()?df = pd.
DataFrame
(np.random.rand(10, 5), columns=['A', 'B', 'C', 'D', 'E']) df.plot.box() ?
浏览 49
提问于2018-12-29
得票数 6
回答已采纳
点击加载更多
扫码
添加站长 进交流群
领取专属
10元无门槛券
手把手带您无忧上云
相关
资讯
从小白到大师,这里有一份Pandas入门指南
肝了3天,整理了90个Pandas案例
你可能不知道的10个Python Pandas的技巧和特性(下)
在Pandas中通过时间频率来汇总数据的三种常用方法
利用Python Pandas库从DataFrame中提取最新日期
热门
标签
更多标签
云服务器
ICP备案
对象存储
腾讯会议
云直播
活动推荐
运营活动
广告
关闭
领券