腾讯云
开发者社区
文档
建议反馈
控制台
登录/注册
首页
学习
活动
专区
工具
TVP
最新优惠活动
文章/答案/技术大牛
搜索
搜索
关闭
发布
精选内容/技术社群/优惠产品,
尽在小程序
立即前往
文章
问答
(9999+)
视频
沙龙
1
回答
如
何在
pandas
中
对
数据
帧
的
子
组
进行
操作
?
、
、
我正在尝试根据
数据
框
的
周数来计算特定子集
的
百分比变化。
数据
框如下所示: ref_dt week_name county_name state_name county_fips_code cmi 0 2020-01-01百分比变化是通过将一周
中
某一天
的
移动(ref_dt)与一周
中
同一天
的
平均值
进行
比较来计算
的
。这是我在
pandas
中
做了一个
子
浏览 8
提问于2020-04-08
得票数 1
回答已采纳
0
回答
如何使用来自
子
组
的
信息在熊猫
中
聚合分组
的
对象?
、
Pandas
的
groupby().agg()允许对
数据
帧
中
的
每个
组
执行
操作
。但是,我不知道如
何在
agg()中使用
子
组
信息。例如,我有以下
数据
帧
:'a': ['G1','G1', 'G1', 'G2', 'G2
浏览 3
提问于2017-11-22
得票数 0
1
回答
Pyspark -调用返回Series.interpolate()作为结果
的
pandas
_udf时出错
、
、
、
我试图创建一个返回interpolation函数
的
UDF,但该函数返回一个序列,带有索引并抛出异常。from pyspark.sql.types import FloatType def我最初
的
想法是因为我返回了一个具有多个值
的
序列,但我不知道如何准确地解决这个问题。 如果我更改我
的
函数,例如,返回一个v.mean(),效果会很好。 感谢任何人
的
帮助。 谢谢。
浏览 16
提问于2019-02-07
得票数 1
1
回答
将用户定义函数应用于
Pandas
中
Group By
的
每个子
组
、
、
我定义了以下函数,该函数最终
对
新列R、F、M和RFM
进行
排序和赋值: dfr=dataframe.sort('last_order_date',我将其返回到一个新
的
df
中
,然后
对
其运行一些统计
数据
。 我现在要做
的
是在
数据
帧
上运行group by函数,按其他列之一
对
它们
进行
分组,并对子
组
执行此分析。我返回了一
浏览 3
提问于2013-12-10
得票数 0
1
回答
DataFrameGroupBy
中
的
操作
、
、
、
我试图了解如
何在
“groupby”或
数据
帧
中
的
每个
组
中
应用函数。import
pandas
as pddf = pd.DataFrame({'Stock' : ['apple', 'ford', 'google', 'samsung我想得到和(价格*(1/信号)
组
)‘扇区’。结果输出应该如下所示
浏览 2
提问于2014-08-08
得票数 0
回答已采纳
1
回答
熊猫切片列和基于条件之间
的
选择子集
、
、
我有如下
数据
:timestamp 2020-11-0112:00:00,并且需要发生这些事件
的
索引/时间戳。每个列可能有多个这样
的
事件。所以,100,可以是从12:00到12:03之间
的
0.5到1,然后再从12:20到12:30。当它达到0时,它需要重置。列名是可变
的
。我还想要列值在0.5到1之间
的
时间差,所以从上面看是3分钟和10分钟。,它可能存在于d
浏览 3
提问于2020-11-27
得票数 0
回答已采纳
1
回答
向量化Python
Pandas
Dataframe
、
、
我有csv文件,我正在将其读入Python
Pandas
Dataframe。我想
对
操作
进行
矢量化,以便使用针对某些列
的
一
组
用户定义函数
对
列运行
数据
清理,并将结果附加到
数据
帧
中
。我可以读取记录并逐个处理它们,但我想通过
Pandas
使用一个函数
对
1整列
进行
操作
来向量化
操作
。输入
数据
帧</
浏览 3
提问于2019-11-01
得票数 1
1
回答
与编辑器
对
Python
的
Power查询不同
的
表
、
、
我需要转换一个
数据
转换程序从编辑器Power Query到Python。我不是很擅长编辑能力查询。我有一个包含30多列
的
表,任务如下:当我这样做
的
时候,它占据了哪一行?第一个?最后一个?是随机
的
吗?我如何将其转换为Python
Pandas
,以确保具有相同
的
数据
? 感谢您
的
答复
浏览 2
提问于2021-11-24
得票数 0
2
回答
根据列值保持
数据
帧
的
行数百分比
、
假设我有一个这样
的
数据
帧
:df = pd.DataFrame({'id':['A','A', 'A', 'B','B'], 'value':[2, 4, 6,3, 4]}) 我只想
对
id=A
进行
过滤,并保留x百分比
的
id=A
的
行。例如,如果为x=60%,则
数据</e
浏览 2
提问于2020-03-13
得票数 2
2
回答
如何根据同一
数据
框列
中
的
唯一值列表
对
该
数据
框子集?
、
、
、
我有一个简单
的
数据
帧
,看起来像这样。我想要能够选择所有的行,其中LOC是纽约,子集这个
数据
帧
,并标记为一个变量,我可以用来附加纽约
的
行,我已经创建
的
电子邮件使用win32
的
联系人。然后搬到波士顿,做同样
的
事情,等等。我不知道如
何在
不显式命名
的
情况下提取LOC行。我希望随着LOC值
的
变化,这是动态
的
。 Contact LOC ...
浏览 10
提问于2019-04-23
得票数 0
1
回答
从现有
数据
帧
的
某些列创建新
的
pandas
数据
帧
、
、
我已经阅读了将csv文件加载到
pandas
数据
帧
中
,并希望
对
该
数据
帧
进行
一些简单
的
操作
。我不知道如何根据从原始
数据
框中选择
的
列来创建新
的
数据
框。我
的
尝试是:dataset =
pandas
浏览 1
提问于2017-07-11
得票数 24
回答已采纳
3
回答
如何将DASK
数据
帧
放入MySQL
数据
表?
、
、
我从CSV文件
中
获取了
数据
,并将其保存在我
的
Dask
数据
帧
中
并
对
其
进行
操作
。然后,我需要将
数据
写入
数据
表。我还没有真正遇到过任何解决方案。
Pandas
的
to_sql函数具有内置
的
功能,所以我不确定是否需要首先转换为
Pandas
?我目前认为,将Dask
数据
帧
转换为
Pandas
会
浏览 4
提问于2020-03-27
得票数 1
1
回答
是否按
组
从现有已排序
的
熊猫
数据
帧
中提取
数据
帧
?
、
可能从标题中看不清楚,但我想使用排序
的
pandas
数据
帧
来做一些类似的事情:name amount 现在,我想要做
的
是按名称对此
数据
帧
进行
分组。然后逐个遍历这些
组
,并
对
它们
进行
一些处理。也就是说,在第一
浏览 3
提问于2017-02-15
得票数 2
回答已采纳
1
回答
对
组
内
的
pandas
数据
帧
进行
排序
、
、
我有一个
数据
框架: Category Score1 A 23B 5我期望得到
的
输出是:在Category中排序分数。
浏览 0
提问于2016-05-02
得票数 0
2
回答
处理对齐
数据
帧
组
的
高效整齐R技术
、
、
我正试图找到一种高效(理想情况下是整洁)
的
方法来处理一
对
分组data_frames。,每次从两个不同
的
数据
帧
对
一个idx
进行
操作
,其中一个
数据
帧
每个idx有一个或多个行(通常为数十行),而另一个idx可以有零行、一行行或多行
数据
。我知道我可以这样做,但它非常慢,因为
对
每个值
的
filter
操作
都需要一个完整
的
表扫描和子集。我还知道
浏览 5
提问于2017-09-29
得票数 1
回答已采纳
1
回答
Scala
中
的
Spark分组贴图UDF
、
、
我正在尝试编写一些代码,使我能够在
数据
帧
的
一
组
行上计算一些
操作
。在PySpark
中
,这可以通过定义类型为GROUPED_MAP
的
Pandas
UDF来实现。然而,在Scala
中
,我只找到了一种创建自定义聚合器(UDAF)或传统UDF
的
方法。 我
的
临时解决方案是生成一个关键字列表,该列表将对我
的
组
进行
编码,这将允许我过滤
数据
<em
浏览 2
提问于2020-04-08
得票数 2
3
回答
Pandas
groupby、filter和aggregate
、
我在
pandas
中有以下
数据
帧
employee_name age location salaryMarina1500000Heena 34 Delhi 800000 我想要从这个
数据
框
中
得到
的
是,所有不同地点
的
年龄
组
> 30和< 35<e
浏览 16
提问于2020-08-27
得票数 0
回答已采纳
1
回答
如
何在
spark中使用
pandas
split-apply-combine风格策略和scala api?
、
、
、
这个函数很复杂,使用在DataFrame类
中
定义
的
聚合,调用其他java库,并且不能用SQL表达。它需要整个
数据
帧
的
内容来
进行
计算,它不能一次添加一行并建立一个结果。我有一个大
的
dataframe,其中包含一个列,我想用它将dataframe分成小块,并
对
每个小块执行上述计算。然后,我想返回一个新
的
数据
帧
,其中包含每个
组
的
一行和两列,一列包含groupby值,另一
浏览 28
提问于2020-04-22
得票数 0
1
回答
如
何在
R中使用lapply
对
包含多个
数据
帧
的
列表
进行
采样?
、
、
我在
数据
帧
上使用split创建了以下
数据
列表:我正试图通过采样从该
数据
列表
中
创建训练和测试集,以便考虑在
数据
中
根本不均匀分布
的
放电id
组
。我正在尝试使用lapply来完成此
操作
,因为我不希望
对
列表
中
的
每个
组
进行
单独采样。(dat_di
浏览 24
提问于2021-03-03
得票数 0
回答已采纳
2
回答
Pandas
:与以前
的
值不同
、
给定一个如下所示
的
Pandas
数据
帧
1 5 false 2 2017 false 1 100 false对于掩码为真的每一行,我希望获得该
组
中
前一个值
的
差值,即结果应为 7 2 2
浏览 2
提问于2016-10-22
得票数 7
点击加载更多
扫码
添加站长 进交流群
领取专属
10元无门槛券
手把手带您无忧上云
相关
资讯
pandas系列学习(五):数据连接
Python数据可视化之pandas入门
如何只用一行代码让 Pandas 加速四倍?
如何只用一行代码让Pandas加速四倍?
10招!看骨灰级Pythoner如何玩转Python
热门
标签
更多标签
云服务器
ICP备案
对象存储
腾讯会议
云直播
活动推荐
运营活动
广告
关闭
领券