Pandas GroupBy聚合不保留数据类型

我通过使用sum、max和min等函数将Pandas GroupBy和Groupby.agg用于我的数值列，但我注意到以前强加给我的列的数据类型(如np.int8、np.int16、np.int32)在GroupBy聚合后不会保留，实际上每一列都被覆盖为int64。Pandas版本1.1.5 我目前的解决方案是在完成groupby聚合后重新转换，这是一个已知的问题和/或有更好的解决方案吗？

浏览 19提问于2021-03-16得票数 1

回答已采纳

1回答

pandas在group by之后将列类型更改为datetime

、

这与我在这里提出的前一个问题(pandas average by timestamp and day of the week)有关。在这里，我执行一个groupby操作，如下所示： df = pd.DataFrame(np.random.random(2838),index=pd.date_range('2019-09-13 12:40:00', periods=2838, freq='5T')) df.reset_index(inplace=True) df.group

浏览 18提问于2019-10-11得票数 1

回答已采纳

1回答

Pandas Groupby没有对单个结果进行聚合

、、、

我在Pandas有一个数据帧，它显示了一个城市/州的男性所占的百分比。数据帧df如下所示(请注意，这不是我的实际使用情况/数据，但我的数据类型类似) STATE CITY PERC_MEN print(state_df.groupby

浏览 4提问于2021-09-08得票数 0

0回答

如何连接Pandas* dataframe列*

、

如何在Pandas数据帧中连接不同数据类型的列，以便如果列number与列operator连接在一起，并且我执行了一个groupby('user').sum()，我就可以拥有适当的聚合：4 -432 - C6 567 + D #df.groupby

浏览 1提问于2016-07-01得票数 2

回答已采纳

1回答

在对熊猫数据进行分组操作时无法聚合的列中，保留数据的最佳方法是什么？

、、、

熊猫数据很适合存储非同构的数据类型，而groupby方法为聚合数据增加了很大的灵活性；然而，我经常希望保留在执行groupby操作后不能聚合的底层数据。911', 'M3', 'M3', 'M3', ],如果我要运行以下代码： df_cars.groupby为了保存这些信息

浏览 2提问于2020-03-06得票数 3

1回答

如何将pandas.core.groupby.groupby.DataFrameGroupBy转换为dataframe？

、、

我在DataFrame上应用了groupby，之后它将DataFrame转换为pandas.core.groupby.groupby.DataFrameGroupBy格式。如何将pandas.core.groupby.groupby.DataFrameGroupBy转换为常规DataFrame，或者如何从pandas.core.groupby.groupby.DataFrameGroupBy数据类型

浏览 7提问于2018-10-27得票数 1

1回答

在没有命名列的情况下，Python熊猫在所有其他列上执行相同的聚合。

、、、

根据，当您想要对多个列应用相同的聚合函数时，您必须给列命名。现在考虑一种情况，我有许多列(例如，30列)。是否有任何方法可以不命名列而进行聚合？我是说有这样的事吗？import pandas as pddf.groupby('id').agg(lambda: col -> [sum(col) if col !

浏览 5提问于2022-07-09得票数 0

回答已采纳

1回答

熊猫:将数组求和为具有多个组比列的聚合

、、

，不返回列C(带有numpy数组的列)： DLabel1 yellow 3 File "C:\Anaconda3\lib\site-packages\pandas\core\groupby.py", line 96, in\lib\site-packages\

浏览 3提问于2016-10-03得票数 3

回答已采纳

2回答

不聚合熊猫将群堆到DataFrame MultiIndex

、、

一些关于将熊猫群对象转化为DataFrame的问题似乎涉及聚合，比如count() 。 df = DF.from_dict({'a':1, 'b':2, 'c':3, 'd':4, 'e':5}, orient='in

浏览 0提问于2019-01-22得票数 2

回答已采纳

2回答

不带聚合或计数的Pyspark groupBy* DataFrame*

、、

它可以在没有聚合或计数的情况下遍历Pyspark groupBy数据帧吗？例如Pandas中的代码： for i, d in df2:Is there a difference in howto iterate groupby in Pyspark or have to use aggregation and count?

浏览 54提问于2020-01-07得票数 3

回答已采纳

2回答

如何在groupby中使用一个字符串"mean“或"sum”来实现动态化？

、、

dict = { "A": ("a", "mean"), df.groupby(i)[dict[i][0]].sum() df.groupby(i)[dict[i][0]].mean() 如何替换硬编码的"sum“或"mean"，以便它使用字典中给定的内容？如下所

浏览 9提问于2020-10-31得票数 2

回答已采纳

1回答

更改DataType的GroupBy方法

、

使用Python3和Anaconda，我在ipython上导入了pandas和os。我有一个非常大的csv文件。在对文件使用read_csv之后，我尝试对两列使用.groupby()，但它将数据类型从DataFrame更改为DataFrameGroupBy，并且我不能再对其运行数据框方法。import os band_gaps = totals.groupby(['c

浏览 19提问于2019-06-21得票数 0

回答已采纳

1回答

Pandas Dataframe (内部)在同一Dataframe上加入

、、、、

df_merge = dfhead.merge(dfhead, how = 'inner',on = [c[0],c[1],c[2]]) 哪里然后会给出答案，这样就只存在一个与同一行完全相同的内部连接，但我不希望它们包含在内但请注意，在不希望包含完全相同行的连接！

浏览 12提问于2020-12-07得票数 0

1回答

熊猫群按日期时间函数不保留dtype

、、

在Pandas对象的.minute聚合上下文中，我在提取groupby属性时遇到了问题。import pandas as pddates = ['2

浏览 4提问于2017-04-17得票数 1

回答已采纳

3回答

通过制作系列熊猫；而不是按对象分组

、、、

我有一个交易的Pandas DataFrame：0命令：它生成一个groupby对象： Purchase_Type year_month

浏览 0提问于2018-07-22得票数 3

回答已采纳

2回答

大熊猫计算平均值

、

我有这样一个数据框架：window 1 11075768 0.00001 7 62 11075770 0.000

浏览 0提问于2018-07-24得票数 2

回答已采纳

0回答

尝试使用Bokeh绘制pandas数据帧分组

、、、

我要做的是在Bokeh图中显示数据帧的聚合。我尝试使用groupby对象，但在将groupby对象传递给ColumnDataSource时出现错误(如下面的帖子所述)。下面是我正在使用的一些示例代码：from bokeh.models import ColumnDataSourcegroup = df.group

浏览 0提问于2017-12-13得票数 0

1回答

python中pd groupby中的不同聚合

、

我有一个这样的df，并且需要在groupby中执行多个聚合，包括连接行和在相同的cols上执行不同的操作。import pandas as pd sample = pd.DataFrame({'group':['a']*3+['b']*6, 'time':[1,2,4,6,7,8,9,12,15],'type有没有好的方法不包含这些索引和\n？sample.groupby('group').agg

浏览 37提问于2021-02-12得票数 1

回答已采纳

2回答

熊猫pivot_table不分组

、、

在不提供分组的情况下，使用pandas.pivot_table计算整个表上的聚合函数的最佳方法是什么？例如，如果我想将A、B、C的和计算成一个有一行的表，而不按任何列进行分组：>>>package/python-2.7.5/lib/python2.7/site-packages/

浏览 10提问于2015-07-01得票数 2

回答已采纳

1回答

如何用groupby方法表示数据的平均值

、、、

(B)编码； 'capital_loss', 'hr_per_week', 'country', 'income' ] coun

浏览 0提问于2020-05-07得票数 1

回答已采纳

点击加载更多

扫码

添加站长进交流群

领取专属 10元无门槛券

手把手带您无忧上云

pandas在group by之后将列类型更改为datetime

Pandas Groupby没有对单个结果进行聚合

如何连接Pandas* dataframe列*

在对熊猫数据进行分组操作时无法聚合的列中，保留数据的最佳方法是什么？

如何将pandas.core.groupby.groupby.DataFrameGroupBy转换为dataframe？

在没有命名列的情况下，Python熊猫在所有其他列上执行相同的聚合。

熊猫:将数组求和为具有多个组比列的聚合

不聚合熊猫将群堆到DataFrame MultiIndex

不带聚合或计数的Pyspark groupBy* DataFrame*

如何在groupby中使用一个字符串"mean“或"sum”来实现动态化？

更改DataType的GroupBy方法

Pandas Dataframe (内部)在同一Dataframe上加入

熊猫群按日期时间函数不保留dtype

通过制作系列熊猫；而不是按对象分组

大熊猫计算平均值

尝试使用Bokeh绘制pandas数据帧分组

python中pd groupby中的不同聚合

熊猫pivot_table不分组

如何用groupby方法表示数据的平均值

扫码

相关资讯

热门标签

活动推荐

运营活动

社区

活动

资源

关于

腾讯云开发者

热门产品

热门推荐

更多推荐