腾讯云
开发者社区
文档
建议反馈
控制台
登录/注册
首页
学习
活动
专区
工具
TVP
最新优惠活动
文章/答案/技术大牛
搜索
搜索
关闭
发布
精选内容/技术社群/优惠产品,
尽在小程序
立即前往
文章
问答
(7155)
视频
沙龙
3
回答
大型
Pandas
Dataframe
中值
的
小
子集
的
频率
、
、
、
此question提供了一个示例,说明如何使用pd.get_dummies +聚合从
pandas
数据帧中获取给定行
的
频率
计数。然而,如果您只想从一个非常大
的
数据帧中获得一个很小
的
术语
子集
,那么这种方法就不能扩展。例如,考虑相同
的
示例: import
pandas
as pd df = pd.
DataFrame
({'ID': ['xyz_1', 'xyz_2', '
浏览 8
提问于2020-10-10
得票数 3
回答已采纳
3
回答
如何在熊猫数据处理中使用.mean()、.median()、.mode()删除附加索引
、
、
、
、
我正在使用.mean()、.median()、.mode()计算熊猫df列
的
模式/
中值
/平均值,但是当这样做时,会出现一个索引:
dataframe
.drop(
dataframe
.index[
dataframe
['large_airport'] != 'Y'], inplace=True) mean =
dataframe
['fre
浏览 22
提问于2022-04-22
得票数 0
1
回答
如何根据其他列中
的
值相等,将值从一个DF赋值到另一个DF?
假设我有一个大
的
DataFrame
和一个
小
的
,这是它
的
子集
。Big one有Y列,small没有,它们都有colmun ID。如何根据ID
中值
的
相等将大DF中
的
Y赋值给
小
DF?
浏览 1
提问于2014-05-05
得票数 0
3
回答
创建
DataFrame
后设置
pandas
DatetimeIndex
的
频率
、
我正在使用
pandas
datareader来获取股票数据。import
pandas
as pdABB = web.DataReader(name='ABB.ST',现在我
的
问题是如何在ABB上使用astype将freq设置为daily?
浏览 3
提问于2017-01-09
得票数 22
回答已采纳
3
回答
在
Pandas
中删除行/获取与
大型
DataFrame
不同
的
子集
的
最快方法
、
、
问题 在我
的
数据集上花费了115秒 df.drop
浏览 1
提问于2018-11-20
得票数 6
回答已采纳
1
回答
基于时间
的
熊猫
DataFrame
的
删除
、
、
、
、
我有一个
dataframe
,它有一个时间列,其
中值
是字符串。我想对
dataframe
进行
子集
,这样只有位于窗口中
的
值才在
子集
中。('2000-01-01', date_format) subs_df =
pandas
.
DataFrame
我有一种感觉,我正在做一些根本错误
的
事
浏览 0
提问于2018-10-14
得票数 1
回答已采纳
1
回答
基于值
的
交叉字典
、
我有两个字典(dict1,dict2),由三个键(gene_expression、元数据、pValues)组成,每个键都包含
大型
数据集。我想对这两本字典进行比较和对比,以创建一个单独
的
字典,其中包含pValue为<=0.005
的
常见元素。如果我试着:我得到了理想情况下,我希望将两个字典中
的
项进行
子集</em
浏览 4
提问于2022-03-03
得票数 0
1
回答
大xml文件与多个xml文件
、
我可能有一个愚蠢
的
问题,但我找不到任何明确
的
元素,所以我得到了一个拍摄:我可以举个假例子: 客户(比如100,000人)拥有
浏览 2
提问于2015-03-24
得票数 0
回答已采纳
2
回答
pandas
中
的
rank方法中
的
ValueError没有更多解释
、
:593我
的
DataFrame
的
这些列中没有NaN值。我正在使用python2.7以及
pandas
0.18.1和numpy 1.11.0。 我
的
DataFrame
的
形状由大约9.000.000行和15列组成。更有趣
的
是,当我在
DataFrame
<
浏览 4
提问于2017-01-12
得票数 3
回答已采纳
1
回答
将
大型
.jsons文件加载到
Pandas
数据中
、
、
我正在尝试将一个大
的
jsons-文件(2.5GB)加载到
Pandas
dataframe
。由于文件
的
大小较大,
pandas
.read_json()将导致内存错误。file.jsons')) as json_file: data = list(map(json.loads, data)) 然而,这只是继续运行,减慢/崩溃了我
的
电脑
浏览 0
提问于2019-09-16
得票数 3
1
回答
基于数据挖掘
子集
添加新列
、
、
我有一个类似于此
的
df:import
pandas
as pd 'parent': [np.nan, 'a', 'a', 'b']}
浏览 1
提问于2021-08-18
得票数 0
回答已采纳
1
回答
将列中
的
值替换为excel/sql/ same中同一列中出现
的
频率
、
、
、
我有一个包含超过600000条记录
的
表和一个名为implementer_userid
的
列,其中
的
值可能被重复用于多个记录。现在,我想在该列中存储特定
的
不同值出现
的
次数。COUNTIF(Excel)、GroupBy(sql)和类似的函数不能工作,因为我不想要一个特定值
的
计数,而是用它们
的
频率
替换所有不同
的
值。在这三个框架中
的
任何一个框架中帮助我做到这一点:Excel、
Pandas
(Python)和。
浏览 3
提问于2020-02-20
得票数 1
回答已采纳
2
回答
制作条形图来表示潘达斯系列中发生
的
次数
、
、
我想知道是否有人能帮我制作一个条形图来显示潘达斯系列
中值
的
频率
。 我从形状
的
Pandas
DataFrame
(2000,7)开始,然后从那里提取最后一列。该列为形状(2000,)。我提到
的
系列中
的
条目从0到17不等,每个条目都有不同
的
频率
,我试图用条形图来绘制它们,但是遇到了一些困难。我最终想要
的
是一张条形图,每条对应于0到17之间
的
整数值,每条
的
高度(即y轴)
浏览 0
提问于2018-11-25
得票数 3
回答已采纳
1
回答
多列数值
的
作图
频率
、
、
、
、
我想创建一个两列
中值
出现
频率
的
pandas
图。散点图包含一条回归线。结果是带有回归线
的
类似热图
的
图。
浏览 2
提问于2020-06-24
得票数 0
1
回答
用Python中
的
CSV创建嵌套字典
我知道以前有人问过这个问题,但我想不出我
的
处境。dictionary = { "goals" : 5, "games played" : 50Playedplayer2 4 8 49 player3 6 10
浏览 2
提问于2020-08-09
得票数 0
回答已采纳
1
回答
在熊猫栏中,如果另一栏中
的
值相似,则计算值
的
频率
、
、
、
给出了一个类似于
pandas
dataframe
的
column_a和column_b。如何构造另外两个列,一个列计算来自column_a
的
所有列
的
每个值
的
频率
,另一个列计算column_a
中值
相同
的
唯一值数: column_a | column_b | col_a_count | count_unique_b_where_a
浏览 0
提问于2018-10-04
得票数 1
回答已采纳
1
回答
熊猫查询大数据慢
、
我需要查询一个
大型
的
dataframe
(df_b ~50兆行,3列),以查看该数据
的
子集
是否包含列表中
的
内容。我花了1-2秒。每次在
大型
dataframe
df_b (do df_b.query())中查找。有什么建议可以让我加快速度/换一种方式做吗?在我
的
示例代码下面df_b = pd.
DataFrame
({'M':[11,
浏览 1
提问于2021-05-13
得票数 1
回答已采纳
2
回答
如何在python中保存大
的
数组,使其占用更少
的
内存?
、
我是python
的
新手。我有一个很大
的
数组a,它
的
维数是(43200, 4000),我需要保存它,因为我需要它用于将来
的
处理。当我尝试用np.savetxt保存它时,txt文件太大,我
的
程序运行到内存错误,因为我需要处理5个相同大小
的
文件。有没有办法节省大量
的
数组,使其占用更少
的
内存? 谢谢。
浏览 4
提问于2013-09-11
得票数 10
回答已采纳
1
回答
更新
dataframe
列
中值
的
子集
、
、
、
以下是我
的
数据摘要: 4 a 7.146329 17 a
浏览 0
提问于2017-03-09
得票数 3
回答已采纳
3
回答
从列中为数据
子集
创建假人,该数据
子集
不包含该列中
的
所有类别值
、
、
我正在处理一个
大型
数据集
的
子集
。 In [1]: df type 1 4In [3]:import
pand
浏览 2
提问于2017-04-27
得票数 4
回答已采纳
点击加载更多
扫码
添加站长 进交流群
领取专属
10元无门槛券
手把手带您无忧上云
相关
资讯
为什么需要Pandas的DataFrame类型
python关于dataframe的小练习
肝了3天,整理了90个Pandas案例
Pandas清洗数据的4个实用小技巧
在Pandas中通过时间频率来汇总数据的三种常用方法
热门
标签
更多标签
云服务器
ICP备案
对象存储
腾讯会议
云直播
活动推荐
运营活动
广告
关闭
领券