腾讯云
开发者社区
文档
建议反馈
控制台
登录/注册
首页
学习
活动
专区
工具
TVP
最新优惠活动
文章/答案/技术大牛
搜索
搜索
关闭
发布
精选内容/技术社群/优惠产品,
尽在小程序
立即前往
文章
问答
(5634)
视频
沙龙
3
回答
如何
按
单词
分组
并
创建
由
浮点
值
组成
的
等效
列
?(
熊猫
)
、
、
、
、
Background Method Background Direct 现在我想根据它们
的
第一个
单词
将它们
分组
到新
的
列
中
浏览 18
提问于2021-10-16
得票数 0
回答已采纳
1
回答
由
一
列
中
的
多个
值
组
组成
的
SQL组
、
、
、
因此,我有一个表,其中有一个
列
,需要在该
列
中
按
特定类别
分组
。例如,
列
中有20个代码在一个称为住宅
的
组中,30个代码在商业中。这个是可能
的
吗?
如何
创建
由
同一
列
中
的
多个不同
值
组成
的
组?
浏览 1
提问于2015-07-16
得票数 3
回答已采纳
1
回答
使字典计数多个字符串中
的
单词
、
、
在
熊猫
数据框架中,有一
列
只是字符串,我想
创建
一个字典(与数据框架分开),该字典
由
该
列
每一行中字符串
的
单词
生成
的
键
组成
,而这些键
的
值
是每个
单词
/键出现次数
的
计数。我读了一些关于Count子类
的
内容,但我不确定这是否是正确
的
方法。是否可以在lambda函数中使用该解决方案?
浏览 5
提问于2022-07-25
得票数 1
回答已采纳
3
回答
熊猫
与名单上
的
元素相匹配
、
我需要匹配大
熊猫
列
中列出
的
关键字和列表中
的
关键字,
并
创建
一个
由
匹配
的
单词
组成
的
新
列
。
浏览 2
提问于2019-06-25
得票数 1
回答已采纳
1
回答
如何
在
熊猫
中添加基于聚合函数
的
新
列
、
我有一只
熊猫
的
资料如下----a, 5b, 1我想
按
列
A
分组
并
总结
列
B中
的
值
,并将其作为另一
列
附加
并
创建
以下数据--------a, 5, 13b, 1, 3我怎么能在
熊猫
身上做到这一点呢?
浏览 0
提问于2018-11-22
得票数 3
回答已采纳
2
回答
Groupby
列
保留具有最小
值
的
多行
、
、
我有一个
由
两
列
id和一
列
数值
组成
的
dataframe。我想
按
第一个id
列
分组
,
并
保留与第二
列
中最小
值
对应
的
所有行,以便在需要时保留多行。这是我
的
熊猫
数据框 id1 id2 num11 1 41 2 32 6 92 65 2 9
浏览 46
提问于2019-01-17
得票数 2
回答已采纳
1
回答
Int64数据类型在描述函数或分位数函数中失败
、
我
的
熊猫
的
问题是
如何
使用describe()函数和可空整数数据类型Int64 (或Int32)。我相信我有一个数据问题,但迷失了
如何
找到造成问题
的
数据。或者,
熊猫
是否有计算百分位数
的
错误?我使用read_csv
创建
了一个
熊猫
数据框架,
并
使用dtype参数将一些数据指定为Int64。指定为Int64
的
数据是人员
的
计数,除缺少
值
外,将为整数。数据集有
浏览 2
提问于2021-08-16
得票数 1
1
回答
通过在另一
列
中命中最大
值
的
条件对pandas数据帧中
的
连续行进行
分组
、
、
、
、
我有一个
由
时间序列索引
的
熊猫
数据帧,该时间序列包含一颗绕地球运行
的
卫星
的
GPS纬度和加速度
列
。此纬度在最大
值
和最小
值
之间振荡,
并
具有预期
的
恒定时间周期。我想做
的
是,对每个轨道周期
的
加速度
列
进行积分。我知道我需要使用pandas 'groupby‘方法来对每个时期进行
分组
。但是,我不知道
如何
将连续
的
行<
浏览 8
提问于2018-02-08
得票数 1
1
回答
Groupby包含两个特定
的
值
--
熊猫
。
、
我
的
目标是返回
熊猫
df中包含两个特定
值
的
行,这些
值
由
一个单独
的
列
组成
。使用下面的方法,我将
按
Num进行
分组
,目标是返回存在B
的
行,但不返回每个唯一组
的
A。 如果没有将A或B分配给
分组
值
,则继续。我只想返回B存在
的
行,但不返回A。
浏览 3
提问于2021-04-14
得票数 2
回答已采纳
2
回答
SQL - Count(*)未按预期方式行事
、
[C#])=[Enter Value])) //Parameter Input from User“我
的
学位”
列
从不增加,它总是显示我怀疑我没有正确地实现我
的
GROUP BY方法。如果我正确理解它,所有被选中且不是聚合函数一部分
的
列
(在我
的
例子中是COUNT)都应该放在GROUP BY中。任何帮助都是非常感谢
的
。提前感谢 编辑:我试图实现
的
是检查一个列有多少行具有
浏览 0
提问于2015-08-20
得票数 0
1
回答
按
线名和地理位置对GeoPandas进行排序
、
、
、
我有一个
由
shapefile
创建
的
geopandas数据文件。df['mean_coord'] = df.geometry.apply(lambda g: [np.mean(g.xy[0]),np.mean(g.xy[
浏览 5
提问于2017-12-26
得票数 0
回答已采纳
1
回答
我想
按
两
列
分组
,然后在第三
列
上打印出对应于最小
值
的
行。
、
以下是
熊猫
中两个数据数据
的
例子: df2 = pd.DataFrame({0: [4.05, 2.1, 2.99], 1: [1, 3, 1, 7]}) df2.columns = ["x2", "y2"] 然后,我将它们合并,
并
生成另一个dataframe,它仅
由
相互最接
浏览 6
提问于2022-04-18
得票数 0
回答已采纳
1
回答
从字典中
的
DataFrame中获取值
、
、
我在字典里有个
熊猫
DataFrame。DataFrame
由
5个
列
和标题和索引t
组成
。因此,我需要从Werte_df中提取特定
的
列
如何
提取这些
值
并
创建
一个新
的
DataFrame?
浏览 0
提问于2021-08-10
得票数 0
回答已采纳
1
回答
具有groupby两个特性
的
Boxplot
、
、
假设我有一个df,它
由
3
列
'Y/N‘、'Test and’、'Test After‘
组成
,其中'Y/N’是布尔型
的
,'Test以前‘是浮动
的
。我可以使用df.boxplot(column='Test Before/Test After', by 'Y/N')
创建
单独
的
“列名”框,每个框
按
'Y/N.‘<em
浏览 1
提问于2018-11-01
得票数 0
1
回答
R
分组
时间序列与tidyverse
的
相关性
、
我想要
分组
数据帧中
的
时间序列相关性。我想要按type
分组
的
每个kind
的
值
的
时间序列相关性。将每个type和time组合看作是一个
由
4个
值
组成
的
有序向量。我
按
type和time
分组
,然后
按
kind排列,然后删除kind。y <- x %>% group_by(type) %>% arrange(type, time, kind)
浏览 22
提问于2020-02-08
得票数 0
回答已采纳
1
回答
关于在Hadoop MapReduce作业中调试辅助排序
的
问题,有什么建议吗?
、
、
、
我了解辅助排序在Hadoop中是
如何
工作
的
。我
创建
了一个
由
4个字段
组成
的
中间键。I
按
第一个字段分区,
按
第一个和第二个字段
分组
,并按所有4个字段排序。看起来我已经确定了
分组
和分区,但是
值
在reducer中
的
顺序是混乱
的
。 你对
如何
调试这个有什么想法吗?
浏览 1
提问于2012-02-10
得票数 1
回答已采纳
1
回答
python pandas df合并多索引
的
一部分
、
、
、
、
我有两个数据帧,有多个索引,一个索引
由
列
a,b
组成
,另一个
由
列
a,b,c
组成
。为了这篇文章,我们称数据帧为ab和abc。我想像这样使用左合并
熊猫
使用多索引
的
简
浏览 10
提问于2019-08-15
得票数 1
1
回答
PySpark:
如何
使用窗口函数
按
固定日期范围和另一
列
来计算
值
列
的
和?
、
、
、
、
我有一个星火DataFrame,
由
三
列
组成
:Date、Item和Value,类型分别是Date、String和Double。我想
按
日期范围
分组
(其中每个范围
的
持续时间从数据中
的
第一个日期开始起为7天)和项,
并
计算
由
日期范围(实际周号)和项定义
的
每个此类组
的
值
的
总和。我怀疑PySpark
的
窗口函数在某些时候应该被用于日期范围,但是在这种情况下无法找
浏览 1
提问于2019-03-27
得票数 2
3
回答
使用groupby
创建
箱线图
、
、
、
我有一个df,它
由
两
列
组成
,'date‘和'value',包含多年
的
’value‘数据。我想
创建
一个按月和年
分组
的
值
范围
的
箱线图。我使用groupby将
值
分组
如下:但是现在我不知道
如何
对得
浏览 0
提问于2021-04-12
得票数 2
1
回答
将Pandas dataframe中
的
行
分组
,应用自定义函数并将结果存储为新
的
数据格式行
、
、
、
、
我有一个
熊猫
数据中心( dataframe df_org ),它有三
列
--索引(整数)、标题(字符串)和日期(日期)。 我有一个方法process_title(text),,它将一个字符串作为输入
并
标记,删除停止词
并
对输入字符串进行归一化,并将这些
单词
作为列表返回。,其中包含三
列
-字(字符串),频率(整数),日期(日期)。word
列
包含process_title(文本)返回
的
列表中
的
单词
(单个
单词<
浏览 1
提问于2021-08-29
得票数 0
回答已采纳
点击加载更多
扫码
添加站长 进交流群
领取专属
10元无门槛券
手把手带您无忧上云
相关
资讯
70个NumPy分级练习:用Python一举搞定机器学习矩阵运算
70个NumPy练习:在Python下一举搞定机器学习矩阵运算
Javascript 正则表达式javascript
数据库SQL学习与总结
软件测试笔记|Python编程基础|Pandas 知识精要
热门
标签
更多标签
云服务器
ICP备案
云直播
对象存储
腾讯会议
活动推荐
运营活动
广告
关闭
领券