腾讯云
开发者社区
文档
建议反馈
控制台
登录/注册
首页
学习
活动
专区
工具
TVP
最新优惠活动
文章/答案/技术大牛
搜索
搜索
关闭
发布
精选内容/技术社群/优惠产品,
尽在小程序
立即前往
文章
问答
(9999+)
视频
沙龙
1
回答
如何
使用
属性
添加
基于
Python
DataFrame
数据
集
的
指标
,并
作为
单独
的
列
添加
?
、
我有如下定义
的
数据
集
ADDRESS CITY STATE ZIP LENGTHOFATTRIBUTES2242 HARTFORD TPKE VERNON ROCKVL CT 06066 470 42 我需要
添加
一个指示器
列
对于该示例,LENGTHOFATTRIBUTES 43应当具有相应
的
指示
浏览 14
提问于2021-07-08
得票数 1
回答已采纳
1
回答
Python
按索引连接
数据
帧
、
、
我正在
使用
Python
中
的
多个
数据
帧,
并
希望
基于
一个公共
列
将一个
数据
帧映射到另一个
数据
帧(类似于Excel中
的
索引/匹配)。我希望将一个
数据
帧
的
date
列
连接到另一个
数据
帧
的
index (其中日期存储为索引)。我
如何
调用索引呢?
作为
参考,我想从
DataFrame
1
浏览 22
提问于2021-03-25
得票数 4
2
回答
Pandas sum-
列
的
滞后
假设我有这样
的
数据
df = pd.
DataFrame
({"MONTHS":[1,2,3,4,5,6], "METRIC":[430,584,648,571,610,535]}) df = pd.
DataFrame
({"MONTHS":1,2,3,4,5,6,“
指标
”:430,584,648,571,610,535})我想做
的
是找出
指标
列
的
和=3378 MONTHS NEW_
浏览 18
提问于2019-05-31
得票数 3
回答已采纳
2
回答
在
Python
中从字典生成
数据
帧
的
快速方法
、
、
、
我正在尝试从字典中创建pd.
DataFrame
,如下所示: x = {6: 8416, 2: 8361, 5: 8343, 4: 8326, 1: 8292, 3: 8262} 我希望这两个数字
作为
单独
列
中
的
行,
并
添加
列名'Y‘和'Z’。我以某种方式手动完成了这项工作,但我正在为
数据
集
寻找更快
的
方法,这是不可能再手动完成
的
浏览 15
提问于2020-07-13
得票数 0
回答已采纳
1
回答
如果
数据
文件中
的
多行共享特定
列
中
的
相同值,则返回True
、
、
我有一个包含四个
列
的
dataframe
:雇员ID、员工位置、经理ID和Manager位置。我想编写一个
python
脚本,它搜索共享相同Manager ID
的
所有员工ID,
并
检查这些员工是否都位于同一位置(换句话说,员工位置是否与所有员工ID匹配)。
基于
此,我只想
添加
一个返回True或False
的
新
列
。 我已经看到一些旧
的
文章建议
使用
groupby来根据
列
对相似的
浏览 1
提问于2022-07-26
得票数 0
回答已采纳
1
回答
如何
为给定
列
添加
行和值?
、
、
因此,我现在有以下
DataFrame
,其值如下:+-------+--------+ | VALUE
如何
向TIME
列
添加
值?稍后,我将在我
的
程序中
添加
更多
的
行,并且需要为值和时间
列
添加
/追加值。我该怎么做?
浏览 5
提问于2017-06-26
得票数 0
回答已采纳
1
回答
使用
Python
脚本根据PowerBI中的当前
数据
集
创建新表
、
、
我有一个csv文件
作为
源
数据
集
。目前在表中有一
列
,我想
使用
Python
循环并从每个单元格
的
字符串中提取
数据
。例如,在单元格中: 数量变化了10,价格变化了90。我想
使用
Python
并提取"Quantity,Price“和"10,90”来创建具有这些
属性
和值
的
新表。然后
使用
Python
创建视觉效果,而不是
使用
P
浏览 18
提问于2021-03-07
得票数 0
1
回答
合并
数据
但丢失
数据
我有两张
数据
。
Dataframe
A有5
列
(第一
列
是代码),
Dataframe
B有2
列
(第一
列
是代码)。它们有不同
的
长度。我试图
添加
第6
列
的
数据
,A
基于
匹配
的
代码。并不是所有的代码都在
dataframe
中,当
使用
合并函数时,我会丢失这些代码。
如何
保存我在
dataframe
中
浏览 4
提问于2015-11-06
得票数 0
1
回答
处理我
的
测量
数据
的
最佳库和实现
、
、
、
我有很多测量
数据
要用
Python
来分析。每个
数据
集
由一个参数
集
(带有数字、日期和字符串
的
标量)和两条曲线组成。我开始用Pandas实现这一点,并为每个参数创建了一个带有
列
的
Dataframe
,并以度量ID
作为
索引。然后,我为曲线
添加
了一个
列
,这样,该
列
中
的
每个字段都包含这两个曲线,
作为
两个numpy数组
的
二分法
浏览 1
提问于2019-12-19
得票数 2
回答已采纳
1
回答
如何
在
Python
中实现规则
集
、
、
我处理一个大型
数据
集
,其中
基于
A
列
,我希望以特定
的
方式处理其他一些
列
。等。 这些规则非常复杂,我想以一些最好是标准
的
“规则
集
”格式将它们保存在一个
单独
的
文件中。这类规则是否有一种常用
浏览 2
提问于2015-11-14
得票数 3
回答已采纳
10
回答
如何
将新
列
添加
到星火
DataFrame
(
使用
PySpark)?
、
、
、
、
我有一个火花
DataFrame
(
使用
PySpark 1.5.1),
并
希望
添加
一个新
的
列
。我尝试过以下几种方法,但都没有成功: spark_new_col = sq
浏览 13
提问于2015-11-12
得票数 179
回答已采纳
3
回答
Python
:
如何
为多
列
标题
添加
主
列
标题?
、
目前,我有以下
数据
集
:df=pd.
DataFrame
(data)如果我想将主
列
标题
添加
到现有的
列
标题中,我
如何
编写
python
脚本。例如,'a1‘&am
浏览 7
提问于2022-07-05
得票数 1
回答已采纳
1
回答
Spark-Java :
如何
在spark
Dataframe
中
添加
数组
列
、
、
、
、
我正在尝试向我
的
Spark
Dataframe
添加
一个新
列
。
添加
的
新
列
的
大小将
基于
变量(例如salt) post,我将
使用
该
列
分解
数据
集
以用于盐连接。目前,我在array函数中
使用
连续
的
lit,但这有一个问题,它不能被参数化,而且
作为
一种编码实践看起来很糟糕。我目前
的
实现看起来像下面这样。Re
浏览 80
提问于2021-03-14
得票数 1
回答已采纳
1
回答
KQL:查询除现有
列
之外
的
动态
列
中
的
所有变量
、
、
我正在
使用
Microsoft azure Appinsights,
并
希望将日志
数据
导出到CSV,这样我就可以
使用
python
来分析它。问题是,有一个名为customDimensions
的
列
,它是动态类型
的
,具有许多重要变量,我希望将它
作为
单独
的
列
。此外,我是否处理了大量
的
数据
,所以我不能仅仅用'extend‘对我想要
的
浏览 8
提问于2020-02-22
得票数 0
1
回答
加权
属性
、
、
如果我有一个具有二进制分类
的
数据
集
,并且有许多值为(0或1)
的
属性
,则表示
属性
的
出现由1表示,而缺勤由0表示,那么在应用分类器模型之前,是否可以将该
属性
的
权重
作为
单独
的
列
添加
到
数据
集中?
浏览 0
提问于2019-12-29
得票数 4
1
回答
nltk.word_tokenize不返回(n,2)形状
的
大矢量(
数据
)
、
、
、
、
我有一个基本
的
数据
集
,其中一个对象名为“注释”,一个浮动名为“毒性”。我
的
数据
集
的
形状是(1999516,2)我试图
使用
nltk
的
word标记化方法
添加
一个名为“tokenized”
的
新
列
,
并
创建如下所示
的
单词袋: dataset = pd.read_csv(toxic_comment_classification_dataset.c
浏览 3
提问于2021-12-07
得票数 1
回答已采纳
1
回答
基于
标准
的
大熊猫DataFrames分类
、
我有一只熊猫
DataFrame
,其结构如下:现在,我想
添加
一个
单独
的
列</
浏览 3
提问于2013-01-29
得票数 0
回答已采纳
1
回答
修改udf以在databricks spark scala中显示超过99999
的
值
、
、
、
创建了具有以下方案
的
数据
集
org.apache.spark.sql.Dataset[Records] = [value: string, RowNo: int] 这里
的
value字段是固定长度
的
位置,我想将它转换为
单独
的
列
,
并
使用
自定义函数
添加
RowNo
作为
最后一
列
。ReadFixWidthFileWithRDD(SrcFileType:String, rdd:
浏览 13
提问于2021-06-25
得票数 0
回答已采纳
1
回答
在
Python
pandas
Dataframe
中导入SAS中
的
日期字段
、
、
、
、
我已经
使用
Pandas read_sas(path)函数在
python
dataframe
中导入了一个SAS
数据
集
。REPORT_MONTH是在sas
数据
集中定义
并
保存为DATE9
的
列
。格式。此字段在
dataframe
中
作为
float64
数据
类型导入,并且具有数字,该数字基本上是用于在sas
数据
集中存储日期
的
sas内部数字。现在,我想知道
浏览 0
提问于2016-07-22
得票数 0
4
回答
如何
组合、分离、测试和训练
数据
进行
数据
清洗?
、
、
、
、
我正在开发一个ML模型,其中我已经在两个文件test.csv和train.csv中获得了
数据
。我想对两个文件一起执行
数据
清理,将它们连接起来,然后将它们分开。我知道
如何
连接2个
数据
文件,但是在
数据
清理之后,我将
如何
分离这两个文件?请帮我完成密码。
浏览 0
提问于2020-09-12
得票数 3
点击加载更多
扫码
添加站长 进交流群
领取专属
10元无门槛券
手把手带您无忧上云
相关
资讯
手把手教你做一个“渣”数据师,用Python代替老情人Excel
pandas系列学习(三):DataFrame
python起步学习(三)
结构化数据,我该拿你怎么办?
pandas系列学习(五):数据连接
热门
标签
更多标签
云服务器
ICP备案
对象存储
云直播
腾讯会议
活动推荐
运营活动
广告
关闭
领券