腾讯云
开发者社区
文档
建议反馈
控制台
登录/注册
首页
学习
活动
专区
圈层
工具
MCP广场
文章/答案/技术大牛
搜索
搜索
关闭
发布
文章
问答
(9999+)
视频
沙龙
2
回答
如何将返回
的
单热编码
列
合并到原始数据帧中?
、
、
、
、
我有一个包含21个不同
列
的
banking_dataframe,其中一个是目标,其中10个是数字特征,10个是分类特征。我已经使用
pandas
的
get_dummies
方法将分类数据转换为one-hot编码。返回
的
dataframe有74
列
。现在,我想将编码
的
数据帧与原始数据帧合并,这样我
的
最终数据就应该有一个分类
列
的
热编码
值
,但数据帧
的
原始大小是21
列</e
浏览 2
提问于2019-08-01
得票数 0
3
回答
Pandas
-
值
来自
另一
列
的
get_dummies
、
、
列
Mfr Number是一种分类数据类型。我希望对其执行
get_dummies
或热编码,但如果新
列
来自
该行,我希望它填充
来自
quantity
列
的
值
,而不是用1填充该
列
。所有其他新
的
“虚拟对象”在该行上应该保持为0。这个是可能
的
吗?
浏览 13
提问于2019-03-21
得票数 3
回答已采纳
4
回答
熊猫一种热编码:将频率较低
的
类别捆绑在一起
、
、
、
我正在对一个包含大约18个不同类型
值
的
分类
列
进行一次热编码。我只想为那些
值
创建新
列
,这些
值
显示
的
值
超过某个阈值(假设为1%),并创建
另一
个名为other values
的
列
,该
列
的
值
为1如果
值
不是那些频繁
的
值
。 我在用
Pandas
和Sci-kit学习。我已经探索过熊猫
g
浏览 5
提问于2017-04-10
得票数 6
回答已采纳
4
回答
在熊猫中用多个
值
的
列
创建假人
、
、
、
我正在寻找一种pythonic
的
方法来处理以下问题。现在,我需要处理这件事。一个
列
,让我们称之为“标签”,具有类似于['A', 'B', 'C',
浏览 1
提问于2013-09-19
得票数 37
回答已采纳
1
回答
ValueError:在将决策树
的
要素转换为整数后,无法将字符串转换为浮点型
、
) dtree.fit(car_df, y) 然而,我得到了一个错误:ValueError: could not convert string to float: 'buying'‘购买’是数据集中
的
第一个分类特征
浏览 222
提问于2021-03-29
得票数 0
1
回答
熊猫-只有特定
的
价值才能得到假人。
、
、
我有一个由10000行组成
的
Pandas
系列,其中填充了一个字母,从A到Z。但是,我想使用
Pandas
get_dummies
为A、B和C创建虚拟数据帧。我该怎么做?我不希望获得
列
中所有行
值
的
虚拟
值
,然后选择特定
的
列
,因为该
列
包含其他冗余数据,这些数据最终会导致内存错误。
浏览 2
提问于2015-11-03
得票数 8
回答已采纳
2
回答
如何让熊猫
get_dummies
发出N-1个变量来避免共线性?
、
、
、
pandas
.get_dummies为每个类别
值
发出一个伪变量。有没有什么自动
的
,简单
的
方法让它只创建N-1个虚拟变量?(随意去掉一个“基线”变量)? 需要避免数据集中
的
共线性。
浏览 0
提问于2015-07-19
得票数 21
回答已采纳
1
回答
机器学习中
的
分类属性预处理
、
、
、
、
numpy.unique() vs
Pandas
.get_dummies() numpy.unique()将数据转换为所有K类
的
数组,并将每个
值
的
索引作为新
列
返回,而
get_dummies
()只创建具有(0,1)
值
的
k
列
。将分类数据转换为数字
的
哪种方法最适合机器学习,以及为什么?
浏览 0
提问于2018-02-24
得票数 0
回答已采纳
1
回答
如何在一个热点表示中转换整个熊猫数据帧?
、
、
我希望所有的
列
都是热编码
的
,而不需要列出列,或者一个一个地应用热编码。我知道如何在一
列
之后
另一
列
做。 📷
浏览 0
提问于2019-03-12
得票数 0
回答已采纳
1
回答
使用
另一
列
的
值
创建虚拟变量
、
我知道熊猫有一个
get_dummies
()函数。我要做
的
不仅仅是给它放一个1/0
的
值
,还要为它使用
来自
另一
列
的
值
。b 35 b 5我想把它变成:1 1 0 03 0 3 05 0 5 0如果虚拟变量
的
值
来自
B
列
,则ID是标识
的</em
浏览 3
提问于2020-03-07
得票数 2
回答已采纳
1
回答
如何利用
Pandas
get_dummies
对预测数据进行预测?
在3个分类列上使用
Pandas
get_dummies
来获得一个热编码
的
Dataframe之后,我已经训练了一个Perceptron模型(并取得了一些成功)。现在我想预测一个新
的
观察结果,它不是热编码。 有任何方法记录
get_dummies
列
映射来重用它吗?
浏览 2
提问于2018-05-31
得票数 5
回答已采纳
1
回答
将分类数值数据编码到不同
的
列
、
、
我是数据科学和机器学习
的
新手。我有一个有三个
值
0,1,2
的
列
,我想用前缀predict_将这3个
值
编码成3个不同
的
列
。我尝试过
get_dummies
和label编码器,但它不起作用 import
pandas
as pdle = LabelE
浏览 13
提问于2019-09-17
得票数 0
回答已采纳
1
回答
Pandas
/Scikit -在创建特征向量时应用稀疏PCA
、
、
、
、
我计划使用
Pandas
get_dummies
()生成一个70000行150000
列
的
大型稀疏矩阵,但是我得到了一个MemoryError。我如何在这个稀疏矩阵上应用PCA来降维?
浏览 1
提问于2015-11-06
得票数 0
2
回答
在python
pandas
中将分类属性转换为多个属性
、
例如,性别属性将被转换为两个属性,"Genre=M“和"Genre=F",I需要两个
列
Male和Female,分配对应于该属性存在与否
的
二进制
值
浏览 0
提问于2019-02-23
得票数 1
1
回答
如何编码具有大量值
的
CATEGORICAL_COLUMNS?
、
、
、
我正在使用Tensorflow、python、
Pandas
创建一个类似于此
的
logistic回归模型。 我使用
的
不是MNist数据集,而是我自己
的
数据集。我使用
Pandas
创建数据格式,将nulls替换为填充it函数,然后使用from_tensor_slices将其转换为张量数据集。我有很多CATEGORICAL_COLUMNS,我正在使用
get_dummies
来做OneHotEncoding (和LabelEncoding一起)。但问题是,我
的
分类列有很大
的<
浏览 2
提问于2020-03-30
得票数 0
回答已采纳
2
回答
sklearn LabelEncoder和pd.get_dummies有什么不同?
、
、
我想知道sklearn LabelEncoder和
pandas
get_dummies
之间
的
区别。为什么人们会选择LabelEncoder而不是
get_dummies
。使用一种方法比使用
另一
种方法有什么优势?劣势?
浏览 0
提问于2016-07-17
得票数 17
回答已采纳
1
回答
需要帮助创建使用
另一
列
中
的
值
而不是'1‘
的
伪伪变量
、
、
、
该函数与
get_dummies
()在
pandas
中
的
工作方式几乎完全相同,只有一个主要区别:对于创建
的
所有伪变量,我需要A
列
中
的
值
,其中值应为1。<code>A1</code> 我正在处理具有大量类别的相当大
的
数据。我尝试过在数据集上使用
get_dummies
(),然后使用df.mask将所有的1都改为df.A,但是这非常慢(大约10分钟)。
浏览 11
提问于2019-03-27
得票数 0
回答已采纳
2
回答
str.split()返回
的
熊猫排序列表
、
、
、
、
给定类型为str
的
Pandas
,我希望对str.split返回
的
结果进行排序。我想到了像s.str.split(',').sort()这样
的
东西。然而,我在
Pandas
中找不到这类功能。还有其他想法吗?
另一
个想法是使用函数
get_dummies
,然后重新设置
列
,最后执行类似于join_dummies
的
操作。但是,我找不到这样一个函数join_dummies。
浏览 3
提问于2016-05-02
得票数 4
回答已采纳
1
回答
Pandas
get_dummies
()限制。不转换所有
列
、
、
我
的
数据中有6
列
。其中2种具有约3K
的
独特
值
。当我对整个dataframe或这两个
列
使用
get_dummies
()时,返回
的
是与3k值完全相同
的
列
。
get_dummies
无法伪造更大
的
列
。有些列确实有一个热编码,但大型
列
却没有。我相信这也是在这里讨论
的</em
浏览 4
提问于2016-09-14
得票数 4
回答已采纳
1
回答
OneHotEncoder更改名称
列
、
、
、
我使用OneHotencoder将分类
列
转换为数值数据,但算法更改了
列
的
名称。如何保存相同
的
名称
列
?(我使用python 3)>>> import
pandas
>>> ar = numpy.array([['yassine', 1], ['jack',7], ['ahmed',4]]) >>
浏览 1
提问于2019-04-10
得票数 0
点击加载更多
相关
资讯
使用pandas筛选出指定列值所对应的行
使用Pandas实现1-6列分别和第0列比大小得较小值
Pandas中如何删除空值所在的行
010 如何从列中找到需要的值
利用Python实现表格中指定列的值替换
热门
标签
更多标签
云服务器
ICP备案
对象存储
云点播
实时音视频
活动推荐
运营活动
广告
关闭
领券