腾讯云
开发者社区
文档
建议反馈
控制台
登录/注册
首页
学习
活动
专区
圈层
工具
MCP广场
文章/答案/技术大牛
搜索
搜索
关闭
发布
文章
问答
(9999+)
视频
沙龙
1
回答
在
get
dummies
in
pandas
中
获取
类别
值
的
频率
、
、
、
、
Aplha,Alpha,Aplha1.0.9 3 Aplha,Beta,Gama Version Cluster_Size Hardware_type1 1 0 1.0.9 3 Alpha,Beta,Gama
浏览 5
提问于2020-05-15
得票数 1
回答已采纳
1
回答
ValueError:
在
将决策树
的
要素转换为整数后,无法将字符串转换为浮点型
、
) dtree.fit(car_df, y) 然而,我得到了一个错误:ValueError: could not convert string to float: 'buying'‘购买’是数据集中
的
第一个分类特征
浏览 222
提问于2021-03-29
得票数 0
1
回答
如何根据变量
在
列中出现
的
次数对变量进行分组?
、
、
、
我正在尝试使用几个分类变量
在
Python
中
运行回归。所以我想把它们变成假人。然而,我在这里有一个问题。我正在处理
的
专栏有一些重复
的
类别
,如果我应用虚拟转换,我会得到5000个虚拟
的
。因此,我考虑对出现几次
的
类别
进行分组。我该怎么做呢?例如,
类别
1出现了2000次,
类别
2出现了3000次,但
类别
4、5和6各出现了30次,
类别
7出现了10次,
类别
8出现了5次。如何对<
浏览 6
提问于2020-05-06
得票数 0
回答已采纳
1
回答
OneHotEncoder更改名称列
、
、
、
我使用OneHotencoder将分类列转换为数值数据,但算法更改了列
的
名称。如何保存相同
的
名称列?(我使用python 3)>>> import
pandas
>>> ar = numpy.array([['yassine', 1], ['jack',7], ['ahmed',4]]) >>> df =
pandas
.
浏览 1
提问于2019-04-10
得票数 0
10
回答
当并非所有
类别
都存在时,虚拟变量
、
、
、
我想把它转换成几个虚拟变量,在这种情况下,我通常使用
get
_
dummies
。 所发生
的
事情是,
get
_
dummies
查看每个数据
中
可用
的
数据,以找出有多少
类别
,从而创建适当数量
的
虚拟变量。然而,
在
我现在正在研究
的
问题中,我实际上提前知道了可能
的
类别
是什么。但是,当单独查看每个数据时,并不一定会出现所有
类别
。我
的
问题是:是否有一种
浏览 30
提问于2016-05-25
得票数 60
回答已采纳
1
回答
使用编码
的
目标值
、
、
、
、
我有一个
pandas
dataframe,其中
的
一列是我
的
目标值,它是分类
的
。我将x_
dummies
作为我
的
依赖
值
dataframe,将y_
dummies
浏览 3
提问于2019-05-27
得票数 0
3
回答
如何使用numpy对数据进行单热编码?
、
、
、
、
如果我使用np.loadtxt或np.genfromtxt,我可以使用一个转换器为性别列
中
的
每个分类数据赋值。有没有一种方法可以
在
加载过程
中
创建一个热列?如果不是,我应该在哪里实现这一点?
浏览 0
提问于2017-11-15
得票数 1
1
回答
Dask
中
逗号分隔列
的
虚拟/单热编码
、
、
、
我
在
dask数据框中有一列,其中包含不同
类别
的逗号分隔列表。我正在寻找复制sklearn
的
MultiLabelBinarizer或
pandas
函数pd.
get
_
dummies
(',')
的
功能,就像这个线程描述
的
那样:Create
dummies
from columnwith multiple values in dask 有没有绝对没有办法做到这一点,就像那里
的
一个答案所说
的
那
浏览 20
提问于2021-11-16
得票数 1
回答已采纳
2
回答
如何使用DictVectorizer转换分类列
、
、
、
我有一些数据帧,它
的
一些列(C1、C2、C3)是分类(字符串)变量。DictVectorizer(dtype='str')但在那之后,我得到
的
错误如下
浏览 0
提问于2018-06-10
得票数 0
4
回答
可能
的
方法来做一个热编码
在
科学工具-学习?
、
、
为了取得更好
的
效果,对某些模型进行规范化是必要
的
。例如,将分类变量转换为虚拟/指示变量。事实上,熊猫有一个名为
get
_
dummies
的
功能。但是,此函数将根据数据返回结果。因此,如果我
在
训练数据上调用
get
_
dummies
,然后
在
测试数据上再次调用它,那么
在
两种情况下实现
的
列可能是不同
的
,因为测试数据
中
的
分类列可能只包含一个子集
浏览 9
提问于2015-12-09
得票数 6
回答已采纳
2
回答
如何让熊猫
get
_
dummies
发出N-1个变量来避免共线性?
、
、
、
pandas
.
get
_
dummies
为每个
类别
值
发出一个伪变量。有没有什么自动
的
,简单
的
方法让它只创建N-1个虚拟变量?(随意去掉一个“基线”变量)? 需要避免数据集中
的
共线性。
浏览 0
提问于2015-07-19
得票数 21
回答已采纳
2
回答
scikit代码
中
存在错误
、
、
我是机器学习
的
新手,正在尝试Kaggle
的
。我已经编写了附加
的
代码,使用决策树来对数据进行计算。有一个我无法删除
的
错误。#!/usr/bin/env python import
pandas
as pdfrom当我
在
Datacamp服务器上运行代码时不会出现这个错误,但是当我
在
本地运行它时就会出现这个错误。我不明白
浏览 1
提问于2016-11-22
得票数 0
1
回答
pandas
.
get
_
dummies
转换float64
、
在
使用tpot之前,我使用
pandas
.
get
_
dummies
来转换一些分类变量。我
的
问题是,我有一个连续变量,例如,时间,尽管它是一个连续变量,但它正在被转换为
类别
。我测试了以下内容:所有的
类别
都说是假
的
输出为<class '
浏览 32
提问于2018-06-09
得票数 0
1
回答
解析封闭列表
中
的
CSV列
值
、
我正在尝试使用
Pandas
加载CSV:https://www.kaggle.com/miroslavsabo/young-people-survey并训练一个TensorFlow模型。此csv
中
的
一些
值
来自封闭列表,例如"Smoking“具有可能
的
值
”从未吸烟“、”尝试吸烟“、”当前吸烟者“。我想要做
的
是自动为每个
值
创建一个二进制列,而不是有1列这3个可能
的
值
,我将有
浏览 16
提问于2021-07-05
得票数 0
回答已采纳
1
回答
如何使用
get
_
dummies
从现有列创建新列
、
、
、
C C B D0 & 1 = 11 & 1 = 1 我也试过了: df1 = df.column1.str.
get
_
dummies
(sep=
浏览 21
提问于2019-01-31
得票数 1
回答已采纳
1
回答
需要帮助创建使用另一列
中
的
值
而不是'1‘
的
伪伪变量
、
、
、
该函数与
get
_
dummies
()
在
pandas
中
的
工作方式几乎完全相同,只有一个主要区别:对于创建
的
所有伪变量,我需要A列
中
的
值
,其中值应为1。<code>A1</code> 我正在处理具有大量
类别
的相当大
的
数据。我尝试过在数据集上使用
get
_
dummies
(),然后使用df.mask将所有的1都改为df.A,
浏览 11
提问于2019-03-27
得票数 0
回答已采纳
1
回答
Pandas
:
get
_
dummies
vs分类
、
、
、
我一直
在
使用分类函数来用数值替换
类别
值
。data[column] = pd.Categorical.from_array(data[column]).codes 我最近遇到了
pandas
.
get
_
dummies
函数。这些是可互换
的
吗?
浏览 2
提问于2015-03-24
得票数 7
1
回答
在
Pandas
中用代码替换分类列
的
最简单方法是什么?
、
我有一个.dta格式
的
数据表,我使用
Pandas
将其读入python。数据主要是分类数据类型,我希望用可以用于机器学习
的
数值数据替换列,例如布尔
值
(1/0)或代码。问题是,我不能直接替换数据,因为它不允许我更改
类别
,除非我添加它们。我尝试过使用pd.
get
_
dummies
(),但它一直返回一个错误:print(pd.
get
_
dummies
(feature
浏览 3
提问于2017-06-14
得票数 0
2
回答
为
Pandas
Dataframe
中
的
两列创建稀疏矩阵
、
、
、
、
,使得如果表Class
中
的
学生和教师之间存在对应关系,则存在布尔
值
1。,我有700K
的
学生
值
和100K
的
教师
值
。因此,我尝试为学生和教师分配唯一
的
值
,然后将这些
值
附加到行和列,并尝试创建坐标格式
的
稀疏矩阵。代码:dictstudent = {}for i in r
浏览 0
提问于2016-10-09
得票数 4
1
回答
如何根据列
中
的
值
删除重复行
、
、
、
因此,我
的
问题是从数据
中
删除由一列
中
的
许多不同
值
造成
的
重复。 如您所见,我
在
列名称中有重复
的
值
,Id取决于
类别
。我们
的
目标是删除这些重复,同时保留有关
类别
的信息。 我尝试过使用熊猫库
的
get
_
dummies
方法,但是我有一些问题。
dummi
浏览 10
提问于2022-01-27
得票数 0
回答已采纳
点击加载更多
热门
标签
更多标签
云服务器
ICP备案
对象存储
云点播
实时音视频
活动推荐
运营活动
广告
关闭
领券