腾讯云
开发者社区
文档
建议反馈
控制台
登录/注册
首页
学习
活动
专区
圈层
工具
MCP广场
文章/答案/技术大牛
搜索
搜索
关闭
发布
文章
问答
(9999+)
视频
沙龙
1
回答
将
预测
从
pd.get_dummies
转
换为
分类
、
、
、
satisfied4 satisfied 我把它转换成了one-hot编码- y=np.array(
pd.get_dummies
(train_df[y],drop_first=True)) 我有- satisfied1 03 0 然后我在上面运行了一个模型,用来生成对训练数据的
预测
y_predcross_val_predict(model, X, y,cv=KFold(n_splits=10)) y_
浏览 9
提问于2020-07-06
得票数 0
回答已采纳
1
回答
在可数化稀疏数据集中获取错误“无法
将
字符串转
换为
浮点”
、
我是包含文本数据、
分类
数据和数字数据的数据集。我已经对文本数据进行了计数,并将其添加到dataframe中。1500, min_samples_leaf=10) 我猜这是因为在建立模型的时候,
分类
数据没有被转换成数值数据如何动态地将它们转
换为
数字数据 Phone_Type Co_Name_FLag Product
浏览 1
提问于2017-11-01
得票数 0
1
回答
如何
将
预测
的十进制标签转
换为
文本标签
我有一个多标签和多类
分类
问题。我开发了一个
分类
器来
预测
所有5个标签的标签在0到1之间。但是,我希望
将
十进制标签转
换为
文本标签。例如,我有4个标签,如:("X“、"y”、"z“、"k")。实际标签包含二进制标签,而
预测
标签在(0到1)范围内。每个样本至少可以取一个标签或便条。例子如下:换句话说,我
浏览 5
提问于2022-05-22
得票数 0
回答已采纳
1
回答
如何
从
用户输入(只有一条记录)中创建用于
预测
的虚拟变量?
、
、
、
我正在尝试创建一个用于
预测
航空公司延误的web应用程序。我已经在我的电脑上离线训练了我的模型,现在正在尝试制作一个Flask应用程序,以便根据用户输入进行
预测
。为了简单起见,假设我的模型有3个
分类
变量: UNIQUE_CARRIER、起点和目的地。在训练时,我使用pandas创建了所有3个变量的虚拟变量: df = pd.concat([df,
pd.get_dummies
(df['UNIQUE_CARRIER'], drop_first=True我使用pickle保存了我的模型,现在正在尝试根据用户输
浏览 1
提问于2017-01-09
得票数 3
回答已采纳
1
回答
将
多列变量转
换为
伪变量
、
、
、
我正在考虑使用pandas
将
数据框中的多列
分类
变量转
换为
虚拟变量。下面的代码可以工作,但似乎太长了。我可以知道如何
将
这3行代码合并到一行代码中吗?谢谢 Y =
pd.get_dummies
(df.weight, prefix=['weight'])Z =
pd.get_dummies
(df.age, prefix=['ag
浏览 0
提问于2021-08-26
得票数 0
1
回答
Keras
将
类别
预测
与标签合并
、
、
在训练我的网络时,我遇到了一个多标签
分类
问题,在这个问题中,我
将
类标签转
换为
一个热编码。 在训练模型并生成
预测
- keras之后,只需输出值的数组,而不指定类标签。示例 y =
pd.get_dummies
(df_merged.eventId) 2CBC9h3uple1SXxEVy8W GiiFxmfrUwBNMGgFuoHo e06onPbpyCucAGXw01mM然后,我使用y =
pd.get_dummies
(df_merged.eventId)将其转
换为
浏览 27
提问于2019-06-24
得票数 1
1
回答
将不同的范畴变量转
换为
虚拟变量
、
、
我试图将回归(与XGBRegressor)应用于以下包含3个
分类
变量的数据集。X_datapriority -> values P1,P2,P3y_data要
预测
的标签是数值为了
将
所有3列转
换为
分类
,我使用:在转换完所有这些列之后,我
浏览 1
提问于2018-07-27
得票数 1
回答已采纳
1
回答
Python:在循环中高效地
将
多个
分类
特性转
换为
虚拟变量?
、
、
、
我有一个python,希望
将
分类
特性转
换为
虚拟变量。我在做一次活动。现在,我只知道如何手动处理,如下所示:embark =
pd.get_dummies
(train['Embarked'], drop_first=True) identity =
pd.get_dummies
(train['Identity'], drop_
浏览 6
提问于2022-11-19
得票数 0
回答已采纳
1
回答
带有chi2的SelectKBest提供了ValueError:无法
将
字符串转
换为
浮点型
、
、
我正在尝试使用SelectKBest和chi2 (SelectKBest(chi2,k=5))对
分类
变量应用特征选择。但获取字符串无法转
换为
浮点型的值时出错。我知道解决方法是使用
pd.get_dummies
()
将
分类
变量转
换为
虚拟变量。但为什么会这样呢?卡方检验是用于两个
分类
变量的二元分析,那么为什么它不接受
分类
变量?
浏览 21
提问于2019-08-12
得票数 2
7
回答
从
熊猫假人中重构一个
分类
变量
、
pd.get_dummies
允许
将
一个
分类
变量转
换为
虚拟变量。除了重构范畴变量很简单之外,是否有一种更好/快速的方法来实现它?
浏览 4
提问于2014-11-05
得票数 53
回答已采纳
5
回答
在训练和测试数据中保持相同的虚拟变量
、
、
、
、
我正在用两个独立的训练和测试集在python中建立一个
预测
模型。培训数据包含数字类型的
分类
变量,例如邮政编码,91521,23151,12355,.,以及字符串
分类
变量,例如,城市“芝加哥”,“纽约”,“洛杉矶”,. 为了训练数据,我首先使用“
pd.get_dummies
”来获取这些变量的虚拟变量,然后用转换后的训练数据对模型进行拟合。我对我的测试数据进行同样的转换,并使用经过训练的模型来
预测
结果。例如,“OneHotEncoder”
将
只编码所有数字类型的
分类
变量。
浏览 13
提问于2016-12-26
得票数 47
1
回答
如何处理线性回归中虚拟变量的共线性?
、
、
、
我已经创建了二进制虚拟变量来代替
分类
变量。我的理解是,对于Logistic回归,协线性应该最小化,那么我应该
从
输入矩阵中忽略其中一个变量吗?
浏览 1
提问于2018-02-09
得票数 0
回答已采纳
1
回答
如何在新的数据集上与熊猫进行热编码?
、
我有一个训练数据集,它具有
分类
特性,我在其中使用
pd.get_dummies
进行一个热编码。这将产生一个具有n个特性的数据集。然后,我用n个特征来训练这个数据集的
分类
模型。如果我现在获得一些具有相同
分类
特征的新数据,并再次执行一次热编码,则得到的特征数为m< n。编辑:我使用作为我的
分类
库。
浏览 0
提问于2018-03-08
得票数 1
回答已采纳
1
回答
根据Pandas DataFrame中单个列中的值创建多个列
、
、
但是,是否有一个镜头,因为我有多个列与几个代码,
将
创建多个列。
浏览 1
提问于2016-11-30
得票数 0
回答已采纳
1
回答
如何才能使一次热转换永久化
、
、
、
我的数据集中有16个
分类
变量,我想对其中一些进行0-1
转
换。一个热门代码: df_one_hot =
pd.get_dummies
(df,=
pd.get_dummies
= "guardian",prefix = "guardian") df_one_hot.head我
将
一个data.when应用于第一个数据我将其应用于第二个数据,我发现上面应用的不是permanent.how我可以对两个转换都进行永久操作吗?/data/student-mat.cs
浏览 34
提问于2020-04-16
得票数 1
回答已采纳
1
回答
当模型有虚拟列时,如何部署模型?
、
我有
分类
列,所以我将它们转
换为
虚拟列,并对整数列的其余部分使用minmax缩放。我把这些数据转换成模型。现在,当部署模型(,)时,如何部署。在从HTML中获取变量输入后,如何将它们转
换为
像模型一样的虚拟变量? df.append(int_features, ignore_index = True) df_new =
pd.get_d
浏览 6
提问于2022-01-23
得票数 -1
1
回答
python函数在dataframe上没有返回预期结果。
、
、
、
我编写了以下函数
将
变量转
换为
假人: dummies =
pd.get_dummies
(df[column])但是,当我将其应用于df中的
分类
变量时我得到了原始的df,没有一个
分类
变量被转
换为
虚拟变量
浏览 7
提问于2017-10-01
得票数 1
回答已采纳
1
回答
转换
分类
变量,以便在sklean中使用
、
、
、
、
我使用
pd.get_dummies
函数创建了一个稀疏矩阵。我的矩阵是700米行* 400列,我不认为它与其他人正在解决的许多问题相比有那么大。但切入火车,瓦尔,测试集可能要花费很长时间。(利用logistic回归和随机森林进行
预测
,支持稀疏矩阵)。)是否存在有效分割sparseDataFrame的方法,或者对于我所做的整个过程,无论如何都应该对其进行改进?举个例子,[u'a.exch', u'a.is_mobile',
浏览 5
提问于2015-11-12
得票数 1
回答已采纳
1
回答
将
熊猫数据转换成稀疏数组
、
将
混合列类型的熊猫数据帧--数值、序数和
分类
--转
换为
稀疏数组是机器学习中的一个核心问题。现在,如果我的熊猫的数据框架只包含数字数据,那么
将
数据框架转
换为
稀疏的csr矩阵:如果我的数据框架由顺序数据类型组成,我可以使用来处理它们lambda x: d[x.name].fit_transform(x))scipy.sparse.csr_matrix(df.values) 值数目较少的<em
浏览 4
提问于2020-05-18
得票数 2
1
回答
Pandas:如何对
分类
特征进行热编码
、
、
、
、
我有一个数据帧X,它有两个
分类
特征和41个数字特征。因此,X总共有43个特性。import pandas as pd F2 =
pd.get_dummies
(X.iloc[:, 1])
浏览 0
提问于2016-08-31
得票数 1
点击加载更多
热门
标签
更多标签
云服务器
ICP备案
对象存储
云点播
实时音视频
活动推荐
运营活动
广告
关闭
领券