将预测从pd.get_dummies转换为分类

文章/答案/技术大牛

发布

1回答

、、、

satisfied4 satisfied 我把它转换成了one-hot编码- y=np.array(pd.get_dummies(train_df[y],drop_first=True)) 我有- satisfied1 03 0 然后我在上面运行了一个模型，用来生成对训练数据的预测 y_predcross_val_predict(model, X, y,cv=KFold(n_splits=10)) y_

浏览 9提问于2020-07-06得票数 0

回答已采纳

1回答

在可数化稀疏数据集中获取错误“无法将字符串转换为浮点”

、

我是包含文本数据、分类数据和数字数据的数据集。我已经对文本数据进行了计数，并将其添加到dataframe中。1500, min_samples_leaf=10) 我猜这是因为在建立模型的时候，分类数据没有被转换成数值数据如何动态地将它们转换为数字数据 Phone_Type Co_Name_FLag Product

浏览 1提问于2017-11-01得票数 0

1回答

如何将预测的十进制标签转换为文本标签

我有一个多标签和多类分类问题。我开发了一个分类器来预测所有5个标签的标签在0到1之间。但是，我希望将十进制标签转换为文本标签。例如，我有4个标签，如：("X“、"y”、"z“、"k")。实际标签包含二进制标签，而预测标签在(0到1)范围内。每个样本至少可以取一个标签或便条。例子如下：换句话说，我

浏览 5提问于2022-05-22得票数 0

回答已采纳

1回答

如何从用户输入(只有一条记录)中创建用于预测的虚拟变量？

、、、

我正在尝试创建一个用于预测航空公司延误的web应用程序。我已经在我的电脑上离线训练了我的模型，现在正在尝试制作一个Flask应用程序，以便根据用户输入进行预测。为了简单起见，假设我的模型有3个分类变量: UNIQUE_CARRIER、起点和目的地。在训练时，我使用pandas创建了所有3个变量的虚拟变量： df = pd.concat([df, pd.get_dummies(df['UNIQUE_CARRIER'], drop_first=True我使用pickle保存了我的模型，现在正在尝试根据用户输

浏览 1提问于2017-01-09得票数 3

回答已采纳

1回答

将多列变量转换为伪变量

、、、

我正在考虑使用pandas将数据框中的多列分类变量转换为虚拟变量。下面的代码可以工作，但似乎太长了。我可以知道如何将这3行代码合并到一行代码中吗？谢谢 Y = pd.get_dummies(df.weight, prefix=['weight'])Z = pd.get_dummies(df.age, prefix=['ag

浏览 0提问于2021-08-26得票数 0

1回答

Keras将类别预测与标签合并

、、

在训练我的网络时，我遇到了一个多标签分类问题，在这个问题中，我将类标签转换为一个热编码。在训练模型并生成预测- keras之后，只需输出值的数组，而不指定类标签。示例 y = pd.get_dummies(df_merged.eventId) 2CBC9h3uple1SXxEVy8W GiiFxmfrUwBNMGgFuoHo e06onPbpyCucAGXw01mM然后，我使用y = pd.get_dummies(df_merged.eventId)将其转换为

浏览 27提问于2019-06-24得票数 1

1回答

将不同的范畴变量转换为虚拟变量

、、

我试图将回归(与XGBRegressor)应用于以下包含3个分类变量的数据集。X_datapriority -> values P1,P2,P3y_data要预测的标签是数值为了将所有3列转换为分类，我使用：在转换完所有这些列之后，我

浏览 1提问于2018-07-27得票数 1

回答已采纳

1回答

Python:在循环中高效地将多个分类特性转换为虚拟变量？

、、、

我有一个python，希望将分类特性转换为虚拟变量。我在做一次活动。现在，我只知道如何手动处理，如下所示：embark = pd.get_dummies(train['Embarked'], drop_first=True) identity = pd.get_dummies(train['Identity'], drop_

浏览 6提问于2022-11-19得票数 0

回答已采纳

1回答

带有chi2的SelectKBest提供了ValueError:无法将字符串转换为浮点型

、、

我正在尝试使用SelectKBest和chi2 (SelectKBest(chi2，k=5))对分类变量应用特征选择。但获取字符串无法转换为浮点型的值时出错。我知道解决方法是使用pd.get_dummies()将分类变量转换为虚拟变量。但为什么会这样呢？卡方检验是用于两个分类变量的二元分析，那么为什么它不接受分类变量？

浏览 21提问于2019-08-12得票数 2

7回答

从熊猫假人中重构一个分类变量

、

pd.get_dummies允许将一个分类变量转换为虚拟变量。除了重构范畴变量很简单之外，是否有一种更好/快速的方法来实现它？

浏览 4提问于2014-11-05得票数 53

回答已采纳

5回答

在训练和测试数据中保持相同的虚拟变量

、、、、

我正在用两个独立的训练和测试集在python中建立一个预测模型。培训数据包含数字类型的分类变量，例如邮政编码，91521,23151,12355，.，以及字符串分类变量，例如，城市“芝加哥”，“纽约”，“洛杉矶”，. 为了训练数据，我首先使用“pd.get_dummies”来获取这些变量的虚拟变量，然后用转换后的训练数据对模型进行拟合。我对我的测试数据进行同样的转换，并使用经过训练的模型来预测结果。例如，“OneHotEncoder”将只编码所有数字类型的分类变量。&#

浏览 13提问于2016-12-26得票数 47

1回答

如何处理线性回归中虚拟变量的共线性？

、、、

我已经创建了二进制虚拟变量来代替分类变量。我的理解是，对于Logistic回归，协线性应该最小化，那么我应该从输入矩阵中忽略其中一个变量吗？

浏览 1提问于2018-02-09得票数 0

回答已采纳

1回答

如何在新的数据集上与熊猫进行热编码？

、

我有一个训练数据集，它具有分类特性，我在其中使用pd.get_dummies进行一个热编码。这将产生一个具有n个特性的数据集。然后，我用n个特征来训练这个数据集的分类模型。如果我现在获得一些具有相同分类特征的新数据，并再次执行一次热编码，则得到的特征数为m< n。编辑:我使用作为我的分类库。

浏览 0提问于2018-03-08得票数 1

回答已采纳

1回答

根据Pandas DataFrame中单个列中的值创建多个列

、、

但是，是否有一个镜头，因为我有多个列与几个代码，将创建多个列。

浏览 1提问于2016-11-30得票数 0

回答已采纳

1回答

如何才能使一次热转换永久化

、、、

我的数据集中有16个分类变量，我想对其中一些进行0-1转换。一个热门代码: df_one_hot =pd.get_dummies(df，=pd.get_dummies= "guardian"，prefix = "guardian") df_one_hot.head我将一个data.when应用于第一个数据我将其应用于第二个数据，我发现上面应用的不是permanent.how我可以对两个转换都进行永久操作吗？/data/student-mat.cs

浏览 34提问于2020-04-16得票数 1

回答已采纳

1回答

当模型有虚拟列时，如何部署模型？

、

我有分类列，所以我将它们转换为虚拟列，并对整数列的其余部分使用minmax缩放。我把这些数据转换成模型。现在，当部署模型(，)时，如何部署。在从HTML中获取变量输入后，如何将它们转换为像模型一样的虚拟变量？ df.append(int_features, ignore_index = True) df_new = pd.get_d

浏览 6提问于2022-01-23得票数 -1

1回答

python函数在dataframe上没有返回预期结果。

、、、

我编写了以下函数将变量转换为假人： dummies = pd.get_dummies(df[column])但是，当我将其应用于df中的分类变量时我得到了原始的df，没有一个分类变量被转换为虚拟变量

浏览 7提问于2017-10-01得票数 1

回答已采纳

1回答

转换分类变量，以便在sklean中使用

、、、、

我使用pd.get_dummies函数创建了一个稀疏矩阵。我的矩阵是700米行* 400列，我不认为它与其他人正在解决的许多问题相比有那么大。但切入火车，瓦尔，测试集可能要花费很长时间。(利用logistic回归和随机森林进行预测，支持稀疏矩阵)。)是否存在有效分割sparseDataFrame的方法，或者对于我所做的整个过程，无论如何都应该对其进行改进？举个例子，[u'a.exch', u'a.is_mobile',

浏览 5提问于2015-11-12得票数 1

回答已采纳

1回答

将熊猫数据转换成稀疏数组

、

将混合列类型的熊猫数据帧--数值、序数和分类--转换为稀疏数组是机器学习中的一个核心问题。现在，如果我的熊猫的数据框架只包含数字数据，那么将数据框架转换为稀疏的csr矩阵：如果我的数据框架由顺序数据类型组成，我可以使用来处理它们lambda x: d[x.name].fit_transform(x))scipy.sparse.csr_matrix(df.values) 值数目较少的<em

浏览 4提问于2020-05-18得票数 2

1回答

Pandas:如何对分类特征进行热编码

、、、、

我有一个数据帧X，它有两个分类特征和41个数字特征。因此，X总共有43个特性。import pandas as pd F2 = pd.get_dummies(X.iloc[:, 1])

浏览 0提问于2016-08-31得票数 1

点击加载更多