腾讯云
开发者社区
文档
建议反馈
控制台
登录/注册
首页
学习
活动
专区
圈层
工具
文章/答案/技术大牛
搜索
搜索
关闭
发布
精选内容/技术社群/优惠产品,
尽在小程序
立即前往
文章
问答
(9999+)
视频
沙龙
1
回答
如
何在
pandas
中
对
列
进行
分类
并
添加
新
列
、
我有一个数据框架,其中的type
列
显示了一个东西的类型 id type total1 sandal 11 tshirt 21 345 2 基于type
列
,我想
对
类型
进行
分类
并
创建一个名为category的
新
列
。
浏览 15
提问于2021-08-26
得票数 1
回答已采纳
1
回答
如
何在
Scikit学习
中
重用LabelBinarizer
进行
输入预测
、
、
、
我用Scikit学习训练了一个
分类
器。我正在加载输入,以训练我的
分类
器从CSV。我的一些专栏的价值。“城镇”是典型的(例如可以是“纽约”、“巴黎”、“斯德哥尔摩”、.)。为了使用这些规范
列
,我正在使用Scikit-Learn的LabelBinarizer
进行
一次热编码。,而我希望
对
这些数据
进行
预测。特别是,如果
新
的数据包含一个已见过的城镇(
如
纽约),则需要在培训数据
中
与同一城镇在同一地点
进行
编码。 如
何在</
浏览 3
提问于2017-10-09
得票数 4
回答已采纳
1
回答
数据帧
中
多
列
的LabelBinarizer
、
、
、
我有一个csv文件,其中有25
列
--有些是数字的,有些是
分类
的,有些是演员、导演的名字。我想
对
这些数据使用回归模型。为此,我必须使用LabelBinarizer包将
分类
列
字符串类型转换为数值。如
何在
具有多个
分类
数据的数据上使用LabelBinarize? 本质上,我希望
对
标签
进行
二进制化,并将它们
添加
到dataframe
中
。在下面的代码
中
,我检索了想要二进制化的
列</
浏览 0
提问于2016-11-07
得票数 6
2
回答
如
何在
Pandas
DataFrame的多
列
中
进行
一次热编码,以便以后与Scikit一起使用-学习
、
、
品牌”和“城镇”两栏做一次热编码,以训练一个
分类
器(比如与Scikit学习)
并
预测年份。一旦对
分类
器
进行
了训练,我将希望
对
新
输入的数据
进行
预测(而不是在培训中使用),在那里我需要重新应用相同的热编码。'Reference': [6, 7], 'Town': ['Stockholm'
浏览 4
提问于2017-10-10
得票数 3
1
回答
对
同一数据帧
中
的
分类
和连续要素使用reindex和fill_value
、
、
我在拟合和
分类
时使用
pandas
.get_dummies对
分类
特征
进行
编码,我刚刚注意到Imputer()在对
新
样本
进行
分类
时将平均值放在dataframe.reindex()
中
添加
的"off“
分类
开关中有人知道
pandas
DataFrame.reindex函数是否会将所有NaN设置为fill_value
中
的值,还是只设置它
添加
的
新
<
浏览 9
提问于2017-02-11
得票数 2
回答已采纳
1
回答
如何处理数据集中的大量类别?
、
、
我有一个“书籍”的数据集,最初包含8
列
,其中3
列
包含可以
分类
的文本值。3
列
包含“语言代码”、“作者姓名”和“书名”。由于LinearRegression不接受文本作为输入,所以我决定使用“
pandas
_getdummies(.)”
对
这3
列
进行
分类
但是在对其
进行
分类
之后,
列
数从8
列
超过了20072,这太高了。把它
分类
似乎不对。 剩下的两
列<
浏览 0
提问于2019-07-15
得票数 1
回答已采纳
1
回答
在
pandas
中
,如何根据DatafFame
中
列
中
的值
进行
分类
和
分类
、
Example Image (click to view) 在给定的图像
中
,我想
添加
一个
新
列
“访问者类型”,
并
根据
列
"vcount“
中
的值
对
其
进行
分类
。例如,在“vcount”
中
为1的值被
分类
为单一,而在v计数中大于1的值被
分类
为多个。如何做到这一点?
浏览 17
提问于2020-06-24
得票数 0
1
回答
如何使用预定义的类间隔
对
列
进行
分类
,并在R
中
对
新
列
进行
排名?
我在R中有一个
列
,我想根据间隔
对
其
进行
分类
,例如(0-10,10-20),
并
对
分类
后的
列
进行
排名。我如
何在
R
中
做到这一点?
浏览 10
提问于2021-10-22
得票数 0
2
回答
如
何在
保持相同转换的情况下,将字符串变量转换为两个不同数据集中的
分类
变量?
、
、
我正在构建一个模型,我在
Pandas
中有两个数据帧。一个是训练数据,另一个是测试数据。其中一个变量是国家。我在考虑使用OrdinalEncoder()将country
列
转换为
分类
列
。例如:“美国”在
新
列
中将是1,“巴西”将是2,依此类推。但是,我希望
对
这两个数据帧
进行
相同的转换。如果训练数据
中
的"USA“作为
分类
列
变为1,我希望测试数据
中
的"USA”也变为1。
浏览 23
提问于2019-12-17
得票数 0
1
回答
熊猫到Excel (合并的标题
列
)
、
、
我希望将df转换为excel工作表,但也希望
添加
标题
列
来
对
所有
列
进行
分类
。 import
pandas
as pddf = pd.DataFrame({'Data': [10, 20, 30, 20, 15, 30, 45]}) # Create a
Pandas
Excel writer usi
浏览 0
提问于2018-12-10
得票数 9
回答已采纳
2
回答
根据其他
列
对
列
进行
分类
并
追加到
新
列
、
、
我需要根据prob_y1,prob_y2和prob_y3的值
对
y1、y2和y3
进行
分类
。我有一个附属的职能来
分类
那些。binA关键是,我要做的是根据prob_y1、prob_y2和y3的值
对
这些概率值
进行
分类
新
的
列
可以在后面附加,我只是为了说明的目的而
添加
。 解决方案由user3483203提
浏览 0
提问于2018-10-25
得票数 0
回答已采纳
2
回答
对
熊猫数据
中
的元素
进行
排序
、
、
、
你好,我正在使用一个
pandas
.Dataframe,如下所示:Carrot 50Raddish我已经成功地根据字段dataframe
对
Quality
进行
了排序,如下所示:Carrot 50Raddish43Potato 34现在,我要做的是,<em
浏览 0
提问于2018-07-10
得票数 1
回答已采纳
1
回答
matplotlib
pandas
plot
中
的附加“类似轴”图
、
、
、
、
我将一些数据存储在
pandas
数据帧
中
。另外,我使用matplotlib来创建显示数据的图。请看这张漂亮的图片:红线显示了一些对应于x轴点的值。它只是数据帧
中
的一
列
。我想
添加
额外的注释,
对
x轴点
进行
分类
。这些类别作为附加
列
存储在原始数据帧
中
。它不必看起来与图片中的完全一样。 目标是以某种方式显示x轴范围
分类
。
添加
这样一个注解的聪明而优雅的方式是什么?
浏览 7
提问于2017-07-18
得票数 4
回答已采纳
3
回答
pandas
中
列
的每个元素的正方形
、
如
何在
pandas
中
对
DataFrame
列
/序列
中
的每个元素
进行
平方(
并
创建另一个
列
来保存结果)?
浏览 0
提问于2013-12-18
得票数 46
回答已采纳
2
回答
TypeError:难以理解的类型:“列表”当我试图从熊猫栏
中
做一个枢轴时
、
、
我的Python代码从Excel
中
获取银行语句,
并
创建一个基于描述
对
每个事务
进行
分类
的dataframe。示例代码:import openpyxlimport numpy as np 'Amount': [
浏览 5
提问于2022-11-12
得票数 1
回答已采纳
2
回答
如何使用Excel文件
中
给出的字典方案在
Pandas
DataFrame
中
编码
分类
值?
、
、
我有一个带有键属性和其他
分类
属性的
Pandas
DataFrame。如何使用此excel文件
中
的“字典”对
分类
属性
进行
编码?我希望
对
每个
分类
变量
进行
编码,例如,通过在excel文件的“variable”
列
中
查找ACGB03A,并从“value”
列
中
获取相应的整数值,从而从DataFrame
中
对
它
进行
编码。我需要将它从DataFr
浏览 11
提问于2022-02-10
得票数 0
回答已采纳
1
回答
使用基于另一
列
的值范围的
分类
创建
新
的pd
列
、
、
、
我想在
pandas
中
基于另一个
列
值的范围创建一个
新
列
。我已经尝试了一些东西,但还没有成功。假设我有一个“gdp”
列
,我想创建一个
新
的
列
,
并
根据“gdp”的某些范围
进行
分类
。
浏览 3
提问于2020-05-05
得票数 0
1
回答
Microsoft Outlook2010-用于指示是向我发送电子邮件还是向我发送CCed的自定义字段
、
有人知道如
何在
Microsoft Outlook 2010
中
创建自定义字段(
列
)吗?我收到很多电子邮件,
并
希望在我的收件箱文件夹
中
定义一个
新
列
,在其中我可以以某种方式
对
电子邮件
进行
分类
,
并
显示是/否标志来指示我的电子邮件地址是在收件人:列表
中
还是抄送:列表
中
。
浏览 4
提问于2012-11-15
得票数 0
1
回答
表
中
数据
列
的多标签
分类
、
、
、
、
我正在寻求关于涉及数据
列
标记的机器学习问题的指导。目前,我有一个系统,用户可以在这个系统
中
向表
中
的
列
添加
多个标记。但是,我想通过使用多标签
分类
来自动标记
新
列
。通过
对
列
值
进行
列分析,我从每个
列
中提取了21个特征。得到的特征将包括统计值,
如
标准差、最大值、最小值、峰度等。我是否正确地使用这些特征作为多标签
分类
模型的输入?现在,我的重点是
列</
浏览 0
提问于2018-02-10
得票数 3
1
回答
在对枚举/类别类型
列
求和时,h2o dataframe GroupBy sum函数的作用是什么?
想知道当
列
类型是
分类
的(特别是h2o enum类型)时,在h2o dataframe GroupBy对象
中
求和
列
时会发生什么。------------------3 20 <s
浏览 26
提问于2019-04-02
得票数 0
回答已采纳
点击加载更多
扫码
添加站长 进交流群
领取专属
10元无门槛券
手把手带您无忧上云
相关
资讯
在也不用996!如何用Python轻松取代Excel
肝了3天,整理了90个Pandas案例
Pandas与SQL的数据操作语句对照
你可能不知道的10个Python Pandas的技巧和特性
开启机器学习的第一课:用Pandas进行数据分析
热门
标签
更多标签
云服务器
ICP备案
对象存储
云直播
腾讯会议
活动推荐
运营活动
广告
关闭
领券