腾讯云
开发者社区
文档
建议反馈
控制台
首页
学习
活动
专区
工具
TVP
最新优惠活动
文章/答案/技术大牛
搜索
搜索
关闭
发布
登录/注册
精选内容/技术社群/优惠产品,
尽在小程序
立即前往
文章
问答
(9999+)
视频
沙龙
1
回答
使用
分类
数据
的
常量
输入
缺失
值
python-3.x
、
pandas
、
scikit-learn
我有一个
数据
帧,其中有许多
分类
列和数值列缺少
值
。
分类
的
一个例子是一个
值
为1&2
的
性别列,其中1代表男性,2代表女性,但有一些
缺失
值
。 ? 我想用一个
常量
值替换
分类
特征中
的
所有NaN,例如“失踪”现在,我可以将
值
映射到字符串,并
使用
下面的管道进行预处理。constant_imputer), ("onehot&
浏览 15
提问于2020-10-12
得票数 0
1
回答
不同归责方法
的
选择
python
、
machine-learning
、
regression
、
decision-tree
、
imputation
我试着评估两种
数据
估算方法。我
的
目标标签是LotFrontage。首先,我用OneHotEncoding编码所有范畴特性,然后
使用
相关矩阵,过滤-0.3或blow 0.3之上
的
任何内容。LotFrontage
的
平均值(
使用
此方法,因为我看到异常值比率很低) # imputate LotFrontage因为如果我在拟合模型之前填充这些
值</em
浏览 1
提问于2019-08-10
得票数 1
2
回答
在apache spark ML库中处理SVM中
的
缺失
值
machine-learning
、
svm
、
apache-spark-mllib
我有一个
分类
任务。我想用apache spark ml lib SVM算法进行
分类
。我有n维
的
输入
数据
。在特征向量中,可能缺少一些维度。 如何处理
缺失
值
?我认为假设
缺失
值
为零或其他
值
是错误
的
。
浏览 3
提问于2015-10-02
得票数 1
1
回答
如何在R中
使用
missForest包来处理测试
数据
?
r
我们基本上可以
使用
missForest包来
输入
R中
的
缺失
值
(对于
分类
和数字).But,这种方法需要一个完整
的
响应变量来训练森林。那么,如何
使用
这个missForest包估算测试
数据
集中
的
缺失
值
,因为我们在测试
数据
集中没有任何response变量?
浏览 0
提问于2015-11-18
得票数 1
1
回答
半监督滑雪板学习
python
、
machine-learning
、
svm
、
outliers
我有一个大型
的
多维无标签汽车
数据
集(价格,里程,马力,.)我想找出离群点。我决定
使用
sklearn来构建决策边界,并且我
的
方法有两个主要问题: 现在,我想添加一个手动调节异
浏览 3
提问于2015-03-27
得票数 1
1
回答
在
输入
向量中传递一个NAN进行预测。
python
、
numpy
、
machine-learning
、
scikit-learn
我有一个
分类
器,它
使用
给定
的
一组
输入
训练
数据
向量进行训练。培训
数据
中存在
缺失
值
,这些
值
被填充为numpy.Nan
值
,并
使用
计算机填充
缺失
的
值
。但是,在
输入
向量用于预测
的
情况下,如何在缺少
值
的
输入
中传递?我应该把这个
值
作为nan传递吗?在这件
浏览 3
提问于2016-11-18
得票数 0
回答已采纳
1
回答
平均模式计算与填充与填充计算
的
差异
pandas
、
dataframe
、
weka
、
missing-data
、
categorical-data
我
的
数据
集有5%
的
丢失
值
。它是一个
分类
数据
集,只有两个属性是数字
的
。如果用均值和模式法计算
缺失
值
,则精度为0.781,回忆0.500和AUROC 0.756;若用填充和填充法计算
缺失
值
,则精度为0。我不明白为什么我
的
补料效果很好?这意味着什么? 对于类别
缺失
值
输入
,还有什么方法可用?
浏览 2
提问于2022-06-28
得票数 -1
1
回答
使用
C4.5技术时对
缺失
值
的
处理
machine-learning
、
classification
、
decision-tree
、
c4.5
我正在尝试
使用
一些
分类
技术来构建一个
分类
器“模型”。从C4.5技术开始,面临
缺失
值
的
问题,因此:“我应该留下来吗?”在
缺失
的
属性中?
浏览 4
提问于2015-04-25
得票数 0
2
回答
我应该估算目标值吗?
machine-learning
、
regression
、
data-cleaning
、
preprocessing
、
data-imputation
我是
数据
科学
的
新手,目前我正在玩一些。
数据
的
探索和准备真的很烦人。即使我用熊猫。但现在我面临
的
问题是,依赖变量$y$也包含
缺失
的
值
。我是应该删除这些行,还
浏览 0
提问于2018-01-12
得票数 3
回答已采纳
3
回答
用0填充
缺失
值
或任何常数项(如-999 )之间有什么区别?
machine-learning
大多数教科书说,要填充
缺失
的
值
,
使用
的
是均值/中值(数字)和最频繁
的
(
分类
),但我
使用
的
是一个
数据
集,它有太多
的
缺失
值
,而且我不能删除这些列,因为它们很重要。471874(590540, 434) 您可以看到,DeviceType和DeviceInfo有太多缺少
的</
浏览 0
提问于2020-03-17
得票数 0
回答已采纳
4
回答
处理类别
缺失
值
ML
machine-learning
、
python
、
classification
、
missing-data
、
data-imputation
我已经研究过关于处理
分类
数据
中
缺失
值
的
这。 Dataset关于6 categorical columns和missing values。这将是一个二进制
分类
问题。我看到了不同
的
方法,其中一种是just leave the missing values in category column as such,另一种是
使用
from sklearn.preprocessing如果imputing是更好
的
选项,那么在应用像LR,Decision
浏览 0
提问于2020-05-18
得票数 2
1
回答
OneHotEncoding在
缺失
值
分类
数据
中
的
应用
python-3.x
、
pandas
、
categorical-data
、
one-hot-encoding
、
imputation
我想要OneHotEncode一个缺少values.When
的
pd.DataFrame --我尝试
使用
OneHotEncode,它会引发一个关于缺少
值
的
错误。ValueError:
输入
包含NaN 当我尝试
使用
SimpleImputer修复
缺失
的
值
时,它会引发一个有关
分类
数据
的
错误。ValueError:无法对非数字
数据
使用
均值策略:无法将字符串
浏览 3
提问于2020-08-05
得票数 0
回答已采纳
1
回答
一种适用于大
分类
数据
集
的
无监督学习方法
machine-learning
、
unsupervised-learning
、
categorical-data
、
anomaly-detection
我想用一种无监督
的
学习方法检测银行
数据
集中
的
异常。然而,在银行
数据
集中,除了时间和数量之外,所有列都是
分类
数据
,其中大约一半
的
列有超过90 %
的
缺失
值
。 该
数据
集试图通过无监督学习来检测异常。我目前正在
使用
自动编码器来访问它,但我想知道这是否有效。另外,由于其目的是在
数据
实时
输入
时检测
数据
是否异常,因此,诸如dbscan之类<e
浏览 0
提问于2021-05-17
得票数 1
1
回答
Sklearn:可以在NaN中为未知类别指定null或OneHotEncoder
值
吗?
python
、
machine-learning
、
scikit-learn
、
data-science
、
one-hot-encoding
我正在处理一个混合
的
分类
变量和数字变量
的
数据
集。有很多
缺失
的
数据
,因此,我希望通过
分类
器进行一些估算。我目前正在
使用
来自impyute.imputation.cs
的
impyute.imputation.cs。fast_knn是一个易于
使用
的
函数,它用kNN模型填充
缺失
的
值
。我希望将一个numpy数组传递到fast_knn中,该数
浏览 2
提问于2021-03-30
得票数 1
回答已采纳
1
回答
使用
错误
的
熊猫缺少
的
值
=‘胁迫’
python
、
pandas
我希望
使用
以下命令计算以下
数据
的
缺失
值
。它未能检测到
缺失
的
值
。然后,我
使用
了以下命令df[cols] = df[cols].apply(pd.to_numeric, errors='coerce')print(missing) 它起了作用,但它也将“BinaryObject”
浏览 0
提问于2020-05-07
得票数 2
回答已采纳
1
回答
Weka:测试文件
的
ReplaceMissingValues
weka
当
使用
Weka
的
ReplaceMissingValues只
输入
测试arff
数据
集而不是训练
数据
集
的
缺失
值
时,我有点担心。只是将每个
缺失
的
值
替换为相应属性
的
平均值。这意味着需要计算每个属性
的
平均值。虽然计算这个平均值对于训练文件来说是非常好
的
,但是对于测试文件却是不行
的
。 这是因为在典型
的
测试场景中,我们不应该假
浏览 3
提问于2013-02-10
得票数 4
1
回答
随机森林回归中
缺失
分类
特征
值
处理指南
scikit-learn
、
random-forest
在
使用
随机森林回归器(或任何集成学习者)时,处理丢失
的
分类
特征
值
的
一般准则是什么?我知道scikit学习有归并函数(如mean...strategy或邻近)来推断
缺失
的
值
(数字)。但是,一个人如何处理
缺失
的
分类
价值:比如工业(石油、计算机、汽车、None)、专业(学士、硕士、博士、None)。 如有任何建议,将不胜感激。
浏览 2
提问于2016-05-13
得票数 1
3
回答
如何实现KNN对滑雪板管道中
的
分类
特征进行归属化
scikit-learn
我想
使用
KNN在一个滑雪管道中
的
分类
特征(多个
分类
功能
缺失
)。 是否有任何现有的方法允许
使用
KNN (或任何其他回归体)将
缺失
的
值
(在本例中是绝对
的
)归责于sklearn管道
浏览 1
提问于2019-09-03
得票数 1
回答已采纳
3
回答
估算
数据
的
最佳方法是什么?
autoencoder
、
data-imputation
、
theory
除了填补一个特性
的
平均值之外,还有哪些其他方法可以很好地工作呢?我正试图决定是否
使用
去噪-自动编码器,还是仅仅归咎于平均值或任何其他
的
方法,可以表现得足够好,这是快速实现。去噪-自动编码器在这里看起来很有吸引力,因为你不需要做任何明确
的
假设。
浏览 0
提问于2016-09-13
得票数 1
3
回答
Scikit学习丢失
的
数据
-
分类
值
predictive-modeling
、
scikit-learn
、
categorical-data
、
multiclass-classification
、
missing-data
我有一个包含
分类
特征
的
数据
集,它有4个标签和4个特征。(这是一个元
分类
器,因此基
分类
器
的
输出作为这个
分类
器
的
输入
) 1 1 1 2 2 3 4 3 3 1 我正在
使用</em
浏览 0
提问于2016-07-15
得票数 4
回答已采纳
点击加载更多
扫码
添加站长 进交流群
领取专属
10元无门槛券
手把手带您无忧上云
相关
资讯
使用MICE进行缺失值的填充处理
数据的来源和缺失值处理
问卷数据中的缺失值插补方法
OriginPro:如何绘制有缺失值的Contour图【数据绘图】
大数据中填充缺失值很有效的树模型算法,MissForest算法
热门
标签
更多标签
云服务器
ICP备案
实时音视频
即时通信 IM
对象存储
活动推荐
运营活动
广告
关闭
领券