腾讯云
开发者社区
文档
建议反馈
控制台
登录/注册
首页
学习
活动
专区
工具
TVP
最新优惠活动
文章/答案/技术大牛
搜索
搜索
关闭
发布
精选内容/技术社群/优惠产品,
尽在小程序
立即前往
文章
问答
(4692)
视频
沙龙
1
回答
在smote之后调整预测概率
、
、
、
我有一个
不平衡
的
数据集,我
使用
smote对少数类进行过
采样
,而对多数类进行
欠
采样
。现在,我想
使用
模型
的
predict_proba检查测试AUC。2.我
如何
校正它(
欠
采样
和
过
采样
的
组合
!)
浏览 40
提问于2019-11-22
得票数 0
3
回答
在Auto-Sklearn中处理多类分类
的
不平衡
数据集
的
最佳方法
、
、
、
我正在
使用
Auto-Sklearn,并且有一个包含42个严重
不平衡
的
类
的
数据集。处理这种
不平衡
的
最好方法是什么?据我所知,在机器
学习
中存在两种处理
不平衡
数据
的
方法。要么
使用
重
采样
机制,如过
采样
或
欠
采样
(或两者
的
组合
),要么在算法级别上通过选择需要深入了解Auto-Sklearn中
使用
的
浏览 2
提问于2020-02-21
得票数 2
1
回答
如何
使用过
采样
和
欠
采样
的
组合
?
使用
不平衡
学习
、
、
、
、
我想重新
采样
一些大数据(类大小: 8mio vs 2700),我希望通过过
采样
类2
和
欠
采样
类1来获得每个样本
的
50.000个样本。imblearn似乎提供了过
采样
和
欠
采样
的
组合
,但我不明白它是
如何
工作
的
。29000:30000]) >>Counter({0: 968, 9: 32}) 在那之后 >>Counter(y_re
浏览 27
提问于2019-10-12
得票数 1
回答已采纳
1
回答
python中MLP分类器中
的
不平衡
数据集
、
、
、
我正在处理
不平衡
的
数据集,我试图建立一个
使用
MLP分类器
的
预测模型。不幸
的
是,该算法将所有观察值从测试集分类到"1“类,因此分类报告中
的
f1评分
和
回忆值为0。有人知道怎么处理吗?
浏览 0
提问于2017-06-18
得票数 8
回答已采纳
3
回答
200多个类中高度
不平衡
的
数据集
、
、
、
问题是数据集是高度
不平衡
的
。对于目标X1,它有171793条记录,X2有101575条,Xn -1有2条,Xn有2条。考虑目标值计数是按递减顺序排列
的
。为了处理
不平衡
的
数据集,对多类(比如3类)进行过
采样
和
欠
采样
。但在我
的
例子中,有256个类。
如何
在这种情况下对数据集进行
采样
?
如何
以一种方式对数据集进行
采样
,
使
我
的</e
浏览 0
提问于2019-09-28
得票数 2
1
回答
我应该
使用
哪一种,过度抽样还是过抽样?
、
、
、
、
我所掌握
的
数据
不平衡
。然而,当实际进行测试时,所有1500例患者
的
结果都相反。当进行
欠
采样
时,准确率约为85%,1500例中,300例不同,但精度差异较大。 当然,我检查
的
召回
和
准确性,但没有显着性差异
的
准确性,所以你能向我解释为什么这些结果发生吗
浏览 17
提问于2022-06-14
得票数 2
回答已采纳
2
回答
我们能为分类做两种不同
的
模型吗?
、
、
、
假设我有一个二进制分类问题,而我
的
数据是
不平衡
的
,我可以
使用
任何算法建立一个分类模型,并
使用过
采样
或
欠
采样
技术来处理类
的
不平衡
。 如果我要独立地建立两个独立
的
模型,每个模型只为一类数据训练。这会是正确
的
做法吗?
浏览 0
提问于2018-08-09
得票数 0
1
回答
多类
不平衡
数据集
的
抽样
学习
、
、
、
我有一个
不平衡
的
数据集。我在找样本以下
的
。尽管过
采样
过程花费
的
时间较少,模型
的
训练却需要很长
的
时间。我看了一下
不平衡
-
学习
网站。有几种
欠
采样
方法。我正在寻找一种方法,它试图用尽可能多
的
完整信息对类进行
欠
采样
。我尝试了.ClusterCentroids()方法,发现平衡类花费
的
时间太长了。 我尝试过其他在网站上提到
的</e
浏览 0
提问于2019-04-19
得票数 2
回答已采纳
1
回答
列车试验分裂后
不平衡
数据
的
欠
采样
、
、
我是机器
学习
的
新手,目前正在从事一个数据
不平衡
的
项目。我想用随机抽样来平衡数据。我很困惑是应该在测试列车分裂后进行
欠
采样
,还是应该先进行
欠
采样
,然后再进行列车测试分割?我
的
方法是: 1.我用火车测试拆分得到: X_train,y_train用于培训,X_test
和
y_test用于测试。2.将X_train
和
y_train合并为一个数据集,进行
欠
采样
。3.在
浏览 1
提问于2020-05-22
得票数 5
1
回答
如何
在Kaggle (python)上增加RAM大小?
、
、
、
我正在
使用
图像数据集,但它
的
不平衡
和我
的
工作,以解决它
使用
欠
采样
,但它需要更多
的
内存,
如何
才能节省内存,或
如何
才能与大型图像数据集需要重
采样
(
不平衡
图像数据集)
和
需要内存大17 GB
的
python语言,
浏览 85
提问于2021-09-19
得票数 0
1
回答
不平衡
学习
>2维数据
的
"balanced_batch_generator“
、
我正在
使用
不平衡
学习
的
"balanced_batch_generator“来尝试对4维
的
图像数组执行
欠
采样
。我知道这个函数不接受>2维
的
数据,但是我想知道是否有解决这个问题
的
办法。我会通过手动拆分数据来执行
欠
采样
/过
采样
,但是我想利用keras很好地实现
的
函数,如NearMiss来智能地
采样
我
的
数据。
浏览 2
提问于2020-04-11
得票数 1
1
回答
对于
不平衡
的
数据集,
使用过
采样
技术还是
欠
采样
技术更好?
、
、
、
我有一个数据集
不平衡
的
二进制分类问题,我不知道在
欠
采样
和
过
采样
之间
使用
什么!!
浏览 16
提问于2019-10-18
得票数 0
1
回答
搅动模型数据
我正在考虑改进我
的
搅动模型
的
不平衡
数据集,因为大多数人推荐过
采样
/
欠
采样
。我想知道
使用过
去
的
客户流失数据是否会有帮助。假设我现在只是开始收集过去12个月
的
数据,为此,我还收集了过去12-36个月
的
客户流失数据。如有任何反馈,将不胜感激。 谢谢
浏览 0
提问于2022-02-27
得票数 1
3
回答
不平衡
类-
如何
最大限度地减少虚假否定?
、
、
、
我有一个具有二进制类属性
的
数据集。其中623例为+1级(癌阳性),101 671例为1级(癌阴性)。有什么办法可以改善这种情况吗? 谢谢!
浏览 0
提问于2015-11-12
得票数 13
3
回答
列车组
和
测试组
的
不平衡
数据
、
、
、
这两个数据集都是
不平衡
的
(百分比相似),大约有90%
的
标签1。如果测试集是非常
不平衡
的
,那么平衡数据会有用吗?标签0
的
实例(即10%)仍然足够。有没有
使用过
采样
和
过
采样
的
混合技术?还是没什么意义?
浏览 0
提问于2023-03-08
得票数 2
1
回答
在小型数据集
和
大型数据集之间选择最佳匹配
、
、
所以我
的
问题就像我有多个交付伙伴,并且有两个参数,第一个是每个交付伙伴分配
的
总订单和他们
的
成功率。50D | 4 | 90那么我该
如何
处理这个
浏览 8
提问于2019-08-06
得票数 0
1
回答
weka上烟尘与
欠
采样
的
组合
、
、
根据chawla等人(2002)撰写
的
论文,平衡数据
的
最佳效果是将
欠
采样
与平滑相结合。在weka有重
采样
,以减少多数阶级。在重
采样
的
biasToUniformClass中有一个属性--是否对一个统一
的
类
使用
偏向。值0<
浏览 4
提问于2015-01-14
得票数 2
2
回答
用smote
和
OSS解决多类
不平衡
分类问题
、
、
我试图解决一个多类
不平衡
的
分类问题。为此,我
使用
SMOTE表示过
采样
,而OSS用于过
采样
.但我有一个疑问,因为我正在研究多类,所以我必须把它转换成二进制分类。所以我们可以用OVA/OAA来转换它。那么,
如何
使用
OVA/OAA同时对同一数据集进行过
采样
和
欠
采样
?
浏览 0
提问于2019-01-28
得票数 2
2
回答
我应该重新整理数据集吗?
、
我拥有的数据集是由路径名组成
的
一些文本数据。我正在
使用
TF-国防军向量器
和
决策树。数据集中
的
类严重
不平衡
。有几个大类
的
样本数超过500个,而其他一些小类
的
样本数少于100个。有些甚至更小(不到20)。这是实际收集
的
数据,因此模型在实际实现中看到次要类
的
可能性也很小。我现在遇到
的
问题是,模型大部分时间预测小班为主修班,
使
我
的
准确率一直在45%左右。如果我重新整理数据,我认为由于模型<
浏览 0
提问于2021-07-14
得票数 0
1
回答
Vowpal Wabbit:
不平衡
类
、
我想
使用
Vowpal Wabbit执行Logistic回归。
如何
处理
不平衡
的
类(例如1000/50000)?我知道我可以
使用
重要性加权,但我不确定在这种情况下这是最好
的
选择。也有一些算法,比如SMOTE,但我不知道
如何
在Vowpal Wabbit中
使用
它们。
浏览 1
提问于2015-11-07
得票数 0
点击加载更多
扫码
添加站长 进交流群
领取专属
10元无门槛券
手把手带您无忧上云
相关
资讯
处理不平衡数据的技巧总结
处理不平衡数据的技巧总结!
机器学习中的数据不平衡解决方案大全
机器学习中样本不平衡处理办法
过采样与欠采样技术原理图解:基于二维数据的常见方法效果对比
热门
标签
更多标签
云服务器
ICP备案
对象存储
腾讯会议
云直播
活动推荐
运营活动
广告
关闭
领券