腾讯云
开发者社区
文档
建议反馈
控制台
登录/注册
首页
学习
活动
专区
工具
TVP
最新优惠活动
文章/答案/技术大牛
搜索
搜索
关闭
发布
精选内容/技术社群/优惠产品,
尽在小程序
立即前往
文章
问答
(1216)
视频
沙龙
1
回答
类别
权重
与
欠
采样
/
过
采样
、
、
、
例如,在不平衡分类(使用scikit learn)中,平衡类(即将class_weight设置为平衡)
与
使用SMOTE进行
过
采样
的区别是什么?其中一种
与
另一种的预期效果会是什么?
浏览 15
提问于2019-04-13
得票数 5
回答已采纳
2
回答
scikit了解用于交叉验证的不平衡数据的
欠
采样
、
、
如何在scikit-learn中生成用于交叉验证的随机折叠?我找到了这个讨论(),但我不明白如何获得折叠。理想情况下,我认为我需要这样一个函数:[list(itertools.repeat(1,20)), list(itertools.repeat(2,80))], 我遗漏了什么?
浏览 3
提问于2013-12-21
得票数 6
1
回答
使用fitctree训练具有不平衡训练集的更敏感的模型
、
、
、
我正在尝试在MATLAB中建立一个二进制分类的决策树。我为每个实例提供了4个功能。正类中约有25,000个实例,负类中约有350,000个实例。有没有一种方法可以将决策树构建成更敏感的模型?(也就是说,除了“准确性”,我是否可以使用fitctree来构建灵敏度为70/80/90%或灵敏度和特异度相似的模型?)
浏览 1
提问于2018-02-16
得票数 1
1
回答
具有不平衡类的Tensorflow Resnet
、
、
、
、
有了这个给定的分布,我的模型有太强的趋势来预测具有较大样本的
类别
而不是较小的样本。
浏览 3
提问于2020-01-04
得票数 1
1
回答
具有大量类的极小数据集上的文本分类
、
、
、
、
我得到的最好的结果是
与
SVC在74%-75%的准确性. 我想知道还有什么可以提高我的准确性。我是NLP的初学者,我以前从未做过这样的事情。
浏览 0
提问于2020-06-12
得票数 0
1
回答
不平衡数据集的类
权重
公式
、
、
、
我发现在dataset中处理类不平衡的几种方法是对多数类执行
欠
采样
或对少数类执行
过
采样
。但最常用的方法是在损失函数中引入
权重
。我找到了几个计算
权重
的公式: wj=n_samples / (n_classes * n_samplesj)或wj=1/n_samplesj 哪一个是最好的?
浏览 0
提问于2021-05-02
得票数 1
1
回答
使用pytorch python的
欠
采样
和
过
采样
的不平衡分类
、
、
、
我想一起使用过
采样
和
欠
采样
技术我有6个类,样本数如下:类0 250000类1 48000类2 40000类3 38000类4 35000类5 7000我想使用smot来使所有类平衡且大小相等类0 40000类1 40000类2 40000类3 40000类4 40000类5 40000我知道如何对所有数据进行
过
采样
或
欠
采样
,但如何将它们
与
多类分类一起使用
浏览 124
提问于2021-08-24
得票数 0
2
回答
对不平衡的数据加权CNN回归?
、
、
、
、
我有一个CNN的回归,采取一个图像和输出浮点0-10。我的模型做得很好,但是我有一个严重的不平衡数据的问题,使我的模型对几乎所有的图像进行6-8的预测,但是实现了一个相当好的均方误差。我知道人们根据数据集的不平衡程度来加权他们的类。那么,有办法用回归模型来做到这一点吗?如果有帮助的话,我的输出就是一个浮点,但是我的所有数据都在0-10范围内间隔0.5,所以在某种程度上有20个不同的类。这是我的数据标签的分布情况。据我所知,还有其他方法,例如: 有什么建议吗?
浏览 0
提问于2019-07-30
得票数 4
1
回答
在smote之后调整预测概率
、
、
、
我有一个不平衡的数据集,我使用smote对少数类进行
过
采样
,而对多数类进行
欠
采样
。现在,我想使用模型的predict_proba检查测试AUC。2.我如何校正它(
欠
采样
和
过
采样
的组合!)
浏览 40
提问于2019-11-22
得票数 0
1
回答
python中MLP分类器中的不平衡数据集
、
、
、
我正在处理不平衡的数据集,我试图建立一个使用MLP分类器的预测模型。不幸的是,该算法将所有观察值从测试集分类到"1“类,因此分类报告中的f1评分和回忆值为0。有人知道怎么处理吗?model.fit(X_train, y_train)fpr, tpr, thresholds = roc_curve(y_test, model.predi
浏览 0
提问于2017-06-18
得票数 8
回答已采纳
2
回答
如何在多分类任务中定义少数/多数类
、
虽然文献一致认为,我们需要对“少数”类和“多数”类进行
过
抽样,但对于如何定义/衡量少数群体/多数群体,我还没有找到明确的定义。
浏览 0
提问于2022-03-17
得票数 1
3
回答
在处理VotingClassifier或网格搜索时,Sklearn中的GradientBoostingClassifier是否有类
权重
(或替代方法)?
、
在Sklearn中,类
权重
似乎并不是这个分类器的参数。我知道我可以在合适的时候使用sample_weight,但在处理VotingClassifier或GridSearch时就不能使用它了。
浏览 3
提问于2016-02-22
得票数 10
2
回答
我应该重新整理数据集吗?
、
我拥有的数据集是由路径名组成的一些文本数据。我正在使用TF-国防军向量器和决策树。数据集中的类严重不平衡。有几个大类的样本数超过500个,而其他一些小类的样本数少于100个。有些甚至更小(不到20)。这是实际收集的数据,因此模型在实际实现中看到次要类的可能性也很小。我现在遇到的问题是,模型大部分时间预测小班为主修班,使我的准确率一直在45%左右。如果我重新整理数据,我认为由于模型学习主修班的能力降低,准确性会更差。 因此,我想问一问,我是否应该考虑重新整理我的数据,或有人对如何提高我的模型的准确性有任何建议?任何帮助都是非常感谢的。
浏览 0
提问于2021-07-14
得票数 0
3
回答
列车组和测试组的不平衡数据
、
、
、
有没有使用过
采样
和
过
采样
的混合技术?还是没什么意义?
浏览 0
提问于2023-03-08
得票数 2
2
回答
在训练过程中,如何从Scikit的每个班中抽取同等数量的示例来学习SVM?
、
、
、
我使用Scikit学习实现了一个。由于我所处理的是班级不平衡(96%至4%),我希望支持向量机能在训练期间从每班抽取相等数目的样本。我如何通过Scikit学习来实现这一点?
浏览 5
提问于2017-10-23
得票数 1
回答已采纳
1
回答
Tensorflow Estimator API:如何从输入函数传递参数
、
我试图为我的模型添加类
权重
作为超参数,但是为了计算
权重
,我需要读取输入数据,这发生在input_fn内部,然后传递给estimator.fit()。或者作为另一种选择-也许有一个input_fn数据集的包装器,它允许对少数/
欠
采样
多数进行
过
采样
以及批处理-在这种情况下,我不需要任何参数来传播。
浏览 1
提问于2018-01-22
得票数 6
1
回答
在小型数据集和大型数据集之间选择最佳匹配
、
、
我目前正在做一个小项目。喜欢A | 100 | 70C | 50 | 40因此,如果有新订单到达,我希望根据到目前为止分配的成功率和总订单
浏览 8
提问于2019-08-06
得票数 0
3
回答
不平衡的数据:
过
采样
还是
过
采样
?
、
、
、
、
我有一个二元分类问题,其中一个
类别
占所有观测值的99.1% (210 000)。作为处理不平衡数据的一种策略,我选择了抽样技术。但我不知道该怎么做:低估我的多数阶级,或过度抽样代表较少的阶层。
浏览 2
提问于2017-05-29
得票数 1
回答已采纳
1
回答
使用
权重
处理不平衡数据
、
、
、
、
首先,我想检查多数类上的
欠
采样
。第一类包含600、class2 90、class3 60和class4 96示例数据!为什么使用
权重
,结果不是更好?
浏览 0
提问于2015-11-08
得票数 0
2
回答
用smote和OSS解决多类不平衡分类问题
、
、
为此,我使用SMOTE表示
过
采样
,而OSS用于
过
采样
.但我有一个疑问,因为我正在研究多类,所以我必须把它转换成二进制分类。所以我们可以用OVA/OAA来转换它。那么,如何使用OVA/OAA同时对同一数据集进行
过
采样
和
欠
采样
?
浏览 0
提问于2019-01-28
得票数 2
点击加载更多
扫码
添加站长 进交流群
领取专属
10元无门槛券
手把手带您无忧上云
相关
资讯
过采样与欠采样技术原理图解:基于二维数据的常见方法效果对比
采样率与带宽的关系:如何避免欠采样导致的波形失真?
这种带sinc函数的ADC,如何实现欠采样呢?
处理不平衡数据的过采样技术对比总结
ArcGIS栅格重采样操作与算法选择
热门
标签
更多标签
云服务器
ICP备案
云直播
对象存储
腾讯会议
活动推荐
运营活动
广告
关闭
领券