腾讯云
开发者社区
文档
建议反馈
控制台
登录/注册
首页
学习
活动
专区
工具
TVP
最新优惠活动
文章/答案/技术大牛
搜索
搜索
关闭
发布
精选内容/技术社群/优惠产品,
尽在小程序
立即前往
文章
问答
(9999+)
视频
沙龙
1
回答
生成人工
数据
扩展学习集
、
、
、
、
我有包含42个实例(X)和最后一个Y的
数据
集,我想在其中执行LASSO regression.All是连续的和数字的。由于样本量小,我想把它扩大。我对用于扩展不
平衡
数据
集的
SMOTE
算法有一定的了解。
在
没有不
平衡
的情况下,我的情况有什么可用的吗?
浏览 0
提问于2020-08-21
得票数 1
1
回答
有没有办法使样品
平衡
?
、
、
、
我有一个由machines.The分解的属性组成的
数据
集,目标变量是机器状态,由0和1填充。0和1的分布如下所示 1 - 225我说的人工排行是什么意思?填充一些随机
数据
,目标变量为1's,但这最终会误导系统。我看不出还有其他的选择和选择。 有没有办法使样品
平衡
?
浏览 0
提问于2018-11-08
得票数 0
回答已采纳
1
回答
AttributeError:“DataFrame”对象
在
使用
SMOTE
时没有属性“名称”
、
、
、
、
为了
平衡
我的不
平衡
数据
集,我正在
使用
imblearn over_sampling
SMOTE
技术。features= dataset.iloc[:,[1,2,3,4]]from imblearn.over_sampling import
SMOTE
# applying
SMOTE
to our data and checking the class counts resampled, yresampled = <
浏览 1
提问于2019-12-23
得票数 2
回答已采纳
1
回答
数据
少、稀疏、不
平衡
时的特征选择
、
、
、
当我有较少、稀疏和不
平衡
的
数据
时,有什么方法来选择这些特性吗?特征数量:200个样本数:约1000个
浏览 1
提问于2017-02-01
得票数 0
2
回答
有内置的MSMOTE吗?
、
我正试图处理一个小
数据
集中的
数据
不
平衡
问题。刚刚发现了一篇关于
SMOTE
和MSMOTE 的文章你知道我是否可以尝试任何内置的MSMOTE吗?我对任何编程语言都没意见..。
浏览 4
提问于2017-04-09
得票数 3
5
回答
scikit学习的不
平衡
、
我
在
Python
程序中
使用
scikit-learn来执行一些机器学习操作。问题是我的
数据
集存在严重的不
平衡
问题。 有没有人熟悉scikit-learn或
python
中
不
平衡
的解决方案?
在
Java中有
SMOTE
机制。
在
python
中有类似的东西吗?
浏览 1
提问于2013-02-25
得票数 40
1
回答
使用
SMOTE
库
在
Python
中
平衡
数据
、
我想要
平衡
一组训练
数据
,它具有以下特征,并且
在
X_train和y_train
中
是分开的。我的班级的百分比大致如下:class B: 45%所以我想对我的
数据
重新采样,如下所示:class B: 41%我想
使用
的
库
是: 并
使用
Smote
作为
平衡
算法。我的问题是,我不知道如何
使用
这个
库<
浏览 25
提问于2020-02-28
得票数 1
4
回答
如何重采样
、
我得处理一个小
数据
集。我认为我应该利用重放法来扩大种群,提高我的回归算法的性能。我听说过
SMOTE
,但它用于不
平衡
数据
集中的分类。是否有任何方法来创建小型
数据
集的合成
数据
?谢谢。
浏览 0
提问于2019-08-01
得票数 0
1
回答
完成后如何导出到CSV文件
、
为了解决不
平衡
的
数据
问题,我运行了下面的
Python
代码。我用了击打功能。我不知道如何看待和导出(作为一个excel文件到我的桌面)“重采样
数据
集”(1: 860到0:860)。因为我想获得该excel文件并
使用
另一个application.Any帮助来处理它是非常感谢的。from imblearn.over_sampling import
SMOTE
x_
smote
, y_
smote</
浏览 4
提问于2021-04-01
得票数 0
3
回答
在
R
中
执行
SMOTE
的包
、
、
我正在尝试
在
R
中
对不
平衡
的
数据
集进行
SMOTE
。我试着为此安装"DMwR“包,但是这个包似乎已经从cran存储
库
中
删除了。或者建议
在
R中
使用
SMOTE
的任何其他包? 蒂娅!
浏览 233
提问于2021-04-14
得票数 2
3
回答
在
r
中
显著减少样本数量
、
、
我有大约130000张记录的
数据
集。将记录划分为两类目标变量,0&1.1只占总比例的0.09%。library(DMwR) data_code$target=as.factor(data_code$target) #Converted to factor as#
浏览 2
提问于2019-02-11
得票数 3
回答已采纳
2
回答
如何处理不
平衡
的
数据
、
、
我用1和0来代替它们,因为1和0之间有很大的不
平衡
,我的模型基本上了解了这些特性。我担心这个特殊的特征可能是一个工件--有0的样本有时也可以被归类为1。在这种情况下该怎么办?更新: 让我详细解释这个问题,因为答案大多集中
在
不
平衡
的课堂上。我有一个由大约30个特性和二进制类{0,1}组成的
数据
集。特征主要是数字(连续),但也有二元分类特征,如是/否,男性/女性等。这个
数据
集的一个方面是不
平衡
类(有比零更多的类),另一个方面是,一个分类特性,假设x (是/否)也
浏览 0
提问于2019-03-04
得票数 3
1
回答
混乱矩阵
中
的支持
、
、
、
我有一个不
平衡
的
数据
集,我
使用
SMOTE
算法来
平衡
它。当我打印混淆矩阵时,在过采样后,它向我显示了以下输出:我有一个1000标签的
数据
集1发生700次,标签0发生300次,我
使用
0.3作为测试
数据
,但为什么它显示我支持即使我不应用
SMOTE
算法,它也显示了91和209,
在
应用
SMOTE
之后,也是一样的。
浏览 2
提问于2020-11-30
得票数 0
回答已采纳
1
回答
处理Orange
中
的不
平衡
数据
集
、
、
我
在
医学领域工作,所以阶级不
平衡
是规则,而不是例外。虽然我知道
Python
有用于类不
平衡
的包,但在Orange
中
,我没有看到任何选项,例如
SMOTE
小部件。我
在
Stack Exchange
中
读过关于这个问题的其他线程,但是我还没有找到解决Orange
中
类不
平衡
问题的方法,而不需要
使用
Python
编程。谢谢
浏览 0
提问于2021-02-21
得票数 0
1
回答
乱砍滥伐后少数民族阶层的过度适应
、
、
、
、
我用
SMOTE
做了一个预测模型,1级有1800个样本,35000+有0级样本。因此,按照标准,建立了合成样本,并对随机森林进行了训练。无击打和我也尝试过超参数优化,但这不起作用PS:
在
pandas中
使用
UnbalancedDataset
库
的
SMOTE
实现
浏览 0
提问于2016-05-09
得票数 7
回答已采纳
1
回答
多类
平衡
的
SMOTE
会改变我的
数据
集的形状。
、
、
、
、
所以我有一个形状
数据
集(430, 17 ),它由13个类(不
平衡
)和17个特性组成。最终目标是创建一个NN,当我导入不透明的
数据
集时,它可以正常工作,但是当我试图
在
jupyter笔记本中
使用
SMOTE
对少数类进行过采样时,类确实得到
平衡
,但形状也发生了变化。然后,如果我把这些
数据
放入我的神经网络
中
,它当然不能工作,因为我的输入层的input_dim已经改变了。 我的问题是,
SMOTE
过程是否不仅增加了行来
平衡
浏览 0
提问于2021-12-09
得票数 1
回答已采纳
1
回答
如何在不
平衡
的二进制分类项目中
使用
"is_unbalance“和"scale_pos_weight”参数(80:20)
、
、
、
、
我目前有一个不
平衡
的
数据
集,如下图所示: 然后,我
使用
'is_unbalance‘参数,
在
训练LightGBM模型时将它设置为True。下面的图表显示了我如何
使用
这个参数。
使用
本机API:的示例
使用
sckit-learnAPI:的示例 我的问题是: is_unbalanceOr 是应用is_unbalance参数正确的方法吗?如何
使用
scale_pos_weight代替,我应该
使用
SMOTE</e
浏览 28
提问于2022-04-12
得票数 2
1
回答
使用
Weka分类没有给出精度、Fmeasure和MCC的任何结果
、
、
、
、
我有一个
数据
集。
数据
集有一些分类值和一些离散值。我的
数据
集是一个不
平衡
数据
集。我
使用
Weka提供的Resample过滤器将
数据
集分为60%的训练
数据
和40%的测试
数据
。为了使
数据
集
平衡
,我
使用
了
SMOTE
技术。在那之后,我
使用
随机森林对
数据
集进行分类。 现在我不能理解结果
中
的?是什么意思?其次
浏览 20
提问于2021-10-21
得票数 0
1
回答
weka上烟尘与欠采样的组合
、
、
根据chawla等人(2002)撰写的论文,
平衡
数据
的最佳效果是将欠采样与平滑相结合。
在
weka有重采样,以减少多数阶级。
在
重采样的biasToUniformClass中有一个属性--是否对一个统一的类
使用
偏向。值0使类分布保持原样,值1确保类分布
在
输出
数据
中
是一致的。我
使用
值0,多数类
中
的
数据</
浏览 4
提问于2015-01-14
得票数 2
1
回答
Scikit学习具有预定义类数的拟合估计器
、
、
、
因此,我需要
使用
scikit learn
中
的一些估计器,即LogisticRegression和SVM,但我有一个问题,我有一个非常不
平衡
的
数据
集,需要运行Kfold交叉验证。我知道这两个算法
使用
的是线性函数,也许在这种情况下我可以
使用
一些接口。编辑: StratifiedFold交叉验证对我来说没有用,因为有时我的出现次数比折叠次数少。例如,我有一个有50个实例和3个类的
数据
集,但是46个可以属于一个类,2个属于第二类,2个属于第三类,
浏览 2
提问于2017-02-22
得票数 0
点击加载更多
扫码
添加站长 进交流群
领取专属
10元无门槛券
手把手带您无忧上云
相关
资讯
SQL server在大数据中数据库分析和使用趋势
Python中的不平衡数据遍历与处理技巧
Python编程:使用pythink查询数据库
如何使用python中matplotlib库分析图像颜色
python 中的 numpy 库为什么无法使用
热门
标签
更多标签
云服务器
ICP备案
对象存储
腾讯会议
云直播
活动推荐
运营活动
广告
关闭
领券