腾讯云
开发者社区
文档
建议反馈
控制台
登录/注册
首页
学习
活动
专区
工具
TVP
最新优惠活动
文章/答案/技术大牛
搜索
搜索
关闭
发布
精选内容/技术社群/优惠产品,
尽在小程序
立即前往
文章
问答
(2552)
视频
沙龙
1
回答
对于
不平衡
数据集上的分类任务,获得很好的精度但精度很低。
、
、
我有一个
不平衡
的数据集,其中正类大约是10,000个条目,负类大约是8,00000个条目。我正在尝试一个简单的scikit的LogisticRegression模型作为基线模型,其类权重=‘balanced’(希望
不平衡
问题应该得到解决?)。我需要分开处理
不平衡
部分吗?
浏览 1
提问于2016-10-05
得票数 2
回答已采纳
1
回答
Logistic
回归
与
不平衡
样本
、
、
、
、
我正在运行逻辑
回归
,其中结果变量是成功的二进制变量(I是:客户的位置、供应商、处理时间、销售人员的经验水平等)。要约要么申请了(出售),要么没有(没有出售)。
浏览 10
提问于2018-02-16
得票数 0
1
回答
非平衡数据集上的
Logistic
回归
与
随机林
、
我有一个
不平衡
的数据集,其中阳性仅占整个
样本
的10%。我使用
logistic
回归
和随机森林进行分类。通过对这些模型结果的比较,发现0,1和0,0.6之间的
logistic
回归
结果在概率输出上存在一定的差异。我不能分享数据集,但我怀疑这些算法的工作。随机森林如何产生小于0.6的概率?
浏览 0
提问于2020-07-23
得票数 1
回答已采纳
1
回答
多类
回归
的
不平衡
数据
、
、
我试图比较多类
logistic
回归
(OvR)和随机森林的性能,但是我的数据集
与
标签的5个可能值是
不平衡
的。数据
不平衡
对绩效有影响吗?
浏览 8
提问于2022-09-08
得票数 -1
4
回答
处理scikit中
不平衡
测试集的最佳方法--学习
、
什么是最好的方法来处理一个
不平衡
的测试集在科学工具包-学习? 我的训练数据被分成两类,其中
样本
外的数据可能更接近90/10。我使用随机森林、
logistic
回归
和梯度提升来分类和关注概率输出。
浏览 4
提问于2014-03-24
得票数 0
回答已采纳
2
回答
不平衡
类的离群点检测
、
、
、
我必须建立一个预测模型,根据其他一些数值数据来预测一个布尔变量韩元/丢失变量,并进一步找出“Won”观测值的特征。PS:使用RandomForestClassifier,并使用混淆矩阵进行验证。所以现在我试着用另一种方式来看待它,并对“韩元”案例进行异常检测,因为数据中很少有“
浏览 0
提问于2016-05-05
得票数 3
回答已采纳
1
回答
为什么我针对多类问题的
不平衡
数据的f1评分如此之低?
、
、
我正在处理一个多类问题和
不平衡
的数据。我正在努力寻找一种算法,可以很好地预测每一个班
与
蟒蛇(滑雪和熊猫)。我的数据集包含: 620行,12列,是
不平衡
的:K近邻
Logistic
回归
(求解者=‘凹陷’)随机森林Adaboost SVM如何
浏览 0
提问于2021-07-19
得票数 0
1
回答
过量抽样对
logistic
回归
有什么影响?
、
我是用
logistic
回归
来建立这个模型。我以前参加过5次竞选,一般每次竞选的转化率都在10%左右。因此,为了处理这个
不平衡
的数据集和获取更多的信息,我从这个数据中抽取了一个分层
样本
(整个5次运动),这样就有50%的
样本
带有负片和50%的阳性。因此,我夸大了我的积极之处。我的怀疑是,如果我使用逻辑
回归
,它估计系数的最大对数似然。这种过度采样会产生偏倚结果吗? 而且,我认为这种过度采样不会对随机森林造成任何问题?
浏览 0
提问于2020-07-25
得票数 0
1
回答
为什么决策树能很好地处理
不平衡
的数据?
、
、
我试验了来自卡格尔的欺诈
样本
。我采取了线性
回归
和决策树。线性
回归
按预期工作:我们有很高的查准率和召回率,而抽样不足会使情况更糟。
浏览 0
提问于2017-09-07
得票数 1
回答已采纳
1
回答
使用大量特征执行
Logistic
回归
?
、
、
、
、
我有一个包含330个
样本
和每个
样本
的27个特征的数据集,其中具有
Logistic
回归
的二进制类问题。这只给了我70个事件,允许在
Logistic
模型中包含大约7/8的功能。 我想评估所有的功能作为预测,我不想手动选择任何功能。
浏览 0
提问于2017-07-28
得票数 0
2
回答
不平衡
分类:过采样
与
缩放特征的顺序?
、
、
当使用
不平衡
的数据集(例如,欺诈检测)执行分类(例如,逻辑
回归
)时,是最好在过度采样少数类之前对特征进行缩放/zscore/标准化,还是在缩放特征之前平衡类?下面是一个例子: 用
不平衡
浏览 0
提问于2018-01-21
得票数 7
1
回答
多标号
不平衡
列车试验劈开
、
、
、
、
我有四个
回归
标签的数据。每个
回归
标签的
样本
是
不平衡
的。这些数据
与
post 一起附在这里。此外,标签是高度
不平衡
的。例如,大多数
样本
定义了D,而最小
样本
定义了A。对于多标签
回归
输出有类似的功能吗?
浏览 2
提问于2020-11-27
得票数 2
回答已采纳
1
回答
R的lm函数如何处理因子水平(在C_Cdqrls中?)?
、
、
第二部分仍然涉及到z <- .Call(C_Cdqrls, x, y, tol, FALSE)和我所不期望的,线性
回归
和判别分析在数学层面是相同的。,我是不是错过了明显的?
浏览 2
提问于2019-07-09
得票数 5
回答已采纳
1
回答
如何用大量的特征进行
Logistic
回归
?
、
、
、
、
我有一个包含330个
样本
和每个
样本
27个特性的数据集,其中包含一个用于
Logistic
回归
的二进制类问题。这只给了我70个事件,只允许在
Logistic
模型中包含大约7/8的特性。 我想评估所有的功能作为预测,我不想手动挑选任何功能。
浏览 0
提问于2017-07-28
得票数 11
1
回答
基于
logistic
回归
/决策树的橙色分类标签预测
、
、
得到“ValueError(”不带类属性的测试数据集“)”如何实际预测决策树/逻辑
回归
中的类标签? ->
logistic
regression -> test learners -> Confusion Matrix->
logistic
regression -> Predictions -> Remaining data -> test learners
浏览 1
提问于2015-05-12
得票数 0
3
回答
使用分类数据集有什么影响?
、
、
这是一个二值分类问题,类严重
不平衡
。我对
样本
进行了击打并创建了一个模型。我也尝试过类似的方法,对
样本
不足。
logistic
回归
的两种方法均表现平庸。
浏览 0
提问于2019-08-09
得票数 0
回答已采纳
3
回答
什么样的算法可以用来预测板球比赛的结果?
、
、
、
二次
回归
是个好主意吗?或者,基于概率的预测算法,如马尔可夫算法,是普遍使用的吗?还有其他我应该使用的算法吗?到目前为止,我在数据分析方面已经学会了
回归
。
浏览 0
提问于2016-04-12
得票数 0
2
回答
logistic
回归
对测试数据
不平衡
与
训练的不良分类性能
、
、
我试图将
logistic
回归
模型拟合到高维(约15k)的
不平衡
数据集(0.5/99.5)。我用随机森林来选择最重要的200个特征。观测值在120 K左右。当我对基于数据集的
logistic
回归
模型进行拟合时(使用Smote进行过采样),在训练f1时,查全率和准确率都很好。但在测试中,精度分数和f1都很差。我目前正在尝试不同的
不平衡
数据集的抽样方法,也计划尝试PCA。
浏览 0
提问于2017-03-27
得票数 7
回答已采纳
3
回答
为什么
Logistic
回归
比svm更好?
、
、
、
、
我尝试过不同的ML算法,发现
Logistic
回归
比所有算法都要好,但是我无法理解why.My数据具有比观察更多的特性。支持向量机-应该在高维数据上表现良好,即使存在类
不平衡
,也会表现良好,但没有显示出很好的效果。朴素贝尔斯-我认为朴素贝尔斯表现不佳,因为阶级
不平衡
。随机森林-体面performance.but没有表现出
logistic
回归
。注意:数据集是稀疏的,它比观测/示例具有更多的特性/参数。
浏览 0
提问于2019-04-10
得票数 1
1
回答
XGBoost:如何调整二进制分类器的概率以匹配训练数据?
、
、
、
训练和测试数据的阳性率约为1%,但模型预测的阳性率仅为0.1%左右。我试过校准,但没什么改进。我也不想选择阈值,因为最终目标是输出概率。 我想要的是模型有很多分类阳性,类似于实际数据中的阳性数。
浏览 0
提问于2020-01-31
得票数 5
点击加载更多
扫码
添加站长 进交流群
领取专属
10元无门槛券
手把手带您无忧上云
相关
资讯
Sklearn之Logistic回归
分类(1):logistic回归
机器学习(七)——logistic回归
机器学习——logistic回归实践
机器学习之Logistic回归
热门
标签
更多标签
云服务器
ICP备案
对象存储
腾讯会议
云直播
活动推荐
运营活动
广告
关闭
领券