腾讯云
开发者社区
文档
建议反馈
控制台
登录/注册
首页
学习
活动
专区
工具
TVP
最新优惠活动
文章/答案/技术大牛
搜索
搜索
关闭
发布
精选内容/技术社群/优惠产品,
尽在小程序
立即前往
文章
问答
视频
沙龙
4
回答
衡量机器学习模型是否过度拟合的正确方法是什么?
、
我理解过拟合和欠拟合的直观含义。现在,给定一个基于训练数据训练的特定机器学习模型,您如何判断训练是过拟合还是欠拟合数据?有没有一种量化的方法来衡量这些因素? 我们能不能看看误差,然后说它是过拟合还是欠拟合?
浏览 0
提问于2012-09-15
得票数 4
回答已采纳
1
回答
python中内置的贝叶斯曲线拟合模块
、
我在scipy库中搜索贝叶斯曲线拟合的内置模块,但我找不到一个。我找到的只有: 但是这个链接的描述说这是非线性最小二乘拟合。我的问题是,我们是否必须实现自己的贝叶斯曲线拟合模块,或者是否有我可能遗漏的这样的模块?
浏览 1
提问于2016-10-22
得票数 0
2
回答
它是否被认为是过度拟合具有完美属性的决策树?
、
、
、
、
我有一个6维的训练数据集,其中有一个完美的数字属性,它以这种方式分隔所有训练示例:如果为TIME<200,则该示例属于class1,如果为TIME>=200,则该示例属于class2。J48创建了一个只有一个级别的树,并且这个属性是唯一的节点。 然而,测试数据集并不遵循这一假设,所有的示例都被错误分类。我很难弄清楚这个案子是不是太合适了。我要说的不是数据集那么简单,但据我所知,过拟合的定义意味着对训练数据的高度拟合,这就是我所拥有的。有什么帮助吗?
浏览 2
提问于2016-05-03
得票数 0
5
回答
为什么欠拟合被称为高偏差,过度拟合被称为高方差?
、
在数据科学的讨论中,我一直在使用像欠拟合/过拟合和偏差-方差权衡这样的术语,我知道不拟合与高偏差相关,过拟合与高方差相关。但是,这种关联的原因是什么,或者从模型的角度来说,什么是高偏差和高方差,人们如何才能直观地理解它呢?
浏览 0
提问于2019-02-14
得票数 31
4
回答
“拟合下”和“过度拟合”到底是什么意思?它们从来没有得到明确的定义。
、
、
、
在处理这些条款时,我总是迷失方向。特别是关于这种关系的问题,如低拟合-高偏差(低方差)或过拟合-高方差(低偏差)。以下是我的论点: 来自维基: 在统计中,**过度拟合是“产生一种分析,该分析与某一特定数据集过于密切或准确地对应,因此可能无法拟合额外的数据或可靠地预测未来的观测”。1--过度拟合模型是一种统计模型,包含比数据更多的参数。2的本质是在不知情的情况下提取一些剩余的变化(即噪声),就好像这种变化代表了底层的模型结构一样。3.:45次拟合发生在统计模型不能充分捕捉到数据的底层结构时。未拟合的模型是一个模型,其中一些参数或术语会出现在一个正确指定的模型中。2。 基于这一定义,拟合不足和过度
浏览 0
提问于2021-08-15
得票数 1
2
回答
检查过拟合
、
、
、
、
我希望确保我的模型不会过度拟合。我使用交叉验证检查了过拟合。所有折叠的结果都是close.But的,同时我检查了训练和测试预测。测试大小为0.25。而且训练和测试预测是如此不同。这表明我的模型过拟合了。我应该相信哪个结果?交叉验证或测试/训练prediction.Is我的模型过拟合? 注意:我使用的是python。Sklearn用于交叉验证、训练测试拆分和建模
浏览 0
提问于2020-03-10
得票数 0
1
回答
训练集和测试集的差异阈值是多少?
、
在训练集和测试集之间总是存在着性能差异。我想知道这种差异的门槛是什么,这是可接受的还是不可接受的?例如,也许训练的分数是87%,测试的分数是83%。4%的差异可能是可以接受的。但如果87%的训练和测试仅为60%。这20%可能表示过拟合问题。所以我想知道这是不是有一个门槛?
浏览 37
提问于2019-05-29
得票数 0
1
回答
如何在k-means python中输入或确定聚类中心?
、
、
、
、
我对聚类方法有一些问题,那就是K-Means我想用经纬度坐标对一个新数据进行聚类。但在此之前,我已经使用现有数据自己设置了集群中心。有没有人能用python代码解释一下,如何将集群中心数据输入到kmeans方法中,而不需要对kmeans进行拟合?因为当现有的数据拟合到kmeans时,聚类的中心会发生变化,所以新的数据将基于从拟合结果中获得的新的聚类中心。 感谢您的关注
浏览 64
提问于2021-08-04
得票数 0
1
回答
无法在IRIS数据集中不足/过度匹配
我正在玩IRIS数据集,并希望看到不足和过度拟合的行动。我正在使用多层感知器(2个层)。 问题是,我不能低估或过适合的数据(见下面的图)。我理解为什么我不能不适应:如果数据很容易分离的话,它可能会发生,但为什么我不能过份呢?dataset的容量是600 (样本的# (150)是特性(4)的#),所以我应该能够使用一个容量大于这个容量的网络来适应。我正在尝试使用一个多层感知器,它的参数范围从15到32000不等,但既不欠,也不发生过度拟合。怎么一回事?也许过度拟合并不是因为同样的原因,因为数据很容易分离?谢谢! 📷
浏览 0
提问于2017-08-24
得票数 3
1
回答
在R中获取适合我的数据点的函数
我想要获得拟合数据点的直线的函数: x <- c(200,100,50,25,12.50,6.25,3.13,0.00) y <- c(0.6365, 0.315, 0.157, 0.083,0.048, 0.037,0.0325, 0.0165) plot(x,y) lines(lowess(x,y), col="blue")
浏览 0
提问于2014-07-08
得票数 1
1
回答
为什么上采样超过下采样?
、
、
我有191个样本的数据,并建立了一个logistic回归。我首先使用原始数据运行模型,然后进行重采样。我不明白的是:- 为什么要在下采样前或上下采样前进行过采样。如果过采样会产生过拟合的问题,那么就可以通过数据的缩放来处理。在上采样或任何其他抽样之后,必须检查哪些参数才能继续进行另一次采样,例如向下采样还是上下采样? 我恳请有人帮助我理解上面的内容。
浏览 2
提问于2020-05-10
得票数 2
2
回答
不平衡分类:过采样与缩放特征的顺序?
、
、
当使用不平衡的数据集(例如,欺诈检测)执行分类(例如,逻辑回归)时,是最好在过度采样少数类之前对特征进行缩放/zscore/标准化,还是在缩放特征之前平衡类? 其次,这些步骤的顺序是否会影响最终如何解释特性(当使用所有数据scaled+balanced来训练最终模型时)? 下面是一个例子: 标度第一: 将数据分割成列车/测试折叠 使用所有培训(不平衡)数据计算平均值/std;使用这些计算来缩放培训数据 对培训数据中的少数族裔类进行过抽样(例如,使用SMOTE) 训练数据拟合logistic回归模型 使用平均值/std计算来缩放测试数据 用不平衡的测试数据预测类;评估ac
浏览 0
提问于2018-01-21
得票数 7
7
回答
对平面上未排序的点进行曲线拟合
、
、
、
、
问:如果平面上的点不是单值的,如何将曲线拟合到这些点? 对于所示的示例,如何将曲线(如黑色的)拟合到嘈杂的蓝色数据?它类似于样条平滑,但我不知道数据的顺序。 最好使用Matlab,但也可以使用伪代码。或者指向这个问题的正确术语的指针将是很好的。 谢谢
浏览 1
提问于2009-06-14
得票数 30
1
回答
将多行安装到python中的一组数据点。
、
、
、
、
我有一套传感器数据点和,我正在尝试适应4条线,形成一个四边形的在下图。我的目的是获得四边形的顶点。 RANSAC将有助于确定线条,但在这一点上云上的多条线具有挑战性。 我很难用RANSAC来适应多条线。有人有想法或方法吗? 除了RANSAC之外,在这个场景中是否有任何获得多行的好方法? 另一种方法是对这些点进行四边形拟合。 PS:,我只知道它的4个线段,这是必需的。
浏览 7
提问于2020-08-12
得票数 1
1
回答
Gnuplot拟合方法
Gnuplot中的"Fit“使用哪种方法(算法)来拟合任何曲线?它如何计算拟合参数中的误差? 对方法或算法有一个粗略的想法就足够了。
浏览 6
提问于2018-08-13
得票数 1
回答已采纳
1
回答
在画布中绘制像素的多边形线拟合算法?
、
、
、
、
假设我创建了,允许在画布上自由地绘制任何我想要的东西,这样我就可以使用鼠标制作一幅写意的图片,如下所示: 是否有一种算法可以用于对这些绘制的像素进行一系列多线拟合?很明显,你需要能够选择你想要的准确程度,例如,折线可以有20分,也可以有1000个点,这样就相当准确了。 此外,我也不确定它将如何工作,因为绘制的“线”的宽度/厚度超过1 1px。就像你有一个很大的圆圈,直径是100 to,一个算法怎么能适应这条“线”呢? 这类算法是否有特定的名称,用于将点拟合到形状?
浏览 0
提问于2014-12-11
得票数 0
回答已采纳
2
回答
机器学习中的海量数据集
、
、
、
我有一个每天都在增长的数据集,我担心的是,它很快就会达到内存可能无法容纳的大小。我在我的应用程序中使用随机森林分类器和回归器。我听说过部分拟合,但我不知道是否可以这样做随机森林。如何确保应用程序不会中断并继续运行良好,即使数据集超出了内存大小。另外,如果使用svm而不是随机林,情况会有所不同吗?
浏览 22
提问于2016-12-26
得票数 3
2
回答
测量分类算法的性能
、
、
、
、
我手头有一个分类问题,我想用机器学习算法来解决这个问题(贝叶斯或马尔可夫,这个问题与要使用的分类器无关)。在给定大量训练实例的情况下,我正在寻找一种方法来衡量实现的分类器的性能,同时考虑到数据过拟合问题。 也就是说:给定N1..100个训练样本,如果我在每个样本上运行训练算法,并使用这些完全相同的样本来测量适应度,它可能会陷入数据过拟合问题-the分类器将知道训练实例的确切答案,而没有太多的预测能力,导致适应度结果无用。 一个显而易见的解决方案是将手工标记的样本分成训练样本和测试样本;我想了解选择统计上有意义的样本进行训练的方法。 白皮书,书籍指针,和PDF非常感谢!
浏览 3
提问于2009-01-02
得票数 8
回答已采纳
1
回答
通过增加训练数据大小来减少CNN中的过度拟合,而不是使用DataImageGenerator增强图像(预处理数据)
、
、
增加训练数据的大小是否有助于减少过拟合?或者建议使用Tensorflow中的ImageDataGenerator进行图像增强(数据预处理),以倾斜或旋转图像以减少过拟合?哪种方法更好地减少过拟合??
浏览 27
提问于2019-09-15
得票数 1
3
回答
参数的较小值如何有助于防止过度拟合?
、
为了减少机器学习中线性回归中的过拟合问题,建议通过引入参数平方来修正代价函数。这导致参数的值更小。 这对我来说一点也不直观。参数的较小值如何能导致更简单的假设并有助于防止过度拟合?
浏览 3
提问于2016-01-02
得票数 6
回答已采纳
1
回答
正规化如何防止过度适应?
、
、
我不明白如何将lambda的乘积和平方的thetas相加到成本函数中,以减少数据集中的过拟合量。谁能解释一下吗?
浏览 1
提问于2020-07-21
得票数 0
回答已采纳
2
回答
列车与试验误差的关系
、
、
、
、
我有一些特别的问题,我无法从书本中得到答案。因此,我在这里寻求帮助,如果可能的话,我将非常感谢一个直观的解释。 一般来说,神经网络有一个偏差/方差权衡,因此我们需要一个正则化。偏高->欠拟合;方差高-过拟合。 为了解决过拟合问题,我们采用正则化方法对权值进行对比。这是一个超参数,并应在培训期间学习,根据我的理解使用交叉验证。因此,数据集被分割成一个训练、验证和测试集。测试集是独立的,在学习过程中模型是看不到的,但是我们有可用的标签。基于该测试集,我们通常会报告假阳性、混淆矩阵、错误分类等统计数据。 ( Q1)这种偏差/方差问题是否也出现在其他算法中,如支持向量机、最小方差分析等? 在卷积
浏览 0
提问于2018-10-04
得票数 0
回答已采纳
1
回答
Matlab曲线拟合中的初始猜测与重范数问题
、
、
、
、
利用Matlab lsqcurvefit对非线性系统中的数据进行拟合,估计模型参数。 在这种拟合中,拟合在很大程度上取决于我对lsqcurvefit的最初猜测。 例如,如果我使用x0=5作为初始猜测,我将得到剩余范数为30,其中,如果我选择x0=5.2,则得到一个剩余范数为1.5。 1)剩余范数(resnorm)在Matlab中代表什么?这是平方误差之和吗?是否有一种方法可以决定resnorm的值范围是可接受的。 ( 2)当合适与否在很大程度上取决于最初的猜测时,是否有办法解决这些问题?我怎么知道是否可以从不同的最初猜测中得到更好的匹配呢? ( 3)在使用lsqcurvefit时,是否需要检查
浏览 0
提问于2018-04-10
得票数 1
回答已采纳
1
回答
如何避免过度拟合?
、
、
、
我的情况是: 我的训练准确率为93%。 CV准确率为55%。 测试准确度为57%。 我认为这是一个典型的过度拟合的例子。 据我所知,我可以使用正规化。我已阅读交叉验证也将有助于解决我的过度拟合问题。 我对此有一些疑问: 交叉验证是否仅用于超参数调整,还是在解决过度拟合问题方面发挥作用? 如果交叉验证解决了过度匹配的问题,如何解决? 交叉验证是否仅用作检验模型是否过拟合?
浏览 1
提问于2019-08-07
得票数 1
回答已采纳
2
回答
在Python中运行Fortran命令行程序
、
、
、
所以我有点为难。我正在尝试编写绘图和拟合扩展到需要命令行输入的Fortran77 (为什么这个程序用F77重写是一个谜,顺便说一句)代码,即它提示用户输入。目前该程序使用GNUplot进行绘图,但在我看来,GNUplot拟合例程并不理想,至少可以说,从Fortran调用GNUplot是一件很痛苦的事情。 我主要使用Numpy、Scipy和Matplotlib来满足我的拟合和绘图需求。我想知道是否有一种方法可以在Python语言中调用F77程序,然后让它像运行任何其他F77程序一样运行,直到我需要它的部分适合并显示一些漂亮的图形(不是GNUplot的东西)。 我知道F2PY,但我听说过一些好坏参
浏览 1
提问于2011-03-29
得票数 2
1
回答
用给定模型拟合曲线的算法
、
假设我有一组(x,y)数据点,我被告知,最能描述这些数据点的模型如下所示: 其中A,B,C和D是未知常数。其目的是为A、B、C和D找到一个基于某种质量度量(例如)的“最佳拟合函数”的值。 许多程序可以获取一系列数据点,并创建一个平滑的不同类型(多项式、指数等)的最佳拟合函数。它们的算法求解给定的(简单)模型中的系数,其中大多数曲线拟合算法都得到了合理的证明。但是,上面的函数(通常指的是“更复杂的”函数),如果没有一些自定义的编程,就不能适用于数据。 我的问题是:用于这种模型拟合的一些算法是什么? 我已经描述过的一个算法是,它在计算上非常昂贵。虽然我并不是说对于这类问题会有“廉价”算法
浏览 2
提问于2015-03-26
得票数 1
1
回答
如何识别Python中的过拟合和欠拟合
、
我有一个回归模型。我编写了这个算法的代码: 将训练数据随机分成10个,分为训练数据和验证数据。从下列集合中选择alpha的最佳值:{0.1、1、3、10、33、100、333、1000、3333、10000、33333}。 要选择最佳的alpha超参数值,必须执行以下操作: ·对超参数的每个值执行10次随机分割,将训练数据分解为上述训练和验证数据。 ·对于每一个超参数值,使用它的10个随机分裂,并求出平均训练和验证精度。 ·在图上,绘制平均训练精度(红色)和平均验证精度(蓝色)。每个超参数设置。通过识别过拟合和欠拟合区域来对此图进行注释。 ·打印α超参数的最佳值。 2-对试验数据的预测性能进行
浏览 0
提问于2018-09-03
得票数 0
回答已采纳
1
回答
如何在tensorflow中进行架构分析?
、
如果我用tensorflow写一个模型,可能是任何CNN或ANN。我想知道如何发现我的架构或模型中是否有问题。例如。如果我的模型拟合不足或过拟合。如何绘制学习曲线、验证曲线和训练曲线,以及如何分析它们以发现我应该做些什么来提高测试数据的准确性。如何在tensorflow.Any aproach中做所有这些事情,以便在tensorflow中做到这一点,并告诉一些提示,以便在特定模型中找到正确的错误?
浏览 13
提问于2018-09-01
得票数 0
1
回答
Python:如何适应von分布的混合?
、
、
我有一个角分布,我想把von分布的混合物拟合到 我怎么能这么做? 我在R,中找到了一个实现 我还发现,可以在Python,中安装一个von发行版。 我想,如果我已经在scipy中定义了函数,也许我可以尝试如何拟合混合分布? 最后,我使用rpy2解决了这个问题。具体而言,我使用Python清理数据,并使用R包对VMM进行培训(因此需要安装R和相关包)。
浏览 3
提问于2016-07-20
得票数 5
2
回答
logistic回归对测试数据不平衡与训练的不良分类性能
、
、
我试图将logistic回归模型拟合到高维(约15k)的不平衡数据集(0.5/99.5)。我用随机森林来选择最重要的200个特征。观测值在120 K左右。 当我对基于数据集的logistic回归模型进行拟合时(使用Smote进行过采样),在训练f1时,查全率和准确率都很好。但在测试中,精度分数和f1都很差。我认为这是有意义的,因为在培训中,少数人的案例要多得多,而在现实/测试中,只有很小的比例。因此,该算法仍在寻找更多的少数病例,造成了较高的假阳性率。 我在想我能用什么样的方法来提高性能呢? 我目前正在尝试不同的不平衡数据集的抽样方法,也计划尝试PCA。
浏览 0
提问于2017-03-27
得票数 7
回答已采纳
2
回答
Julia中的二维曲线拟合
、
、
我在Julia中有一个数组Z,它表示一个2D高斯函数的图像。也就是说,Z[i,j]是高斯在像素i,j处的高度。我想通过某种曲线拟合来确定高斯的参数(均值和协方差)。 我已经研究过各种适合Z的方法:我第一次尝试了Distributions包,但是它是针对不同的情况(随机选择的点)而设计的。然后我尝试了LsqFit包,但它似乎是为一维拟合量身定做的,因为当我试图拟合2D数据时,它会抛出错误,而且没有任何文档可以帮助我找到解决方案。 如何将高斯与朱莉娅的二维阵列相匹配?
浏览 0
提问于2018-12-10
得票数 3
1
回答
装箱中启发式算法与近似算法的区别
、
、
我正在阅读一维垃圾箱包装问题,以及可以用来解决这个问题的不同解决方案。 垃圾箱包装问题定义:给定一个对象及其权重的列表,以及一个固定大小的垃圾箱集合,找出最小数量的回收箱,以便将所有的对象分配给一个桶。 我正在研究的解决方案:下一次拟合、第一次拟合、最佳拟合、最坏拟合、第一次拟合递减、最佳拟合递减 我注意到,我读过的一些文章称这些为“近似算法”,而另一些文章称之为“启发式”。我知道近似算法和启发式算法有区别: 启发式:对于一些困难的问题,很难在一个很好的运行时间内得到一个可接受的解决方案,所以我们可以通过使用一些有知识的猜测或任意选择来得到一个“好”的解决方案。 近似算法:这给出了一个近似解,
浏览 2
提问于2018-05-14
得票数 1
回答已采纳
1
回答
fibonacci级数在软件范式中的应用
、
、
、
当我被问及如何描述应用程序 of Fibonacci系列时,我正在接受采访。 我知道Fibonacci系列用于某种基准测试,但我无法想出一个真正的软件/计算机应用程序。我试着研究过。我发现它们被用于Fibonacci堆,但我找不到任何明显的计算机科学应用程序。 请给出你的宝贵建议。
浏览 8
提问于2017-04-25
得票数 0
回答已采纳
1
回答
装箱-精确np-hard指数算法
、
、
、
、
我写了一个启发式算法为装箱问题使用最佳拟合方法,itens S=(i1,...,in),箱大小T,并希望创建一个真正的精确指数算法,它计算最优解(最小数量的箱来包装所有的iten),但我不知道如何检查每种可能的包装,我在C中做。 有人能告诉我我必须使用什么结构吗?如何测试itens的所有解组合?它必须是一个递归算法?有没有可能对我有帮助的书和文章? 对不起,我的英语不好
浏览 1
提问于2013-03-27
得票数 0
回答已采纳
1
回答
是否有任何基于树的模型使用遗传算法来生成树?
、
、
、
我有一个大型数据集(195个特征x2000万个样本),我已经使用XGBoost进行了培训。我想看看一种遗传算法是否能打败XGBoost,因为这些数据有太多的噪音,很容易被过度拟合。 我想使用一个基于树的模型,这样我就不需要标准化数据了,而且这些特性确实有一些相互关系。 有没有这样做的python包?Ie.that可以通过遗传优化过程创建树吗?
浏览 0
提问于2021-04-07
得票数 1
回答已采纳
1
回答
是否有可能在训练精度较低的情况下过度拟合?
我正在处理文档分类问题,并尝试应用基本的RNN/LSTM模型。 我制作了多层LSTM模型,并用15个时期进行了训练,但我获得了大约53%的训练准确率。41%的测试访问率。当我用更大的时代训练时,训练acc。增加和测试访问权限。下降到33%左右。 我知道如果测试访问。低于训练ac.,它可能是过拟合的。而过拟合的原因是,模型甚至训练了训练数据集的噪声。但我认为,如果发生了过度拟合,训练是可行的。必须是相当高的(80-90%)和测试访问。这比这要低得多,因为过拟合意味着模型对于训练数据集来说是“过拟合”的。 现在我想知道为什么当我用15个时期训练时,我的准确率降低了10%,而训练准确率只有53%。它
浏览 0
提问于2020-04-24
得票数 0
3
回答
OpenCV中的椭圆拟合算法
、
、
、
我在OpenCV中阅读了椭圆拟合的代码,下面的链接给出了OpenCV:中椭圆拟合的源代码。 我想知道关于椭圆拟合在OpenCV中的一些细节,但是我找不到算法的任何文档。在评论中,它说“由Daniel博士贡献的新的非椭圆算法”。但我找不到任何关于丹尼尔·韦斯博士椭圆拟合的论文。 我对算法有一些疑问: 为什么算法需要重新拟合。它首先适合参数A,然后重新拟合参数A与这些中心坐标. 椭圆需要满足4*a*b - c^2 > 0的约束条件,算法是如何满足的?
浏览 6
提问于2016-04-25
得票数 4
2
回答
包围一组点的三角形/圆
、
、
我有一组2D点。我想找到: 包围所有点的最小三角形 包围所有点的最小圆。 是否有任何算法可以这样做?我遇到凸赫尔来拟合一组点的凸多边形。但我想要一个圆圈和三角形。 提前感谢
浏览 4
提问于2014-03-16
得票数 10
5
回答
有没有什么东西只能通过递归才能实现?
、
我不确定,但我听说过一种只能通过递归实现的算法。有人知道这样的事情吗?
浏览 0
提问于2010-08-11
得票数 4
回答已采纳
1
回答
在链接器v2.0中如何确定学习网络中的层参数?
假设我在其他数据库上预先训练了网络。由于过拟合问题,我的数据库不是很多样化,所以过拟合问题非常严重。 在处理前几层时,我应该在def __call__中使用chainer.no_backprop_mode():吗?
浏览 1
提问于2017-10-23
得票数 0
2
回答
用巨蟒进行智能拟合
、
、
在Python中有比scipy.optimize.curve_fit更智能的函数吗?我还需要定义一个函数来适应数据。 我花了很长时间试图用它来拟合数据。我只能拟合基本的函数,用分段函数拟合两条线是不可能的,而y轴的值很低,比如0.01-0.05,x轴值像20-60。我知道我必须插入初始值,但它仍然需要太多的时间,有时它不起作用。 编辑 我添加了我所安装的数据所在的图形,您可以看到在scipy.optimize.curve_fit中改变边界的效果。 我所适合的功能是: def abslines(x,a,b,c,d): return np.piecewise(x, [x < -b/a
浏览 1
提问于2016-12-02
得票数 2
1
回答
‘'fitnlm’或'lsqcurvefit‘用于非线性最小二乘回归?
、
我试图用最小二乘法将实验数据拟合到一个三次多项式方程中。我有两个自变量和一个因变量,这使得它是非线性拟合。我已经用函数'fitnlm‘和'lsqcurvefit’计算了系数,这两个函数都推荐用于非线性回归拟合。我从这两个函数中获得了不同的系数值,尽管我输入了相同的初始系数(猜测)值。请告知这两个函数中哪一个更好,以及我可以信任谁的系数。还有,使用lsqcurvefit时,如何检查均方根误差的值?非常感谢您的帮助/建议/有用的评论。
浏览 0
提问于2014-03-21
得票数 1
1
回答
在插入符号R中获取CV错误和训练错误
、
、
、
我将我的数据集分为训练集和测试集。在训练集上,我使用了10折交叉验证。这应该给出平均CV_train误差和平均CV_validation误差。查看CV_train和CV_validation误差的平均值将给出我是否过拟合/欠拟合的指示。但我似乎只得到了CV_validation的平均误差 library(caret) train.control <- trainControl(method="cv", number=10, returnResamp="all", savePredictions="final") model <-
浏览 33
提问于2020-07-12
得票数 0
3
回答
梯度增强vs随机林
、
、
根据我的理解,RF随机选择功能,因此很难过火。但是,在滑雪板上,梯度提升也提供了max_features的选项,可以帮助防止过度拟合。那么,为什么有人会使用随机森林?谁能解释什么时候使用梯度增强与随机森林基于给定的数据? 任何帮助都是非常感谢的。
浏览 11
提问于2017-09-13
得票数 3
1
回答
统计术语:“算法”是“模型”的同义词吗?
、
、
、
我有个术语问题。在统计学中,“算法”是“模型”的同义词吗?例如,当我拟合一个带有变量的广义线性模型,并为特定目的调整模型参数时,我是否可以报告我“开发了一个算法”,或者这是一个错误的陈述?如果是的话,我所做的最好的描述是什么?开发了模型/安装了模型/建立了模型.?
浏览 7
提问于2022-08-24
得票数 1
1
回答
适合数据集的幂函数
、
、
我有一组数据(以ArrayCollection格式),在以LineChart格式显示之前,我需要对它拟合一个幂函数{ f(x)= B+ x^alpha }。因此,我需要alpha和B参数。 如何使用Flex做到这一点?
浏览 2
提问于2010-06-06
得票数 0
回答已采纳
1
回答
SKLearn KernelRidge内存需求
、
、
、
我正在使用SKLearn KernelRidge来拟合一个有10万个样本x10个特性(6个ints和4个浮点数)的模型: model = KernelRidge(kernel='linear') 查看任务管理器,'Python‘流程需要40 at。 你能解释一下为什么有这么高的需求吗?在背景中建立什么样的矩阵?
浏览 0
提问于2018-03-07
得票数 1
2
回答
如何检查weka中该模型的数据是否过多
、
我的原始数据集有500个实例,有10个类,并且存在类不平衡 为了减少类不平衡,我使用了过采样技术,我的新数据集有1500个实例和10个类。 对于原始数据集,我应用了j48分类器,获得了63%的准确率 对于新的样本数据集,我应用了j48分类器,并获得了75%的准确率。 我的问题是,我怀疑我的数据对于分类器来说是过度拟合的。 如何检查数据是否过拟合以及如何减少过拟合
浏览 0
提问于2013-08-22
得票数 0
1
回答
CatBoost解决了点态梯度估计中的偏差问题
、
、
我一直在读以下的文章:https://arxiv.org/abs/1810.11363,https://arxiv.org/abs/1706.09516和https://www.researchgate.net/publication/318030603_格斗_偏倚_使用_动态_助推。如果我正确理解,CatBoost解决了点态梯度估计中的偏差问题: 预测模型F的建立依赖于所有训练实例的目标。我们证明,这实际上导致了训练示例x_k的x_k分布与测试示例x的F(x)|x分布发生了变化。这最终导致了学习模型的预测转变。 和 所有经典的boosting算法都会由于有偏的点态梯度估计问题而受到过拟合的
浏览 0
提问于2022-08-04
得票数 0
3
回答
合并数据进行线性拟合的算法?
、
、
、
我不确定这是不是最好的地方,但是你们在过去的CS作业中帮了我很多忙,所以我想我会试一试。 我正在寻找一种算法,可以盲目地将几个因变量组合成一个索引,以产生与外部变量的最佳线性拟合。基本上,它将使用不同的数学运算符组合因变量,包括或不包括每个变量,等等,直到开发出与我的外部变量最相关的索引。 以前有没有人见过/听说过这样的事情?即使你能给我指明正确的方向,或者去正确的地方提问,我也会非常感激。谢谢。
浏览 4
提问于2012-06-29
得票数 3
扫码
添加站长 进交流群
领取专属
10元无门槛券
手把手带您无忧上云
相关
资讯
过拟合的成年人
概念理解:通俗的“过拟合与欠拟合”直观解释
什么是机器学习模型的过拟合?
吴恩达ML课程03_欠拟合与过拟合的概念
避免神经网络过拟合的5种技术
热门
标签
更多标签
云服务器
ICP备案
实时音视频
对象存储
即时通信 IM
活动推荐
运营活动
广告
关闭
领券