首页
学习
活动
专区
工具
TVP
发布
精选内容/技术社群/优惠产品,尽在小程序
立即前往

优化与拟合在工程测量中的解读

公众号文章满百篇庆典文

篇之际,我们讨论工程测量中重要的话题:优化与拟合。这两个概念在统计学中占据重要地位,同时对测量理论产生深远影响。曾经看过一个武汉大学大师级讲课视频,说测量误差理论来源于统计学,又反作用于统计学。要深入学好工程测量,优化与拟合的概念不可不了解。(本文有点长,大约需要20分钟阅读理解)

01

优化与拟合

优化:采取一定措施使变得优异。为了更加优秀而“去其糟粕,取其精华”;为了在某一方面更加出色而去其糟粕;为了在某方面更优秀而放弃其他不太重要的方面;使某人/某物变得更优秀的方法/技术等;在计算机算法领域,优化往往是指通过算法得到要求问题的更优解。(来自百度百科)

从优化的定义可以看出,优化的本质特征是“去粗存精”,使优化的对象更合理、更优异。在统计学里,有很多优化的方法,比如线性回归和非线性回归以及各种估计。

拟合:拟合与插值以及逼近是数值分析的三大基础工具,通俗意义上它们的区别在于:拟合是已知点列,从整体上靠近它们;插值是已知点列并且完全经过点列;逼近是已知曲线,或者点列,通过逼近使得构造的函数无限靠近它们。常用的拟合方法如最小二乘法等。(来自百度百科)

两者有相同之处,即获得一个最优(或次优)的目标。但两者还是有区别的,区别在于“去”,优化有“去”这个过程(数学中0并不是没有意义),而拟合则没有。拟合讲究整体逼近,不管总体样本里是否有粗差,如我们使用大量的点去拟合直线,不管各点离散程度如何,总是可以找到一个最优解。但优化不同,优化有“去”的过程,为了直线优化更趋合理,优化要把一些不合理的点“去”掉,保留强特征信息,去掉弱特征信息,剩下的点再次拟合,直到符合某个目标为止。

如果用质量管理中PDCA循环来比喻,优化便是有限个循环,而拟合只是优化过程中的一种手段,可以有也可以没有,或者使用其他方法和手段。

优化和拟合都可以表现为算法,从定义上分析,拟合小于等于优化,优化大于等于拟合。

02

优化与拟合在GPS-RTK参数计算中的表现

GPS-RTk参数计算过程中,拟合表现在将大量的公共点使用最小二乘法的方法计算出整体最靠近的“参数”(不管四参数还是七参数),而优化是发现拟合的参数不能适应我们需要或导致测量误差过大而去掉一些参与拟合的点再次拟合参数的循环过程。

03

拟合残差

残差可以广义的理解为源数据到拟合模型之间的最短距离,即靠近程度。拟合不同于插值,插值要求源数据全部位于模型上,拟合要求整体“靠近”,注意是整体,不是单个或部分源数据“靠近”模型。

因此,怎么算整体靠近?最小二乘法规则是要达到残差的平方和最小,这是最小二乘法的定义,一两百年来被大量有效应用。有没有最小二乘法之外的拟合办法?是有的,有兴趣请查阅相关数学知识......学习才让人感到学海真的无涯。

04

残差在优化中的浮动

残差不会在拟合中浮动变化,拟合确定,则残差被固定下来,所有残差的平方和达到最小(假设采用最小二乘法),但如果存在优化过程(有“去”的过程),则再度拟合后的残差会发生浮动,原来大的,可能变小,原来小的,可能变大。如下图所示:

图中点A在第一次拟合时残差很小,接近0,在去掉点D后,拟合直线发生变化,点A的残差变大,但明显直线更趋于合理。如果进行第三次拟合,点A的残差仍然会发生变化。这在优化过程中是正常现象。

这告诉我们,在实践中,盯住某个残差变大便认为优化不合理是不正确的,优化的目的不是使残差变小,而是使直线拟合更趋合理。

05

优化的原则

我们怎么才能知道优化过程中怎么“去”?这是一个比较复杂的问题,单纯的用高斯正态分布去判断不一定正确,大于2倍或3倍中误差的点不一定就是要去掉的噪声点,这些点也很有可能是本征点。

上帝在冥冥之中给了这些数据一个特征,这个特征就是数据点集的本来面目或者规律,优化的目的是去掉干扰,如图像处理中去掉噪声点,使图像还归本来面目。矩阵特征值是判断噪声点的有效办法,特征值越小的离本来面目越远,因此,保留特征值大的点,去掉特征值小的点也是优化中一个有效的办法。

过优化欠优化。过度优化或优化不足都会使优化目标不符合本来特征,举个简单的例子:如4中的直线优化,如果不去掉噪声点,则优化不足,而去掉过多的点,则过度优化,都会失去本来特征。

优化不能以残差的大小或残差平方和大小来作为优化的终止条件,而应以优化目标是否符合使用需求或期望来判断。如上例中,如果只留下两点,则残差或残差平方和都为零,但显然不符合我们的期望结果。

06

GPS-RTK的参数优化

我们计算GPS-RTK的参数,期望的是参数能满足测量精度的要求,而不是期望参数计算的残差最小。这是很多测量人员容易忽略的问题或者错误的问题判向。我们往往以所有待用的控制点(包括未参与参数计算的控制点)在参数作用下最大放样误差能够满足要求为参数优化的结束条件。

GPS-RTK的参数优化在实际应用中十分复杂,由于待用点(满足控制网等级要求的点)不一定都具有WGS84坐标静态成果(使用静态成果计算参数远远好于使用动态成果,请参与本公众号《

GPS-RTK原理大揭秘

》),即便具有,静态和动态环境因素并不相同,我们需要的是动态环境下参数作用结果。因此,参数验证成为参数优化的必然手段。

参数在动态环境下验证是不是与提倡使用静态成果计算七参数相矛盾?完全不是。静态成果计算参数相当于在一堆规则(少量噪声)的数据中寻找规律,如果使用动态成果计算参数则相当于在一堆噪声数据中寻找规律,谁更合理?这是抄近路完成拟合的目标。而参数优化需要在动态环境的条件,目标是所有待用的控制点在参数作用下最大放样误差能够满足要求。两者的目标完全不同。

请关注工程测量之家公众号,在以后的文章里我们会介绍更多的工程测量技术应用,让我们一道走在熟手的成长征途中。识别图中二维码,关注“工程测量之家”公众号。

如果您认为这篇文章对您有帮助,请在下方点赞。

  • 发表于:
  • 原文链接https://kuaibao.qq.com/s/20180604G036N800?refer=cp_1026
  • 腾讯「腾讯云开发者社区」是腾讯内容开放平台帐号(企鹅号)传播渠道之一,根据《腾讯内容开放平台服务协议》转载发布内容。
  • 如有侵权,请联系 cloudcommunity@tencent.com 删除。

扫码

添加站长 进交流群

领取专属 10元无门槛券

私享最新 技术干货

扫码加入开发者社群
领券