首页
学习
活动
专区
工具
TVP
发布
精选内容/技术社群/优惠产品,尽在小程序
立即前往

ICDM’21 | ACE-HGNN:自适应曲率探索的双曲图神经网络

为了能够为HGNNs自适应的探索到合适的双曲嵌入空间,我们首次引入了强化学习的学习框架到HGNNs中,提出了ACE-HGNN自适应曲率探索的双曲图神经网络,根据输入图和下游任务自适应学习最优曲率。...在双曲几何中,双曲空间的曲率是几何空间弯曲的度量,不同的曲率可以控制双曲几何流形来近似图的不同程度树状/层次结构(如下图)。...最优曲率问题:现有的工作对于曲率选择主要有两种方式。将曲率作为超参数,启发式的使用经验或利用采样估计算法估计;将曲率直接作为神经网络参数在训练过程中学习。...双曲几何中的曲率与图的层次结构 双曲几何嵌入在复杂网络领域中已经被广泛研究和应用,一个双曲几何空间(流形)能够直接理解为一颗连续近似的树,其中曲率度量了这个弯曲流形(双曲空间)的弯曲程度。...傅星珵 fuxc@act.buaa.edu.cn 北京航空航天大学计算机学院 大数据科学与脑机智能高精尖创新中心 研究兴趣 图数据挖掘,图表征学习,复杂网络

1.6K60
  • 您找到你想要的搜索结果了吗?
    是的
    没有找到

    每日一问之鞍点(saddle point)

    在数学中,鞍点或极小值点是函数图形表面上的一个点,其正交方向上的斜率(导数)均为零(临界点),但不是函数的局部极值。一句话概括就是: 一个不是局部极值点的驻点称为鞍点。...函数 z 的整个曲面看上去就像是一个马鞍,其在 x 轴方向向上曲,在 y 轴方向向下曲。所以这也是鞍点这个名字的由来。 ? 附上一张吴恩达大大的画作,哈哈。 ?...在数学中,Hessian 矩阵是标量值函数或标量场函数的二阶偏导数的方块矩阵。它描述了许多变量函数的局部曲率,可以用于判定多元函数的极值。...如果其所有的二阶偏导数都存在,并且在该函数的领域上连续,那么 Hessian 矩阵 H 是一个 n×n 的矩阵,通常如下定义: ?...所以,一个简单标准的方法验证一个静止点是否为一个实数函数的鞍点,就是计算该函数的在该点上的 Hessian 矩阵。如果该 Hessian 矩阵为不定的,则该点为该函数的鞍点。

    4.4K11

    计算机视觉中的曲率尺度空间技术

    看到一篇文章《计算机视觉中的曲率尺度空间技术: 基本概念与理论进展》——钟宝江,对于尺度空间的理解很有帮助,遂贴部分内容在此,如果涉及侵权,请告知,我会马上删除。...1 引言 尺度是计算机视觉与图象处理领域的一个重要概念。...由此构造了一款典型的非线性尺度空间技术。作为尺度空间技术的重要特例,曲率尺度空间技术以二维物体或三维物体的二维视觉为研究对象,以曲率特征点为工具对物体的形状进行描述和分析。...左边的角一方面具有较小的角度值(因此更尖锐),另一方面又具有较小的曲率值(因此更圆钝)。右边的角情形刚好相反,一方面因为具有较大的角度值更圆钝,另一方面又因为具有较大的曲率值显得更尖锐。...图2(a)呈现了一片雪花的形状轮廓,要求我们找出该形状上的角点。在很多计算机视觉任务中,角点都有着重要的作用。数学上,角点一般是指大曲率点或曲率无穷大点。

    64920

    定积分在曲线长度中的基本概念

    这篇文章又是一篇随笔,不过更看上去是散装文学(不算文学),终于熬到这里了,这里的概念不像前面的理论,需要计算的那么多,但是数形结合的地方很多。...很多图都是马同学的,我买了课就拿来一用了~ 下面是之前学的关于数学的文章: 矩阵乘法观点-几何含义 二阶导数标记问题 定积分-黎曼和的极限 统计学-随机变量 蒙特卡洛计算PI(距离公式)+蒙特卡洛计算定积分...反函数有的地方还有这个: 反函数求导,就是原导数分之一,还有二阶导的死样子 函数的微分(英语:Differential of a function)是指对函数的局部变化的一种线性描述。...使用弧长来推导⚪的曲率,也就是说曲率可以通过一维曲率公式(即弧长除以弧长上的距离)计算。...一维曲率(One-dimensional Curvature):曲线上的曲率。 二维曲率(Two-dimensional Curvature):曲面上的曲率。

    9010

    网格测量

    原文链接 测地距离是什么 测地曲率:曲面上的曲线有一个曲率向量。这个向量往曲面的法线做投影,得到的投影向量就是法曲率向量;往曲面的切平面做投影,得到向量就是测地曲率向量,这个向量的大小就是测地曲率。...比如一张平面上的直线的测地曲率为0,法曲率为0,如果把这张纸弯曲成圆柱,纸上的直线在三维空间就弯曲了,但是测地曲率还是为0。 测地线:测地曲率为0的曲线就是测地线。...---- 曲率 曲率有很多种类,如高斯曲率,平均曲率,测地曲率,法曲率,主曲率等等。 测地曲率,法曲率:属于曲线曲率概念。曲面上的曲线有一个曲率向量。...我认为它并不是特指某类曲率,可能max(各类曲率)和它比较接近。比如一般认为圆柱也有非零曲率值,因为它的最大主曲率非零。 ---- 曲率相关的测地线 有时候,用户需要测地线能吸附到特征边上。...具体计算的时候,数据统一到同一个单位系统就可以了。比如1米+1毫米,可以是(1000+1)毫米,也可以是(1+0.001)米。

    1.3K31

    Jacobin和Hessian矩阵

    有时我们需要计算输入和输出都为向量和函数的所有偏导数。包含所有这样的偏导数的矩阵被称为Jacobian矩阵。具体来说,如果我们有一个函数 , 的Jacobian矩阵 定义为 。...它表示只基于梯度信息的梯度下降步骤是否会产生如我们预期那样大的改善,因此它是重要的,我们可以认为,二阶导数是对曲率的衡量。...假设我们有一个二次函数(虽然实践中许多函数都是二次的,但至少在局部可以很好地用二次近似),如果这样的函数具有零二阶导数,那就没有曲率,也就是一条完全平坦的线,仅用梯度就可以预测它的值。...这是因为单变量的二阶导数测试在零特征值对应的横截面上是不确定的。多维情况下,单个点处每个方向上的二阶导数是不同的。Hessian的条件数衡量这些二阶导数的变化范围。...梯度下降不知道导数的这种变化必须足够小,以免冲过最小而向具有较强曲率的方向上升。这通常意味着步长太少,以至于在其他较小的曲率的方向上进展不明显。

    1.8K20

    理解计算:从根号2到AlphaGo 第5季 导数的前世今生

    在柯西之前,数学家们凭借着直觉和聪明才智取得了重大成就,在他之后,微积分的逻辑标准逐渐严格,从字面上看,分析学变得更加枯燥和不容易理解,同时也更加完备,无论是初学者还是数学家,几乎丧失了质疑的勇气。...这里无穷小的使用看起来字面上与牛顿的无穷小量和莱布尼茨的dx没有区别, 但是此时的无穷小已经建立在极限为零的概念之上了,这是微积分严格化历史上最为重要的工作之一。即连续性实际上是指 ?...今天我们熟悉的高等数学中很多的名词,“微分”,“积分”,“函数”,“级数”,“极大”,“极小”,“方程式”,“全微分”,“曲率“,”曲线”以及“横轴纵轴”等大都来自于这本创世的译作。...尽管当时电子计算机那时刚刚来到这个世界。从理论上而言,导数已经变得不在让人不安。计算导数的任务则像其他繁琐的事务一样,开始由人工转向借助于计算机了。我们逐渐清楚的了解了导数的历程。...因此更多的时候,这个算法并不用来直接进行计算导数,而是用来检验其他算法计算出的导数的正确性。用导数的定义来验证导数计算的准确性,应该没有比这更好方法了吧!

    1.3K10

    《深度揭秘!海森矩阵如何左右梯度下降算法》

    假设我们有一个需要优化的目标函数,对于这个函数中的每一个参数,我们都可以计算出它的偏导数,这些偏导数组成的向量就是梯度。...例如,在一个简单的单变量函数中,我们可以通过计算函数在某一点的导数,然后让当前点沿着导数的反方向移动,来逐步降低函数值。...在多变量的情况下,原理也是类似的,只不过我们需要计算每个变量的偏导数,组成梯度向量来指导移动方向。二、海森矩阵的神秘面纱海森矩阵是一个二阶偏导数矩阵,它包含了目标函数对所有变量的二阶偏导数信息。...具体来说,如果函数有n个变量,那么海森矩阵就是一个n乘以n的矩阵,矩阵中的第i行第j列的元素是函数对第i个变量和第j个变量的二阶偏导数。海森矩阵提供了关于函数曲率的重要信息。...通过计算海森矩阵并判断其正定性,我们可以提前了解函数的凸性,从而对梯度下降算法的收敛性有一个初步的判断。(2)优化搜索方向在标准的梯度下降算法中,我们仅仅根据梯度的反方向来确定搜索方向。

    6100

    梯度下降及其优化

    有时我们通过计算,选择使用方向导数消失的步长。还有一种方法是根据几个 计算 ,并选择其中能产生最小目标函数值的 。这种策略称为在线搜索。...它表示只基于梯度信息下降步骤是否会产生我们预期的那样大的改善,因此它是重要的。我们可以认为,二阶导数是对曲率的衡量。...假设我们有一个二次函数(虽然很多实践中的函数都可以认为,二阶导数至少在局部可以很好地用二次近似),如果这样的函数具有零二阶导数,那就没有曲率,也就是一条完全平坦的线,仅用梯度就可以预测它的值。...当所有非零特征值是同号的且至少有一个特征值是0时,这个函数就是不确定的。这是因为单变量的二阶导数测试在零特征值对应的横截面上是不确定的。多维情况下,单个点处每个方向上的二阶导数是不同的。...梯度下降不知道导数的这种变化,所以它不知道应该优化探索导数长期为负的方向。病态条件也导致很难选择适合的步长。步长必须足够小,以免冲过最小而向具有较强正曲率的方向上升。

    1.6K30

    深度学习优化入门:Momentum、RMSProp 和 Adam

    这个区域就是所谓的病态曲率。为了了解为何将其称为病态曲率,让我们再深入研究。放大了看,病态曲率就像这样... 要知道这里发生的事情并不难。梯度下降沿着峡谷的山脊反弹,向最小的方向移动的速度非常慢。...二阶导数可以帮助我们做到这一点。 1牛顿法 梯度下降是一阶优化方法。它只考虑损失函数的一阶导数,而不考虑更高阶的导数。这基本上意味着它不知道损失函数的曲率。...使用二阶导数,或者考虑梯度变化的速率。 一个非常流行的可以使用二阶导数的技术,可以解决我们的问题,这个方法称为牛顿法。 如果表面变得不那么陡峭,那么学习步骤就会减少。...牛顿法通过计算 Hessian 矩阵来实现,Hessian 矩阵是损失函数的二阶导数组成的权值组合。我所说的权值组合,如下所示。 Hessian 矩阵在一个大矩阵中计算所有这些梯度。...我们计算了每个梯度分量的指数平均和梯度平方指数平均(方程 1、方程 2)。

    17010

    暑期追剧学AI | 十分钟搞定机器学习中的数学思维(二)

    这类方法要求我们计算二阶导数。一阶导数告诉我们,函数在某一点上是趋于增加还是减少。二阶导数则告诉我们,一阶导数的增减情况。 通过一阶优化法,我们可以得到一条经过误差曲面上某一点的切线。...而通过二阶法则可以得到一个二次曲面,该曲面与误差曲面的曲率相吻合。 二阶法的优点就在于,它们不忽略误差曲面的曲率。...然后我们计算初始x点的二阶泰勒级数,并计算出它的最小值。这是通过求出一阶导数和二阶导数,并使它们为零实现的,为了找到最小的x值,我们对这个过程进行迭代。...但是有两点不同,我们将一阶导数替换成梯度,将二阶导数替换成海森矩阵,海森矩阵是一个标量的二阶偏导数的矩阵,用来描述多元函数的局部曲率。...二阶法适用范围 通常一阶方法的计算量和耗时比较少,当计算大型数据集时一阶收敛非常快,当二阶导数已知并且很容易计算的时候,二阶方法会更快。 但是二阶导数通常很难算,需要极大的计算量。

    45020

    深度学习优化算法入门:二、动量、RMSProp、Adam

    二阶导数可以帮助我们做到这一点。 牛顿法 梯度下降是一阶优化方法。它只考虑损失函数的一阶导数,不考虑高阶函数。基本上这意味着它对损失函数的曲率一无所知。...梯度下降可以告诉我们损失是否下降,下降得有多快,但无法区分曲线的的弯曲程度。 ? 上图三条曲线,红点处的梯度都是一样的,但曲率大不一样。解决方案?考虑二阶导数,或者说梯度改变得有多快。...牛顿法可以提供向梯度方向移动的理想步幅。由于我们现在具备了损失曲面的曲率信息,步幅可以据此确定,避免越过病态曲率的底部。 牛顿法通过计算Hessian矩阵做到这一点。...Hessian矩阵是损失函数在所有权重组合上的二阶导数的矩阵。 ? Hessian提供了损失曲面每一点上的曲率估计。正曲率意味着随着我们的移动,损失曲面变得不那么陡峭了。...负曲率则意味着,损失曲面变得越来越陡峭了。 ? 注意,如果这一步的计算结果是负的,那就意味着我们可以切换回原本的算法。这对应于下面梯度变得越来越陡峭的情形。 ?

    2.7K10

    微积分(六)——一元函数微分学

    文章目录 前言 (一)一元函数微分学基础 1)讨论导数与微分的概念 2)导数与微分的计算 (二)导数的应用 1)通过导数定义的属性 2)通过导数计算的属性 3)与导数间接相关的属性...、常用n阶导数公式、级数 ) (二)导数的应用 当充分理解什么是导数后,我们重新回到函数部分,思考导数在函数的计算和性质中可以有什么应用。...所以标题为导数的应用,也可以称为函数的性质。 导数在大纲中有以下应用: 极值、最值、单调性、凹凸性、拐点、驻点、渐进线、曲率、曲率半径、曲率圆、画出函数草图。...其中,拐点与驻点是通过导数定义的属性。 极值、单调性、凹凸性、曲率、曲率半径、曲率圆是本来有自己的定义,但通常需要用导数来计算和确定的属性。 最值和渐近线是间接和导数有关系的属性。...2)通过导数计算的属性 单调性:判断函数单调性,首先便是导数。之后通过讨论或者变形判断区间上的导数的正负性。 极值:最准确确定极值的方法是通过极值的定义。

    1K30

    自然梯度优化详解

    然而,这只是损失的一阶导数,它没有告诉你曲率的任何信息,或者说,一阶导数变化的有多快。...曲率 现代梯度下降的一大奇迹是它是用一阶方法完成的。一阶方法只计算要更新的参数的导数,而不是二阶导数。对于一阶导数,你所知道的就是(多维形式)一条在特定点与曲线相切的直线。...你不知道切线的变化有多快:二阶导数,或者更具描述性的是,函数在任何给定方向上的曲率水平。...这种精度来自这样一个事实:自然梯度的每一步需要更长的时间,因为它需要计算费希尔信息矩阵,记住,这是存在于n_参数平方空间中的一个量。事实上,这种急剧的减速类似于计算真实损失函数的二阶导数所引起的减速。...我从来没有决定性地发现计算对数似然费希尔矩阵是否比计算损失函数的黑森系数更有效(如果是的话,那就是自然梯度是获取损失表面曲率信息的更便宜的方法的论据)。

    1.7K10

    LOAM论文和程序代码的解读

    左图为平面点云的例子,其中有的点在直线上有的位于边角上,我们计算各点处的曲率。为了直观地展示曲率的大小,我用直线表示在各个点上,直线高度与曲率c cc成正比,如右图所示。...越尖锐的点曲率越大,在直线上的点曲率则是0。 第二个例子是由光滑的曲线轮廓生成的点云,如下图所示,这时计算的曲率如右图所示,同样是曲率越大的地方直线越高。这两个例子证明我们对上面公式的理解是正确的。...特征点分为两类,对于角点,一般在转折线上(例如卧室里的墙角),要计算它到折线的距离;对于平面点,一般在比较平坦的表面上(例如墙面),要计算它到平面的距离。...不管用哪种方法,都需要计算目标函数的雅克比矩阵,这个是最繁琐的一步。雅克比矩阵由一阶导数构成,求导数可以采用数值法,也可以用解析法。...然后在直线上取两个点利用前面的公式计算角点到直线的距离,在平面上取三个点计算平面点到平面的距离。

    89540

    深度学习优化入门:Momentum、RMSProp 和 Adam

    也许我们想要的是能让我们慢慢进入病态曲率底部的平坦区域,然后在最小值的方向上加速。二阶导数可以帮助我们做到这一点。 牛顿法 梯度下降是一阶优化方法。...它只考虑损失函数的一阶导数,而不考虑更高阶的导数。这基本上意味着它不知道损失函数的曲率。它只能说明损失是否下降以及下降的速度,而不能区分曲线是平坦的,向上的,还是向下的。 ?...由于我们现在有了关于损失表面曲率的信息,所以可以选择步长,而不是用病态曲率来超过该区域的极限。 牛顿法通过计算 Hessian 矩阵来实现,Hessian 矩阵是损失函数的二阶导数组成的权值组合。...我所说的权值组合,如下所示。 ? Hessian 矩阵在一个大矩阵中计算所有这些梯度。 ? Hessian 矩阵给出了一个点的损失曲面曲率的估计。...我们计算了每个梯度分量的指数平均和梯度平方指数平均(方程 1、方程 2)。

    70100

    深度学习优化入门:Momentum、RMSProp 和 Adam

    也许我们想要的是能让我们慢慢进入病态曲率底部的平坦区域,然后在最小值的方向上加速。二阶导数可以帮助我们做到这一点。 牛顿法 梯度下降是一阶优化方法。...它只考虑损失函数的一阶导数,而不考虑更高阶的导数。这基本上意味着它不知道损失函数的曲率。它只能说明损失是否下降以及下降的速度,而不能区分曲线是平坦的,向上的,还是向下的。 ?...由于我们现在有了关于损失表面曲率的信息,所以可以选择步长,而不是用病态曲率来超过该区域的极限。 牛顿法通过计算 Hessian 矩阵来实现,Hessian 矩阵是损失函数的二阶导数组成的权值组合。...我所说的权值组合,如下所示。 ? Hessian 矩阵在一个大矩阵中计算所有这些梯度。 ? Hessian 矩阵给出了一个点的损失曲面曲率的估计。...我们计算了每个梯度分量的指数平均和梯度平方指数平均(方程 1、方程 2)。

    46740

    深度学习优化入门:Momentum、RMSProp 和 Adam

    也许我们想要的是能让我们慢慢进入病态曲率底部的平坦区域,然后在最小值的方向上加速。二阶导数可以帮助我们做到这一点。 牛顿法 梯度下降是一阶优化方法。...它只考虑损失函数的一阶导数,而不考虑更高阶的导数。这基本上意味着它不知道损失函数的曲率。它只能说明损失是否下降以及下降的速度,而不能区分曲线是平坦的,向上的,还是向下的。...由于我们现在有了关于损失表面曲率的信息,所以可以选择步长,而不是用病态曲率来超过该区域的极限。 牛顿法通过计算 Hessian 矩阵来实现,Hessian 矩阵是损失函数的二阶导数组成的权值组合。...我所说的权值组合,如下所示。 Hessian 矩阵在一个大矩阵中计算所有这些梯度。 Hessian 矩阵给出了一个点的损失曲面曲率的估计。...我们计算了每个梯度分量的指数平均和梯度平方指数平均(方程 1、方程 2)。

    52440
    领券