在Tensorflow中argsort函数是可微的吗？

argsort 函数在 TensorFlow 中用于返回数组（张量）中元素按升序排列的索引。然而，argsort 本身是不可微的（non-differentiable），因为它涉及到排序操作，而排序操作不是一个连续可微的函数。

基础概念

argsort: 返回数组中元素按升序排列的索引。
可微性: 在深度学习中，一个函数是可微的意味着它的梯度可以计算，这对于使用反向传播算法进行优化至关重要。

应用场景

排序: 对数据进行排序。
选择: 选择最大或最小的 k 个元素。
索引操作: 根据排序后的索引进行进一步的数据处理。

为什么 `argsort` 不可微？

排序操作本身是不可微的，因为它涉及到非连续的跳跃操作。例如，对于一个数组 [3, 1, 2]，排序后的结果是 [1, 2, 3]，这个过程是不可微的。

解决方案

如果你需要在神经网络中使用 argsort 并且希望它是可微的，可以考虑以下几种方法：

Softmax + Argmax: 使用 softmax 函数将输出转换为概率分布，然后使用 argmax 获取最大值的索引。这种方法在某些情况下可以近似实现可微的排序。
Softmax + Argmax: 使用 softmax 函数将输出转换为概率分布，然后使用 argmax 获取最大值的索引。这种方法在某些情况下可以近似实现可微的排序。
Gumbel-Softmax: 这是一种在离散选择中实现可微近似的方法。通过引入 Gumbel 分布，可以在训练过程中实现可微的排序。
Gumbel-Softmax: 这是一种在离散选择中实现可微近似的方法。通过引入 Gumbel 分布，可以在训练过程中实现可微的排序。
使用其他可微排序方法: 有一些研究工作提出了可微排序的方法，例如 Differentiable Sorting Networks 等。

参考链接

通过这些方法，你可以在一定程度上实现可微的排序操作，从而在神经网络训练中使用 argsort。

在Tensorflow中argsort函数是可微的吗？

、

我的意思是，我可以将它包含在损失函数中，并正确地使用autodiff函数吗？ raw_ops文档(https://www.tensorflow.org/api)中没有列出sort或argsort。

浏览 30提问于2021-05-11得票数 1

回答已采纳

1回答

Tensorflow函数中用作Keras自定义丢失的异常

、

批次大小是256。tf.map_fn(lambda x: in_top_k_loss_single(x[0], x[1]), (y_true, y_pred), dtype=tf.float32)) 其中in_top_k_loss是我在Keras模型中的自定义丢失函数。当我用不同的输入(甚至是棘手的输入)分别测试它们时，这些函数似乎可以工作。似乎只有Keras有问题--可能需要不同的数据类型

浏览 0提问于2017-04-20得票数 2

回答已采纳

1回答

Tensorflow哪些操作是可微的，哪些是不可微的？

在Tensorflow中，很难判断一个函数是否可微。例如，tf.argmax是不可微的。我想知道有没有什么文档可以说明哪些操作是可微分的？

浏览 2提问于2016-10-04得票数 3

1回答

Tensorflow:可微原语

、

我的印象是所有的tensorflow原语都是可区分的。在这种“幻觉”下，我写了这个函数，希望tensorflow会自动区分它，我可以通过它来支持错误。tf.where(tf.greater(rankw02, 0)))))不幸的是，该函数在正向传递中按预期工作，但在反向

浏览 1提问于2018-08-15得票数 1

1回答

如何确保您的计算图是可微的

、

一些Tensorflow操作(例如tf.argmax)是不可微的(即在反向传播中没有计算和使用梯度)。如果我使用不可微函数，是否会发出警告？有没有

浏览 10提问于2017-08-21得票数 3

2回答

如何在keras中将step_function编写为激活函数？

、、

更新了，感谢，我能够用tensorflow构建一个工作步骤函数。(见下文代码)from tensorflow_step_function import tf_stepy def buy_hold_sell(xtens

浏览 2提问于2017-07-17得票数 2

1回答

Adagrad可以用来优化不可微函数吗？

、

我正在读一本书(TensorFlow For Dummies，Matthew Scarpino)，这里说：但我在其他地方都没见过这样的说法。所以我想知道：我们真的可以仅仅因为我们使用Adagrad而优化不

浏览 0提问于2019-02-16得票数 3

回答已采纳

1回答

什么是TensorFlow的可微性？

、

我在TensorFlow文档中遇到了可微性这个术语，但是找不到任何定义。因此，大多数帖子只是询问一个操作是否是可区分的(如或)。我想这可能与梯度下降和区分目标函数的需要有关。问题：无论如何，作为一个程序员，我为什么要关心可微性？

浏览 2提问于2020-05-02得票数 1

3回答

Tensorflow中的可区分操作列表

、

是否有可微分的Tensorflow ops的主列表(即自动区分)？谢谢。编

浏览 1提问于2017-06-15得票数 20

回答已采纳

1回答

数据集是numpy集。一些教程说:因为需要GPU的优势，我们应该将numpy数组改为tensorflow张量。然后使用tensorflow模型。但经过训练后，一些代码使用numpy函数进行测试和交互。但tensorflow官方教程中的代码仍然使用相同的tensorflow模型和tf.dataset进行测试。我想知道:当测试或实时应用时，我应该使用numpy还是tensorflow张量和模型？换句话说

浏览 0提问于2019-11-13得票数 0

2回答

如何在Tensorflow* 2/keras自定义层中使用基于numpy的外部库函数？*

、、、、

我正在尝试使用keras实现tensorflow 2中的自定义层(它是从类层派生的层)。在编写调用函数时，我需要从只接受numpy数组的外部库调用方法。这是一个相当复杂的函数，当然它不使用tensorflow函数。我的调用函数输入一个张量，将其转换为numpy (通过.numpy()函数)，从另一个库调用外部方法，然后将numpy数

浏览 2提问于2020-10-23得票数 0

回答已采纳

1回答

如何在Tensorflow张量中选择每行和每列的前Q个元素？

、、

我在Tensorflow中实现了一个特殊的损失函数。下面是一个特殊函数的numpy风格的代码，该函数选择前Q个元素，并屏蔽每行每列中的其他元素。注意，A是一个n*n矩阵，而q是一个小于n的整数。thresh(A, q): n = A_.shape[1] for i in ran

浏览 19提问于2019-06-21得票数 1

回答已采纳

8回答

Tensorflow中的可微圆函数？

、

因此，我的网络输出是一个概率列表，然后我使用tf.round()将其舍入为0或1，这对于这个项目至关重要。然后我发现tf.round是不可微的，所以我有点迷失了。:/

浏览 5提问于2017-10-06得票数 8

回答已采纳

2回答

Keras，计算LSTM上输入的损耗wrt的梯度

、、

我对机器学习还很陌生，而且我还在玩弄对抗性的例子。我试图愚弄一个二进制字符级的LSTM文本分类器.因此，我需要损失的梯度w.r.t。输入。编辑:我想做一些与 git类似的事情。我在想，问题可能是它是一个LSTM分类器。在这一点上我不确定。但我认为，即使从LSTM分类器中得到这些梯度也是可能的，对吗？, 1), dtype=

浏览 0提问于2019-05-17得票数 0

回答已采纳

1回答

在训练具有批处理数据集的网络时，我应该如何跟踪总损失？

、、、

但是，当我使用tf.GradientTape查找损失的梯度w.r.t训练变量时，没有返回任何结果。下面是训练循环： #Generate noisy seeds我所知道的是当两个

浏览 10提问于2020-05-12得票数 1

回答已采纳

1回答

图模式下的tf.gradients()与tf.gradientTape.gradient()

、

我对tf.gradients()在图形模式中的行为有一个疑问，而不是tf.gradientTape.gradient()。给定一个可微函数y= f( x)，其中x和y是单个tensorflow张量，那么tf.gradient(y，x)与tape.gradient(y，x)的行为有什么区别吗？不知道为什么tensorflow有两种不同的梯度方法，它们可以用于图形模式--也许在

浏览 0提问于2021-08-22得票数 1

1回答

如何在TensorFlow中使用可微傅立叶变换？

、、、

我想在TensorFlow中执行一个正/逆傅立叶变换。特别是，我想把它写成一个函数，我可以很容易地集成到一个神经网络中，它必须是可微的。在实践中，我希望能够编写如下内容：x = tf.nn.relu(x) Y =我已经找到了用于快速傅立叶变换的实现，以及用于逆快速傅立叶变换的<

浏览 28提问于2020-05-14得票数 0

2回答

ML中的可微与不可微损失函数

、

问:什么是可微损失函数，为什么重要？这是可以区别的吗？多么?这有什么关系呢？

浏览 0提问于2023-01-23得票数 0

1回答

tensorflow:可区分索引是可能的吗？

使用Tensorflow可以对数组进行可微索引吗？更具体地说，如果我有一个浮点数的变量，它以某种方式转换数组的索引，我能否获得转换后的数组相对于该变量的梯度？基于空间变换网络(和)的梯度导数，这似乎应该是可微的。我已经尝试实现了这一点，但我遇到了问题，因为在使用tf.gather转换数组之前，我必须将转换后的索引转换为整数，而渐变似乎不能通过它。

浏览 0提问于2016-07-28得票数 7

1回答

TensorFlow还是Theano:他们怎么知道基于神经网络图的损失函数导数？

、、

在TensorFlow或Theano中，你只告诉图书馆你的神经网络是怎样的，以及前馈应该如何操作。例如，在TensorFlow中，您可以编写： _X = tf.constant(X) _y = tf.constant(y)，C=0.5*sum((Yp)^2)，在反向传播步骤中，可能需要计算导数，dC=sum(Yp)。我的</e

浏览 2提问于2016-02-11得票数 10

回答已采纳

点击加载更多

扫码

添加站长进交流群

领取专属 10元无门槛券

手把手带您无忧上云

在Tensorflow中argsort函数是可微的吗？

基础概念

相关优势

应用场景

为什么 argsort 不可微？

解决方案

参考链接

社区

活动

资源

关于

腾讯云开发者

热门产品

热门推荐

更多推荐

为什么 `argsort` 不可微？