如何使用mxnet符号实现线性代数函数，以编写自定义损失函数(例如：在线三重挖掘)？)

在 MXNet 中，您可以使用符号（Symbol）API 来实现线性代数函数，并编写自定义损失函数，例如在线三重挖掘（Online Triplet Mining）。下面是一个示例，展示如何使用 MXNet 符号 API 实现这一功能。

1. 安装 MXNet

首先，确保您已经安装了 MXNet。您可以使用以下命令安装：

pip install mxnet

2. 定义自定义损失函数

在线三重挖掘的目标是最小化锚点（anchor）与正样本（positive）之间的距离，同时最大化锚点与负样本（negative）之间的距离。我们可以使用 MXNet 的符号 API 来实现这一点。

以下是一个简单的实现示例：

import mxnet as mx
from mxnet import nd, autograd, gluon

# 定义在线三重挖掘损失函数
class TripletLoss(gluon.loss.Loss):
    def __init__(self, margin=1.0, **kwargs):
        super(TripletLoss, self).__init__(**kwargs)
        self.margin = margin

    def forward(self, anchor, positive, negative):
        # 计算锚点与正样本之间的距离
        pos_dist = nd.sqrt(nd.sum(nd.square(anchor - positive), axis=1))
        # 计算锚点与负样本之间的距离
        neg_dist = nd.sqrt(nd.sum(nd.square(anchor - negative), axis=1))
        # 计算损失
        loss = nd.maximum(pos_dist - neg_dist + self.margin, 0)
        return nd.mean(loss)

# 示例数据
anchor = nd.array([[1, 2], [1, 2], [1, 2]])
positive = nd.array([[1, 2], [1, 2], [1, 2]])
negative = nd.array([[2, 3], [2, 3], [2, 3]])

# 创建损失函数实例
triplet_loss = TripletLoss(margin=1.0)

# 计算损失
with autograd.record():
    loss = triplet_loss(anchor, positive, negative)

# 反向传播
loss.backward()

# 打印损失值
print("Triplet Loss:", loss.asscalar())

3. 解释代码

TripletLoss 类：我们定义了一个自定义损失函数 TripletLoss，它继承自 gluon.loss.Loss。在 forward 方法中，我们计算锚点与正样本和负样本之间的距离，并根据三重挖掘的公式计算损失。
距离计算：我们使用 nd.sqrt 和 nd.sum 来计算欧几里得距离。
损失计算：我们使用 nd.maximum 来确保损失值不小于零，并且使用 nd.mean 来计算平均损失。

4. 使用自定义损失函数

在训练模型时，您可以将自定义损失函数与 Gluon 的训练循环结合使用。以下是一个简单的训练循环示例：

# 假设我们有一个简单的模型
net = gluon.nn.Sequential()
with net.name_scope():
    net.add(gluon.nn.Dense(2))

net.initialize()

# 优化器
trainer = gluon.Trainer(net.collect_params(), 'adam')

# 训练循环
for epoch in range(10):
    with autograd.record():
        # 假设我们有锚点、正样本和负样本的输入
        anchor_output = net(anchor)
        positive_output = net(positive)
        negative_output = net(negative)

        # 计算损失
        loss = triplet_loss(anchor_output, positive_output, negative_output)

    # 反向传播和更新参数
    loss.backward()
    trainer.step(batch_size=3)

    print(f'Epoch {epoch + 1}, Triplet Loss: {loss.asscalar()}')

页面内容是否对你有帮助？

有帮助

没帮助

基于MXNet的回归

、、、、

我有一个基于各种独立特征的回归模型，它最终用自定义损失函数预测一个值。有点类似于下面的链接。当前的模型是使用Tensorflow库构建的，但是现在我想使用MXNet，因为它提供了速度和其他优势。如何用自定义丢失函数在MXNet中编写类似的逻辑？

浏览 1提问于2020-04-16得票数 0

回答已采纳

1回答

我刚接触神经网络和R中的mxnet包。我想对我的预测值进行逻辑回归，因为我的观测值是介于0和1之间的概率。我希望通过我拥有的向量obsWeights对我的观测值进行加权，但我不确定在哪里实现权重。在mx.symbol.FullyConnected中似乎有一个weight=选项，但是如果我尝试weight=obsWeights，我会得到以下错误消息 Error in mx.varg.symbol.FullyConnected(list(...)) : Cannot find argument 'weight', Possible Arguments: -----------

浏览 3提问于2017-02-18得票数 2

1回答

与其他深度学习API相比，MXNet的优缺点

、、、、

最近，我决定学习MXNet，因为我需要使用的一些代码是使用这个API编写的。然而，我想知道与其他的深度学习图书馆相比，MXNet的优点和缺点是什么。

浏览 0提问于2018-01-12得票数 3

回答已采纳

3回答

Scikit-Learn: GridSearchCV的自定义损失函数

、、

我正在做一个Kaggle竞赛()，它说明我的模型将通过以下方式进行评估： Submissions are evaluated on Root-Mean-Squared-Error (RMSE) between the logarithm of the predicted value and the logarithm of the observed sales price. (Taking logs means that errors in predicting expensive houses and cheap houses will affect the result equally.)

浏览 2提问于2018-01-28得票数 0

1回答

MXNET自定义损失函数和eval_metric

如何在MXNET中创建自定义损失函数？例如，我希望计算每个可能标签的加权交叉熵损失，而不是计算一个标签的交叉熵损失(使用标准mx.sym.SoftmaxOutput层来计算交叉熵损失，并返回一个可以作为损失符号传递给拟合函数的符号)。MXNET教程提到使用 mx.symbol.MakeLoss(scalar_loss_symbol, normalization='batch') 然而，当我使用MakeLoss函数时，标准的eval_metric - "acc"不起作用(很明显，因为模型不知道我预测的概率向量是多少)。因此，我需要编写自己的eval_metric。

浏览 26提问于2017-08-22得票数 3

1回答

关于Julia中MXNet中的Symbolic API的查询

、

我正在努力理解Julia中MXNet的符号API细微差别。我在MXNet文档中看到了一个示例，其中包含以下行： act1 = mx.Activation(data = fc1, name=:relu1, act_type=:relu) 为什么为act_type指定了符号:relu。？ :relu是函数指针吗？如果不是，那么我们在哪里给:relu符号赋值呢？为什么不为数据分配符号？为什么为name分配的是符号而不是字符串？

浏览 3提问于2017-01-29得票数 0

回答已采纳

1回答

MXNet:有没有python来获取一些选项的名称？

、

我想看看op的类型/名称为一个Symbol in MXNet的是什么。例如： c = mxnet.symbol.Convolution() type(c)

浏览 3提问于2017-05-22得票数 0

1回答

如何列出mxnet中的所有符号？

、

在使用Python API的mxnet1.4中，假设我这样做了 import mxnet as mx tmp = mx.sym.var('a') print(tmp) # <Symbol a> tmp = tmp + tmp print(tmp) # <Symbol _plus0> tmp = mx.sym.var('b') tmp = tmp + tmp print(tmp) # <Symbol _plus1> 我假设，<Symbol _plus0>仍然存在于图中的某个地方。如何列出我的图形中当前存在

浏览 1提问于2019-08-14得票数 1

2回答

在Python中，三个反逗号(‘)到底代表什么？

在这个问题中，我想知道在Python中是否有关于“三”引号的惯例。在一门在线课程中，我遇到了这样的想法:不要使用三重逗号，因为它用来表示程序的文档。在另一门在线课程中，我发现了这样的想法:在必要时使用它。然后，您可以使用单引号或双引号，随您喜欢。 print('''This is exactly what he said, "I'm your lover."''') 你对此有何看法？有什么特别的约定吗？提前谢谢你的帮助。

浏览 4提问于2022-06-17得票数 -1

1回答

异或神经网络，损失不会下降

、、、、

我用Mxnet训练异或神经网络，但损失不会减少，它们总是在0.5以上。下面是我在Mxnet 1.1.0；Python3.6；OS Capitan 10.11.6中的代码我尝试了两个损失函数-平方损失和最大损失，两者都没有工作。 from mxnet import ndarray as nd from mxnet import autograd from mxnet import gluon import matplotlib.pyplot as plt X = nd.array([[0,0],[0,1],[1,0],[1,1]]) y = nd.array([0,1,1,0]) batc

浏览 0提问于2018-04-01得票数 3

回答已采纳

1回答

Facenet在线三重态生成

、、

本文提到了一种为卷积神经网络生成三胞胎的智能方法(用于生成人脸嵌入)。对于有n个图像的小批次，只有半硬三重奏用于学习(包含半硬负片的三重奏，这是与锚图像足够接近的负面图像)。培训集是如何创建的？一批含有什么？在我们的实验中，我们对训练数据进行了采样，使每个小批量的每个身份选择了大约40个面孔。此外，随机抽样的负面面孔被添加到每一小批. 我做了什么，我使用野生数据集中的标记脸进行培训(13233张图片，5749人，1680张2张或更多图片，每批我选择了一个锚，一些正面信息(这意味着我只能使用1680批，因为我需要多个人的图像)和底片--其他人的图像是随机选择的。我的

浏览 1提问于2017-08-05得票数 20

回答已采纳

2回答

Lambda层中的自定义函数失败，无法将张量转换为numpy

、、、、

因此，我正在尝试使用Keras (Tensorflow后端)中的Lambda层实现一个自定义函数。我想把输入张量转换成numpy数组来执行我的功能。但是，我不能运行tensor.eval()，因为它抛出了一个错误： InvalidArgumentError (see above for traceback): You must feed a value for placeholder tensor 'input_1' with dtype float and shape [?,960,960,1] 这是我的代码： def tensor2np(tensor): retu

浏览 0提问于2018-03-30得票数 1

1回答

模块/优化器如何选择要优化的符号？

我知道我可以创建自己的模块/优化器来做这件事，但是是否可以告诉现有的mxnet模块只优化变量的一个子集呢？沿着这些相同的路线，模块如何确定要优化的符号？例如，与MXNet中的tensorflow不同，要优化的数据和变量都只是“变量”符号，但不知何故，MXNet只影响实际变量的NDArrays，而不影响数据NDArrays。它是如何检查的？它有没有使用的命名约定？如果是这样，那么约定是什么呢？(任何名称中包含'data‘的符号都没有被优化？)

浏览 13提问于2017-01-18得票数 0

回答已采纳

1回答

Keras是如何反向传播自定义损失函数的？

、

我已经研究了大量的Keras自定义损失函数的例子。所有这些都可以概括为“写吧”。也就是说，需要编写函数获取参数(y_true，y_pred)。但是通常CNN需要损失函数的导数来进行反向传播。例如，如果你在Caffe中实现自定义损失，你必须编写2个函数:你需要的损失本身，以及它对反向传播的导数。但在Keras中，你似乎不需要第二个。这个魔法是如何工作的？

浏览 6提问于2018-01-05得票数 8

1回答

如何使用mxnet中的lstm检查点进行预测？

、

我以/warpctc/为例来训练模型。现在，我已经保存了一个检查点mymodel-0100.params和mymodel-符号. saved。那么，如何使用这个检查点只使用一个图像来进行预测呢？我已经厌倦了使用预测器接口，下面的代码： # Load the pre-trained model symbol_file = "mymodel-symbol.json" param_file = "mymodel-0100.params" predictor = Predictor(open(symbol_file).read(), open(param_f

浏览 2提问于2016-12-10得票数 0

回答已采纳

2回答

是否可以根据火把的批次大小来执行步骤？

、、、

我在批量地迭代训练样本，但是最后一批总是返回较少的样本。是否可以根据当前批次长度在火炬中指定步长？例如，大多数批次的大小为64，最后一批只有6个样本。如果我按惯例行事： optimizer.zero_grad() loss.backward() optimizer.step() 后6个样本在更新梯度时的权重似乎与64个批次相同，但实际上由于样本较少，它们只应携带约1/10的权重。在Mxnet中，我可以相应地指定步骤大小，但我不知道如何在torch中实现。

浏览 4提问于2022-08-21得票数 0

1回答

输入和损失的keras和形状

在keras的所有代码示例中，我看到输入形状是直接传递的，并且推测批处理大小是第一个，例如： model = Sequential() model.add(Dense(32, input_shape=(16,))) # now the model will take as input arrays of shape (*, 16) # and output arrays of shape (*, 32) 但是，当涉及到自定义损失时，我看到使用了最后一个轴(轴=-1)。 def loss(y_true,y_pred): return K.mean(K.square(y_pred

浏览 0提问于2019-11-30得票数 1

1回答

深度学习-找到最相似的图像-三胞胎对对

、、、

我正在使用Python、scikit-learn、keras和450x540 rgb正面手表的图像(例如观看_1、观看_2)。我的目标是运行一个自动编码器或暹罗神经网络，以找到其中最相似的手表。然而，我不确定我是否会得到更好的结果，通过比较对的图像或三胞胎的图像。正如本研究论文中所定义的那样，三重奏图像由一个目标图像、一个与目标图像(更多)相似的图像和一个与目标图像不相似的图像组成。有人能简单地解释一下为什么像前一篇论文所说的那样，使用三胞胎的图像会(必然)比使用对图像产生更好的结果吗？

浏览 0提问于2018-02-23得票数 1

2回答

为什么GPU只用于线性代数而不是非线性计算？

、、

我一直听说GPU是有用的，因为它们在线性代数上速度很快。我明白如何使用GPU来快速执行线性计算，我明白为什么这很有用，但我不明白为什么这些计算需要线性。为什么我们不能让每个GPU核取4个数字a，b，c，d，并计算a^b + c^d，或者任何其他非线性函数？如果答案是线性代数更有效:线性代数如何更有效，如何利用线性代数计算或近似任意非线性函数(如果需要专用性，假设函数是非线性多项式)？

浏览 10提问于2022-05-28得票数 -3

回答已采纳

4回答

设在Keras的暹罗网络

、

我正在寻找一个最低限度的应用示例来实现一个(一击)暹罗网络，最好是在Keras。我很清楚各种各样的数据科学在线网页，以及相应的例子和练习，可以在那里找到。然而，到目前为止，我还没有找到一个有教育意义的来源。如果有人能向我介绍一些github源代码，或者有人可以共享一些代码或其他源代码，我将非常感激，因为它们为如何在Python或R中实现这样的体系结构提供了一个良好的例子。

浏览 0提问于2020-01-05得票数 3

1回答

在tensorflow中通过同一个前馈网络传递多个值

、、、

我试图在同一网络中一次传递3个值，因为我需要所有三个向量的值来计算三重态损失。但是当我传递第二个值时，它会产生一个错误。代码片段是： # runs the siamese network def forward_prop(x): w1 = tf.get_variable("w1", [n1, 2048], initializer=tf.contrib.layers.xavier_initializer()) * 0.01 b1 = tf.get_variable("b1", [n1, 1], initializer=tf.zeros_initi

浏览 1提问于2018-03-26得票数 1

回答已采纳

1回答

预测单词向量而不是单词(自然语言处理)

、、、、

我想知道是否有人试图将单词嵌入向量作为神经网络体系结构(如Transformers、序列到序列模型或简单RNN)中的目标，例如使用均方误差作为损失函数，而不是用softmax来预测单词为类别。找不到任何关于这个话题的文章。有人知道关于这方面的文件吗?或者如果不是原因，为什么不这么做？用于澄清例如，Cho等人提出的一个简单的编码器-解码器-体系结构。2014年()。在这类模型中，输出层通常使用softmax激活函数来预测目标词。如果你的词汇表中有30000个单词，你需要输出层中的30万个神经元。我现在的问题是:为什么不把目标词表示成向量，而不是在输出层预测单词呢？实际上，当使用预先训练过的

浏览 6提问于2021-12-22得票数 0

1回答

如何在python中使用mxnet

、、

我使用lenet网络在mathematica中训练了一个cnn，并将其导出为MXnet。如何在python中使用导出的JSON和PARAMS进行预测？如何加载模型？我找不到对此有用的示例或文档。我使用的是python 3.6和anaconda。

浏览 0提问于2018-04-22得票数 0

1回答

具有numpy的MXNet参数序列化

、、、

我想在MXNet体系结构上使用经过预先训练的s390x模型，但它似乎不起作用。这是因为预先训练过的模型是在小终端，而s390x是大端。所以，我试着使用，它既适用于小终端，也适用于大端。解决这一问题的一种方法是在x86机器上加载模型参数，调用asnumpy，通过numpy保存，然后使用numpy在s390x机器上加载参数，并将它们转换为MXNet。但我不太确定该怎么编码。有人能帮我吗？更新问题似乎还不清楚。所以，我增加了一个例子，更好地解释了我想做的三个步骤- 从MXNet加载一个预先存在的模型，类似于- net = mx.gluon.model_zoo.vision.resnet18_v

浏览 5提问于2020-07-08得票数 4

1回答

使用mxnet模型定义自定义函数

、、、、

我正在尝试将自定义函数与mxnet神经网络模型一起使用。此自定义函数用于创建最终层激活向量的模糊表示。当常规的python函数以命令式方式工作，而mxnet以声明性方式(即符号)工作时，我很困惑如何使其工作。当我尝试在已定义的模型中使用我的函数时，它会引发异常，因为在模型声明过程中，参数是一个符号，而不是一个实数组。关于如何让我的自定义函数以声明式的方式工作(比如像mxnet.sym.concat )，你有什么想法吗？下面是我的自定义函数定义： def getFuzzyRep(arr): fuzzRep = "" x_qual = np.arange(0,

浏览 3提问于2018-12-01得票数 0

2回答

在R中使用mxnet对多个输出进行超参数调整

、、

我目前试图建立多个输出的MLP。对于单个输出MLP，我通常使用H2o包实现，它具有很好的随机网格搜索功能。由于H2o不支持多个输出，所以我切换到mxnet包。现在，我试图找到一种方式来调整我的参数为我的MLP。我在R中找不到任何包，它为多个输出提供参数调优，并允许我使用mxnet。您是否知道任何包，或者您是否有用于超参数搜索的自实现函数？谢谢! 编辑以引起评论：多输出意味着多个响应变量(MIMO问题)。例如，我研究的任务之一是RRSB分布的预测。RRSB分布有两个参数: n，x。我希望这能澄清你的问题。

浏览 0提问于2017-09-26得票数 1

1回答

Tensorflow / Keras在神经网络负二项损失中的应用

、、、、

我正在使用一个高度倾斜的计数数据集，该数据集通常适合负二项式。我想在Keras或Tensorflow中使用负二项作为前馈神经网络的损失函数。据我所知，在查看了可用的损失函数后，keras或tensorflow不存在这样的函数(尽管我希望我错了，我只是错过了一些东西)。我环顾四周，看到一些帖子建议只交换损失以包含负二项式，但似乎在tensorflow中创建自定义损失不仅仅是用tf.contrib.distributions.NegativeBinomial交换有几篇文章谈到了为Tensorflow / keras创建自定义损失函数，例如：看了这个之后，我正在努力弄清楚如何编写这个函数。我

浏览 7提问于2018-09-06得票数 5

1回答

在自定义图像集上执行人员重新识别

、

我最近一直在使用YOLO系统来检测图像上的人，结果非常好。我的下一步是尝试在我之前检索到的整组图像中找到同一个人的图像。我偶然看到了AlignedReID:在人的再识别方面超越人的层次性能的报纸，把它读了一遍，发现了一种提供预先训练的举重的它的实施。然而，当我试图将它应用到我的(无标签的)自定义数据集时，我有点迷失了。对我来说，系统的输入是一个图像，它的输出是k个候选图像，按照系统的机密性进行排序。换句话说，系统将尝试将图像与他所使用的其他图像匹配。因为我检索到的图像没有标签，所以我想避免再训练任何东西。但我越多地想到它，对我来说就越不可能。我可以加载预先训练的权重，将我检索的图像定义

浏览 0提问于2018-06-28得票数 0

回答已采纳

1回答

基于三重态损失的Keras模型正确提交3个输入

、、、、

我正在研究一个由两个部分组成的模型，正如我在中所讨论的:第一部分应该使用三重奏的元素(由锚、正例和负例组成，在FaceNet中采用相同的原理)，并将它们转化为向量(word2vec + lstm)，而第二部分应该取这些向量并使用它们来计算三重态损失。我开始编写一些代码，下面是我现在拥有的代码： import pandas as pd import numpy as np import tensorflow as tf from nltk.tokenize import WordPunctTokenizer from collections import Counter from string

浏览 1提问于2019-07-10得票数 0

回答已采纳

1回答

三网损耗网络与多类分类的性能

我正在训练一个基于三重子丢失的分类网络和一个普通的多类分类网络，对一些图像数据进行分类。在我的例子中，三重态丢失网络的性能比多类网络差。我曾经尝试过改变三重态损失网络的层、神经元、边缘等，但是多类网络的性能仍然更好。是否有任何情况下三重态丢失网络的表现比正常的多类分类差？如果没有，我可以看到哪些东西可以改善或改变三胞胎丢失网络的工作呢？它是5类分类，具有一定的特征。

浏览 0提问于2019-09-08得票数 0

2回答

如何使用Weka中的新培训数据更新经过培训的模型(weka.classifiers.functions.MultilayerPerceptron)？

、、、、

我想加载一个我以前训练过的模型，然后用新的训练数据更新这个模型。但我发现这个任务很难完成。我从那里学到实现weka.classifiers.UpdateableClassifier接口的分类器可以递增地接受训练。然而，我训练的回归模型使用的是weka.classifiers.functions.MultilayerPerceptron分类器，它没有实现UpdateableClassifier。然后我检查了Weka API，结果发现没有回归分类器实现了UpdateableClassifier.。如何在Weka中训练回归模型，然后在加载模型后用新的训练数据对模型进行更新？

浏览 3提问于2013-11-22得票数 1

2回答

Scala和Spark中多类分类的自定义损失函数

、、、

我想问一下，是否可以使用Scala在Spark中为多类分类编写一个自定义损失函数。我想用Scala编写代码。我搜索了Spark文档，但没有得到任何提示。

浏览 0提问于2019-07-27得票数 1

1回答

成本函数与误差最小化

在线性回归模型中，如何定义成本函数。另外，在定义了成本函数之后，如何最小化错误项？

浏览 0提问于2020-01-21得票数 0

1回答

利用批量输出的Keras损失函数

、、

我正在尝试学习一种使用keras的双分支神经网络联合嵌入图像和文本的表示。我的模型就是这样的：以下是我目前的培训模式： model = Model([txt_input,img_input], [encoded_txt, encoded_img]) 我必须使用双向排序损失，这意味着对应的文本和图像的表示应该比任何其他图像/文本之间的距离为m。 experiment)Yi- s:a：aD:训练集Yi+：给定图像xi的对应(正)文本描述集(在my 中只有一个正描述:给定图像xiXi+的一组非对应(负)描述:给定文本描述的一组对应(正)图像(仅在我的experiment)Xi-中有一个正)：

浏览 2提问于2020-04-16得票数 0

回答已采纳

1回答

在线logistic回归

、、

我希望在Matlab中使用在线逻辑回归训练，在其中我通过展示第一个样本来训练模型，评估模型，然后添加第二个样本，评估等。我可以这样做，首先在第一个样本上创建一个模型，评估它，丢弃这个模型；然后在第一个和第二个样本上创建一个模型，评估它，等等，但这是非常无效的。有没有办法在Matlab中对logistic回归模型进行“真正的”在线训练？

浏览 0提问于2016-01-19得票数 0

1回答

如何为深度学习库编写分类精度损失函数？

如何为深度学习库编写分类精度损失函数？分类准确性损失是指预测错误的百分比，即#错误/#数据点。是否可以为此编写一个自定义的损失函数？谢谢。

浏览 1提问于2016-06-19得票数 0

回答已采纳

2回答

带有tensorflow后端的二进制(圆形)的Keras自定义丢失函数

、、、、

我目前正在尝试实现一个具有二进制结果的自定义丢失函数(精度)，但是Tensorflow后端拒绝使用循环函数，这是生成'0‘或'1’所必需的。据我所研究，这是因为Tensorflow将圆的梯度定义为None，损失函数不能返回None。目前，我已经实现了这种自定义丢失，以便在R接口中尽可能地创建“0”或“1”。 precision_loss<-function(y_true,y_pred){ y_pred_pos = K$clip(y_pred, 0, 1) #Custom sigmoid to generate '0' '1'

浏览 0提问于2018-01-20得票数 1

1回答

利用深度学习在回归中获得多元输出

、

给定一个RGB图像的手和三维位置的关键点作为数据集，我想这样做的回归问题，在DL。在这种情况下，输入将是RGB图像，输出应该估计出关键点的3d位置。我已经看到了一些关于回归的信息，但是他们中的大多数都试图估计一个单一的值。是否有可能同时估计多个值(或输出)？现在，我已经提到了这个。这个人试图估计图像中一个人的年龄。

浏览 0提问于2017-12-13得票数 4

回答已采纳

1回答

凸损失函数在非线性模型中的意义

、、

在线性模型中，凸损失函数保证了参数的唯一全局极小值，通过局部优化方法可以找到参数的全局极小值。然而，当模型是非线性的(如MLPs)，局部极小是可能的凸损失。当模型是非线性的时，是否对凸损失函数有任何好处？在非线性情况下，可完全忽略凸性吗？

浏览 0提问于2021-09-05得票数 1

回答已采纳

1回答

在OD中使用IoU本地化损失

、

有几篇论文，例如，声称IoU本地化损失比标准平滑L1损失产生更好的性能。当尝试使用IoU本地化损失时，即在配置文件中使用以下行： ... localization_loss { weighted_iou { } } ... 我总是收到found NaN in loss错误。如果我将一个小的辅音(例如1e-7)添加到matched_iou中的分母，如下所示： def matched_iou(boxlist1, boxlist2, scope=None): """Compute intersection-over-union between corresp

浏览 15提问于2019-03-27得票数 1

1回答

如何使用客户端调用堆栈中的地址从PDB检索文件/函数/行号？

、、、

我在我的C++游戏中添加了一些崩溃报告，使用的是。我假设当客户端生成调用堆栈时，它将打印地址，而不是文件/函数名等。如何将这些地址转换为人类可读的内容？我将保存PDB文件，但我不知道如何检查它们。

浏览 2提问于2014-10-01得票数 1

1回答

为什么这种语义分割网络中没有softmax分类层？

、、、

我试图使用以下CNN架构进行语义像素分类。我使用的代码是然而，根据我的理解，这种类型的语义分割网络通常应该有一个softmax输出层来产生分类结果。我找不到脚本中任何地方使用的softmax。是我正在阅读的关于这个分段体系结构的论文。从图2中，我看到softmax正在被使用。因此，我想知道为什么在脚本中缺少这一点。任何见解都是受欢迎的。

浏览 1提问于2019-01-07得票数 1

回答已采纳

1回答

Tableau日志函数不正确

、、

这是示例线性订购量热图(区域与数量) 创建计算字段logarithmic = int(log([Order Quantity]))，然后在logarithmic = int(log([Order Quantity],10))上创建热图的大小是基于logarithmic的。尺寸不变，号码不正确，请指点。

浏览 5提问于2016-09-16得票数 1

回答已采纳

1回答

将其他构造函数参数传递给MXNet中的自定义图层

、、

我正在使用MXNet中的CustomOp类来创建一个新的转换层。该层将output_dimensionality作为该层的超参数。此维度不能从数据中自动推断，但需要由构建网络图的调用者选择，因此它应该是新符号的构造函数参数，如 net = mx.symbol.Custom(data=data, op_type='mycustomop', output_dimensionality=1024) 它将由我的CustomOp子类的__init__构造函数使用。但是当我尝试这个的时候，我得到的是： Traceback (most recent call last): File &#

浏览 0提问于2016-11-11得票数 1

1回答

Convnet序回归损失函数

、、、、

目前，我正在尝试使用训练在Imagenet上的Densenet传输学习，以输出序数整数值{2 <3<4<5< 6}。我将目标变量编码成长度为4的二进制向量(例如，1,0,0,0,1,1,0,0，等等)使用。下面是我的模型的架构： base_model = DenseNet121(include_top=False, weights="imagenet", classes=5, input_shape=(224,224,3)) base_model.trainable = False x = base_model.output x = GlobalAver

浏览 1提问于2020-02-09得票数 3

2回答

在使用自定义训练循环时(即不使用.fit )，如何使用class_weights计算自定义损失函数

、

我已经使用tf.GradientTape()编写了我的自定义训练循环。我的数据有两个类。这些类别并不平衡；class1数据贡献了近80%，class2贡献了剩下的20%。因此，为了消除这种不平衡，我尝试编写自定义损失函数，它将考虑这种不平衡，并应用相应的类权重并计算损失。也就是说，我想使用class_weights = [0.2, 0.8]。我找不到类似的例子。然而，我看到的所有示例都在使用model.fit方法，因为它更容易通过class_weights。我找不到使用使用tf.GradientTape的自定义训练循环的class_weights的示例。我确实介绍了使用sample_wei

浏览 5提问于2020-12-29得票数 3

1回答

在以增量方式训练tensorflow (2.0)模型时，何时调用compile？

、、、

我正在编写一个神经网络来进行增量训练(而不是在线)。下面是代码的一小段 output = create_model() model = Model(inputs=values, outputs=output) if start_epoch > 1: weights_list = load_model_from_pickle() model.set_weights(weights_list) model.compile(loss='binary_crossentropy', optimizer='adam') model.fit(data

浏览 30提问于2019-11-22得票数 0

1回答

如何在RandomizedSearchCV中输入自定义指标？

、、、

我需要通过metice smape_final选择最好的模型。为此，我编写了一个函数： def smape(A, F): return 100/len(A) * np.sum(2 * np.abs(F - A) / (np.abs(A) + np.abs(F))) 我稍后会用到： parameters = {'max_depth':range(1,30,1), 'n_estimators':range(10,51,10)} rgr_rand_frst = RandomizedSearchCV(RandomForestRegressor(random_s

浏览 33提问于2021-10-01得票数 1

1回答

Python与cvCalcEigenObjects的等效函数

、、、

我正在尝试用‘翻译’示例代码，但是我在cvaux.h中找不到与用c语言编写的cvCalcEigenObjects等效的python函数。

浏览 3提问于2011-04-19得票数 0

回答已采纳

6回答

Keras中的自定义损失函数应该返回该批的单个损失值，还是返回培训批中每个样本的损失数组？

、、、、

我正在学习tensorflow(2.3)中的keras。在tensorflow网站上的这个中，我发现了一个定制丢失功能的例子： def custom_mean_squared_error(y_true, y_pred): return tf.math.reduce_mean(tf.square(y_true - y_pred)) 这个自定义丢失函数中的reduce_mean函数将返回一个标量。这样定义损失函数是正确的吗？据我所知，y_true和y_pred形状的第一个维度是批处理大小。我认为损失函数应该返回每批样品的损失值。因此，损失函数应该给出一个形状(batch_

浏览 8提问于2020-08-13得票数 24

回答已采纳