问如何在`tensorflow.keras`中替换`keras.layers.merge._Merge`
EN

Stack Overflow用户

提问于 2019-09-27 11:13:44

回答 1查看 4.4K关注 0票数 4

我想使用tf.keras接口创建一个自定义的合并层。但是，新的API隐藏了我想要继承的keras.layers.merge._Merge类。

这样做的目的是创建一个可以对两个不同层的输出执行加权求和/合并的层。以前，在keras python API (不是tensorflow.keras中包含的那个)中，我可以继承keras.layers.merge._Merge类，现在不能从tensorflow.keras访问它。

在此之前我在哪里可以做到这一点

class RandomWeightedAverage(keras.layers.merge._Merge):
    def __init__(self, batch_size):
        super().__init__()
        self.batch_size = batch_size
    def _merge_function(self, inputs):
        alpha = K.random_uniform((self.batch_size, 1, 1, 1))
        return (alpha * inputs[0]) + ((1 - alpha) * inputs[1])

现在，如果使用tensorflow.keras，我就不能使用相同的逻辑

class RandomWeightedAverage(tf.keras.layers.merge._Merge):
    def __init__(self, batch_size):
        super().__init__()
        self.batch_size = batch_size
    def _merge_function(self, inputs):
        alpha = K.random_uniform((self.batch_size, 1, 1, 1))
        return (alpha * inputs[0]) + ((1 - alpha) * inputs[1])

产生

AttributeError: module 'tensorflow.python.keras.api._v1.keras.layers' has no attribute 'merge'

我还尝试了从Layer类继承

class RandomWeightedAverage(tensorflow.keras.layers.Layer):
    def __init__(self, batch_size):
        super().__init__()
        self.batch_size = batch_size
    def call(self, inputs):
        alpha = K.random_uniform((self.batch_size, 1, 1, 1))
        return (alpha * inputs[0]) + ((1 - alpha) * inputs[1])

这给了我一个输出形状等于multiple的层，而我希望输出形状被很好地定义。我进一步尝试

class RandomWeightedAverage(tensorflow.keras.layers.Layer):
    def __init__(self, batch_size):
        super().__init__()
        self.batch_size = batch_size
    def call(self, inputs):
        alpha = K.random_uniform((self.batch_size, 1, 1, 1))
        return (alpha * inputs[0]) + ((1 - alpha) * inputs[1])

    def compute_output_shape(self, input_shape):
        return input_shape[0]

但这并没有解决作为输出形状的multiple模糊性。

tensorflow

keras

tf.keras

python

在线客服搭建方案

搭建集AI机器人、在线客服、智能外呼等多功能服务的客服系统，支持快速接入及自搭建客服系统，从而让顾客快速得到解答

回答 1

Stack Overflow用户

回答已采纳

发布于 2019-09-27 14:11:31

我稍微修改了您的代码，使用tf.random_uniform而不是K.random_uniform，它在1.13.1和1.14.0 (完整的代码片段和下面的结果model.summary() )上工作得很好。

import tensorflow as tf
print(tf.__version__)


class RandomWeightedAverage(tf.keras.layers.Layer):
    def __init__(self, batch_size):
        super().__init__()
        self.batch_size = batch_size

    def call(self, inputs, **kwargs):
        alpha = tf.random_uniform((self.batch_size, 1, 1, 1))
        return (alpha * inputs[0]) + ((1 - alpha) * inputs[1])

    def compute_output_shape(self, input_shape):
        return input_shape[0]


x1 = tf.keras.layers.Input((32, 32, 1))
x2 = tf.keras.layers.Input((32, 32, 1))

y = RandomWeightedAverage(4)(inputs=[x1, x2])

model = tf.keras.Model(inputs=[x1, x2], outputs=[y])

print(model.summary())