我想使用tf.keras
接口创建一个自定义的合并层。但是,新的API隐藏了我想要继承的keras.layers.merge._Merge
类。
这样做的目的是创建一个可以对两个不同层的输出执行加权求和/合并的层。以前,在keras
python API (不是tensorflow.keras
中包含的那个)中,我可以继承keras.layers.merge._Merge
类,现在不能从tensorflow.keras
访问它。
在此之前我在哪里可以做到这一点
class RandomWeightedAverage(keras.layers.merge._Merge):
def __init__(self, batch_size):
super().__init__()
self.batch_size = batch_size
def _merge_function(self, inputs):
alpha = K.random_uniform((self.batch_size, 1, 1, 1))
return (alpha * inputs[0]) + ((1 - alpha) * inputs[1])
现在,如果使用tensorflow.keras
,我就不能使用相同的逻辑
class RandomWeightedAverage(tf.keras.layers.merge._Merge):
def __init__(self, batch_size):
super().__init__()
self.batch_size = batch_size
def _merge_function(self, inputs):
alpha = K.random_uniform((self.batch_size, 1, 1, 1))
return (alpha * inputs[0]) + ((1 - alpha) * inputs[1])
产生
AttributeError: module 'tensorflow.python.keras.api._v1.keras.layers' has no attribute 'merge'
我还尝试了从Layer
类继承
class RandomWeightedAverage(tensorflow.keras.layers.Layer):
def __init__(self, batch_size):
super().__init__()
self.batch_size = batch_size
def call(self, inputs):
alpha = K.random_uniform((self.batch_size, 1, 1, 1))
return (alpha * inputs[0]) + ((1 - alpha) * inputs[1])
这给了我一个输出形状等于multiple
的层,而我希望输出形状被很好地定义。我进一步尝试
class RandomWeightedAverage(tensorflow.keras.layers.Layer):
def __init__(self, batch_size):
super().__init__()
self.batch_size = batch_size
def call(self, inputs):
alpha = K.random_uniform((self.batch_size, 1, 1, 1))
return (alpha * inputs[0]) + ((1 - alpha) * inputs[1])
def compute_output_shape(self, input_shape):
return input_shape[0]
但这并没有解决作为输出形状的multiple
模糊性。
发布于 2019-09-27 14:11:31
我稍微修改了您的代码,使用tf.random_uniform
而不是K.random_uniform
,它在1.13.1和1.14.0 (完整的代码片段和下面的结果model.summary()
)上工作得很好。
import tensorflow as tf
print(tf.__version__)
class RandomWeightedAverage(tf.keras.layers.Layer):
def __init__(self, batch_size):
super().__init__()
self.batch_size = batch_size
def call(self, inputs, **kwargs):
alpha = tf.random_uniform((self.batch_size, 1, 1, 1))
return (alpha * inputs[0]) + ((1 - alpha) * inputs[1])
def compute_output_shape(self, input_shape):
return input_shape[0]
x1 = tf.keras.layers.Input((32, 32, 1))
x2 = tf.keras.layers.Input((32, 32, 1))
y = RandomWeightedAverage(4)(inputs=[x1, x2])
model = tf.keras.Model(inputs=[x1, x2], outputs=[y])
print(model.summary())
https://stackoverflow.com/questions/58133430
复制