我在我的Tensorflow2代码中使用镜像策略,如本教程:培训所描述的。我有几乎相同的精确代码,而且现在的设置已经运行了大约1.5年。我经常把函数调用
@tf.function
def distributed_train_step(dist_inputs):在急切的模式下,只需对@tf.function进行注释即可进行调试,到目前为止效果很好。今天上午,当我启动调试器时,收到了以下错误消息:使用退出代码139完成的进程(被信号11: SIGSEGV中断)。当我再次放入@tf.function时,一切都很好,只是处于热切的模式中。我甚至重置了我的所有代码,并恢复了一个旧的git提交,我知道它运行得非常好。有人能解释一下为什么这个错误突然发生在急切的模式中吗?我有点迷路了..。
发布于 2022-02-27 19:42:46
https://stackoverflow.com/questions/71276062
复制相似问题