Pointer Network(为方便起见以下称为指针网络)是seq2seq模型的一个变种。他们不是把一个序列转换成另一个序列, 而是产生一系列指向输入序列元素的指针。...作者发现,它对结果影响很大, 这不是我们想要的。因为本质上我们处理的是集合作为输入, 而不是序列。集合没有固定的顺序,所以元素是如何排列在理论上不应该影响结果。...而一个对少量数字进行训练的网络并不能概括更大的, 比如:
981,66,673
856,10,438
884,808,241
为了帮助网络使用数字, 我们添加一个 ID (1,2, 3…) 到序列的每个元素...实验代码在GitHub可以使用。与original repo相比, 我们添加了一个数据生成脚本, 并更改了训练脚本以从生成的文件中加载数据。...,我们一直在讨论循环网络如何处理可变长度的序列,但实际上数据是3D数组,如上所示。