对于每个词语随机选取它的一个同义词替换该词语。
random insertion(RI):随机选取句子中的一个非停用词的词语,随机选取这个词语的一个近义词,将近义词随机插入到句子中,做n次。...生成方法
看过很多奇奇怪怪的生成方法,有seq2seq(shin2019utterance, kurata2016labeled, kurata2016labeled)、VAE(yoo2020variational...的token,不过会做一些随机mask,来预测mask掉的词语。..., '检查我的航班信息。'...
# ['打听一下航班的信息。', '检查航班', '检查VOO信息', '查看航班信息', ...
# ['这里有什么有趣的?'..., '这里有什么有趣的', '这个地方有什么有趣的?', ...