我是一个在NLP和深入学习领域的初学者,并已与阶段堆叠如何研究和列出可用的和替代编码器和解码器。
例如,我读到一篇论文,指出双向LSTM
和CRF
被选中用于命名实体识别,如下所示。
基于双向lstm+CRF ( tensorflow代码)的命名实体识别)
但是,如果我的数据集和这些编码器和解码器没有显示出高性能,我需要尝试其他编码器和解码器。
我的问题是:
当您有特定的NLP任务,如NER
__和dataset要培训时,您如何研究适用的编码器和解码器?
发布于 2021-07-26 04:59:42
我想对此没有普遍的解决办法。但作为NLP科学家,我可以解释我的路线图。首先,我试图为我的任务找到最常见的数据集(在您的情况下是NER)。然后,我搜索显示该数据集最佳论文/模型的领导板。最后,我试图找出谁使他们的模型最好的领导板。例如,下面是文本摘要主板:http://nlpprogress.com/english/summarization.html
我希望这对你有帮助。
https://datascience.stackexchange.com/questions/98289
复制