例如:“更换了碳化炉浮动开关和压力安全阀。”
我想摘录以下内容:{更换的碳酸炉浮动开关},{更换的安全阀}
在使用Spacy作为语言模型时,我对该句子的依赖关系树是:
所以我知道碳化器是replaced (动词)的直接宾语(djob),但是: 1.碳化器不在其本身,而是三重名词“碳化器浮动开关”的一部分,而且“压力释放阀”被替换了,它们也应该是被替换的直接宾语。
有什么想法吗?
发布于 2019-05-14 13:06:18
似乎问题不在于从树中提取化合物,而在于解析本身:它是不正确的。可能,Spacy依赖解析器只是没有接受过诸如“碳酸气浮子开关”和“压力释放阀”之类的技术术语的培训,并且不知道它们是如何组合在一起的。
也许你需要寻找其他的依赖解析器(例如Stanford CoreNLP -它可以进行正确的解析,如图所示)。或者,如果您真的需要Spacy,您可能希望收集和标记您自己的训练数据,并对Spacy解析器进行微调。
https://stackoverflow.com/questions/56110998
复制相似问题