我希望能够衡量一个句子的歧义,而我目前的想法是通过衡量一个句子可以被解析的方式。例如,句子"Fruit For a banana“可以有不同的解释。到目前为止,我已经尝试使用斯坦福解析器,但它只以一种方式解释每个句子。我的另一个想法是测量一个句子中每个单词可能意味着多少个不同的词性,但我发现的每个词性标记器只用一个标记标记每个单词,即使它可以是多个标记。
有没有工具可以做到这两点?
我已经在我的搜索索引上测试了所有可用的Analyzer。但是,除了Keyword Analyzer之外,没有一个能按字母顺序给出正确的排序结果。但是Keyword Analyzer不符合我的过滤要求。使用Keyword Analyzer,我无法在给定句子中搜索子字符串。示例:"description":"This is 2 test different Analyzer in a Search Index“空白分析器给出正确的搜索结果,但它不能帮助我进行排序。有没有人有关于如何使用搜索索引实现排序和搜索的建议?