如何在顶级GraphDB lucene索引上计算lucene FuzzyQuery？

文章/答案/技术大牛

发布

1回答

、

GraphDB支持FTS Lucene插件来构建RDF‘分子’来高效地索引文本。然而，当你搜索的单词中有拼写错误时，Lucene将不会检索到结果。我想知道是否有可能在GraphDB for FTS的Lucene Index上实现一个基于Damerau-Levenshtein算法的FuzzyQuery。这是我在WordNet RDF中为NounSynset的标签创建的索引。

浏览 13提问于2019-05-18得票数 1

回答已采纳

2回答

我对数据集的模糊搜索方法会比使用Lucene更好吗？

、、、、

后端是用Java编写的，每个人在这里推荐的搜索引擎也是用Java编写的。然而，我不愿使用它，原因有几点：据我所知，Lucene的模糊搜索实现手动评估了每个被索引的术语的编辑距离。我觉得我想采取的方法(详见下文)，会更有效率。需要索引的数据可能是英语中的全部名词和代名词，所以你可以看到Lucene的模糊搜索方法是如何让我感到厌倦的。然后，我可以执行任何过滤操作(消除不在给定长度范围内的过滤

浏览 3提问于2012-07-06得票数 3

2回答

使用大量事务日志(在遗留索引dir中)恢复数据库的Neo4j

、

关于事务，neo4j 有这样的说法：try ( Transaction tx = graphDb.beginTx实际上应该是：try ( Transactiontx = graphDb.beginTx() ) /&#x

浏览 3提问于2014-02-12得票数 1

回答已采纳

1回答

想让搜索按我需要的方式进行.目前，我使用StandardAnalyzer()将数据分析为索引，然后使用QueryParser ()和查询()并执行.如果文档中有“可疑”这个词，我会把我的文档放在里面，但是如果我搜索“可疑”，我就不会得到任何结果.所以我的问题是，我想要实现词干或更好的查询我的搜索.我知道SnowballAnalyzer用于词干，但它在Lucene.Net 3.0.3中不可用，我不确定是否还有另一个查询可以为我提供所需的搜索功能.我试过使用FuzzyQuery，但是它只适用于一个单词搜索，而不是多个单词搜索.编辑如何在

浏览 2提问于2017-03-16得票数 0

2回答

Lucene中的模糊查询

、、

我在JAVA中使用Lucene，并根据公司名称在我们的数据库中索引一个表。在索引之后，我希望对我们希望输入到数据库中的值进行模糊匹配(Levenshtein距离)。正如我所说的，我已经在公司名称上为数据库建立了索引，然后具有以下代码： Qu

浏览 1提问于2010-07-29得票数 1

2回答

基于多个匹配列的Lucene查询评分

、

我正在使用Lucene直接搜索联系人与数据库中的人的一般联系信息，如名字，姓氏，电话号码，地址等。这个问题特别涉及到搜索的名字和姓氏。这就是我如何对这些名字进行索引。indexReader);Analyzer analyzer = new StandardAnalyzer(Version.LUCENEqueryString.split(" "); for(

浏览 0提问于2012-01-26得票数 0

回答已采纳

6回答

冬眠搜索，Lucene还是其他的选择？

、、、、

我有一个查询，它在表的大约11个字符串或文本字段上执行ILIKE，它不是很大(500 000)，但是对于ILIKE显然太大，搜索查询大约需要20秒。我脑子里想的是：我从需要搜索的所有列中组装了额外的TVECTOR列，并在其上创建了全文索引。全文搜索速度相当快。但是.我不能在我的.hbms中映射这个TVECTOR类型。

浏览 9提问于2011-05-25得票数 10

回答已采纳

5回答

Lucene是键/值HashMap的好选择吗？

、、、

我知道Lucene可以做到这一点，只要有两个字段: key和value；但是它效率高吗？有没有其他更简单的解决方案？注意:我需要持久化它。

浏览 0提问于2011-01-12得票数 1

回答已采纳

1回答

Sitecore将Lucene转换为Solr

、、

目前，我有lucene搜索引擎在我的sitecore 8的例子。它工作得很好，但在我们的生产服务器上发生了一些变化。生产服务器现在是两个具有负载平衡的内容交付服务器和一个内容管理服务器。我读到，在这种架构中很难使用lucene。他们建议用Solr代替lucene。我能够在这个的帮助下设置solr。我遇到的问题是将我的自定义搜索索引配置转换为SOLR配置(schema.xml)。我的搜索索引配置包含计算字段和只索引这些特定字段的包含模

浏览 0提问于2015-11-11得票数 0

回答已采纳

4回答

使用SQL Server配置Lucene.Net

、

有没有人使用Lucene.NET而不是使用sql server附带的全文搜索？如果是这样的话，我会对你是如何实现它感兴趣的。例如，您是否编写了一个windows服务，每小时查询一次数据库，然后将结果保存到lucene.net索引中？

浏览 1提问于2008-08-31得票数 60

回答已采纳

1回答

单词共现-在一组n-gram中查找术语的同现

、、、

我该如何在Java之类的语言中编写一个同现类，它接受一个充满n元语法的文件，并计算给定输入词的单词同现。在Hadoop的n-gram列表上，有没有使用Lucene (索引)或类似map-reduce的库或包？谢谢。

浏览 3提问于2011-06-29得票数 1

回答已采纳

4回答

Lucene是如何工作的

我想知道lucene搜索是如何如此快速地工作的。我在网上找不到任何有用的文档。如果你有任何东西(除了lucene源代码)可读，请告诉我。在我的例子中，使用带索引的mysql5 text search进行文本搜索查询大约需要18分钟。lucene搜索相同的查询只需要不到一秒钟的时间。

浏览 2提问于2010-04-25得票数 90

回答已采纳

2回答

SOLR性能调优

、、

为了保持一个简单的例子，如果我在omitNorms=true和omitTf=true中有一个索引字段(string)和一个存储字段(string)，那么我可以期望在索引和文档缓存中节省什么呢？如果要缓存文档缓存中的所有文档，如何计算所需的空间？比例-lucene和solr的文章说，FuzzyQuery是缓慢的。如果我使用solr的拼写检查功能，那么基本上是使用模糊查询对(因为拼写检查做了相同的编辑距离计算)？描述字符串的lucene字段缓存的部分有点混

浏览 4提问于2011-12-25得票数 11

回答已采纳

1回答

lucene索引安全文件

、

这是我的三个主要问题： 1)所有文件都存储在webdav服务器上，但是文件名、id文件类型等信息都存储在数据库(postgresql)中，所以当我创建索引时，我需要使用这两个信息。但主要的问题是这个水平是动态计算的。在计算文件的安全级别时，我们考虑了几个属性。静态属性是文件位置、文件所在的文件夹，还包括动态信息用户配置文件用户角色和部门。因此，当用户" Maggie“登录时，她只能搜索文件"test.pdf”，"test2.doc“等，但如果用户"Stev”登录，他有不同的配置文件，

浏览 0提问于2013-06-27得票数 0

回答已采纳

1回答

Solr Webapp正则表达式搜索

、、、

我正在跟踪Solr ，并启动和运行网络应用程序。我知道Solr有一个正则表达式搜索功能，我很难让它工作。在这里，我有一个名为MFR的字段，我希望使用正则表达式来匹配像AVAGO这样的值。但是，它给了我一些错误，比如无法正确解析它，然后我试图转义某些字符，而下面的所有操作都不起作用：MFR:AV/[A/]GOMFR:"AV\[A\]GO"MFR:"AV[A]GO" 现在，我开始问自己，Q参数是否是我可以放置正则表达式的正确位置，或者我甚至不在大

浏览 5提问于2016-03-01得票数 0

回答已采纳

1回答

lucene搜索功能是否适用于大尺寸文档？

、

我在用lucene进行搜索时遇到了一个问题。所以我想知道如

浏览 2提问于2010-04-27得票数 0

2回答

Lucene查询语言是黑客攻击的证据吗

显然，它不能用来破坏索引或破解卡号、密码等(除非有人愚蠢到把卡号或密码放在索引中)。有没有可能通过过于复杂的搜索来关闭服务器？我想我真正需要知道的是，我是否可以将用户输入的Lucene查询直接传递给搜索引擎，而不需要进行清理，并且不会受到恶意攻击。

浏览 2提问于2012-04-10得票数 3

回答已采纳

1回答

停止导出Server数据库以保护它

、

我有一个vb.net windows窗体应用程序，它在Server 2008上的./SQLEXPRESS实例上有一个数据库。我已经使用下面的链接创建了我的项目的设置。我考虑创建一个新的受密码保护的服务器(正如我在上面的演练中创建了数据库).当我的应用程序安装在用户的电脑上时，./sqlexpress除外。

浏览 2提问于2013-12-11得票数 0

回答已采纳

3回答

以of级的数据进行即时搜索

、、、

使用LUCENE进行索引后，索引文件的大小比原始文件大一倍。是否有可能减小索引文件的大小？如何在HADOOP中分发LUCENE索引文件以及如何在搜索环境中使用？或者是否有必要使用solr来分发LUCENE索引？我的需求是对of级的文件进行即时搜索...

浏览 3提问于2011-01-25得票数 1

回答已采纳

1回答

搜索数百万模糊散列的最佳方法

、、、

(如Levenshtein距离)来了解这两个文件的相似度。我尝试过分解散列，并使用Lucene (4.7.0)对它们进行索引，但是搜索似乎很慢，而且很乏味。我想知道我是否可以使用Lucene提供的任何算法来完成我所需要的工作，而不是直接计算编辑距离。我听说BK树是这类搜索的最佳索引方式，但我不知道该算法的可用实现( Lucene是否使用了这些实现？)我还听说，一个可能的解决方案是使用n-gram方法缩小搜索列表，但我不确定这与编辑距离计算在包容性和速度

浏览 4提问于2015-06-01得票数 6

点击加载更多