腾讯云
开发者社区
文档
建议反馈
控制台
登录/注册
首页
学习
活动
专区
工具
TVP
最新优惠活动
文章/答案/技术大牛
搜索
搜索
关闭
发布
精选内容/技术社群/优惠产品,
尽在小程序
立即前往
文章
问答
(126)
视频
沙龙
1
回答
如
何在
顶级
GraphDB
lucene
索引
上
计算
lucene
FuzzyQuery
?
、
GraphDB
支持FTS
Lucene
插件来构建RDF‘分子’来高效地
索引
文本。然而,当你搜索的单词中有拼写错误时,
Lucene
将不会检索到结果。我想知道是否有可能在
GraphDB
for FTS的
Lucene
Index
上
实现一个基于Damerau-Levenshtein算法的
FuzzyQuery
。这是我在WordNet RDF中为NounSynset的标签创建的
索引
。
浏览 13
提问于2019-05-18
得票数 1
回答已采纳
2
回答
我对数据集的模糊搜索方法会比使用
Lucene
更好吗?
、
、
、
、
后端是用Java编写的,每个人在这里推荐的搜
索引
擎也是用Java编写的。然而,我不愿使用它,原因有几点: 据我所知,
Lucene
的模糊搜索实现手动评估了每个被
索引
的术语的编辑距离。我觉得我想采取的方法(详见下文),会更有效率。需要
索引
的数据可能是英语中的全部名词和代名词,所以你可以看到
Lucene
的模糊搜索方法是如何让我感到厌倦的。然后,我可以执行任何过滤操作(消除不在给定长度范围内的过滤
浏览 3
提问于2012-07-06
得票数 3
2
回答
使用大量事务日志(在遗留
索引
dir中)恢复数据库的Neo4j
、
关于事务,neo4j 有这样的说法:try ( Transaction tx =
graphDb
.beginTx实际
上
应该是:try ( Transactiontx =
graphDb
.beginTx() ) /
浏览 3
提问于2014-02-12
得票数 1
回答已采纳
1
回答
Lucene
.Net 3.0.3使用词干搜索或搜索最佳匹配
、
想让搜索按我需要的方式进行.目前,我使用StandardAnalyzer()将数据分析为
索引
,然后使用QueryParser ()和查询()并执行.如果文档中有“可疑”这个词,我会把我的文档放在里面,但是如果我搜索“可疑”,我就不会得到任何结果.所以我的问题是,我想要实现词干或更好的查询我的搜索.我知道SnowballAnalyzer用于词干,但它在
Lucene
.Net 3.0.3中不可用,我不确定是否还有另一个查询可以为我提供所需的搜索功能.我试过使用
FuzzyQuery
,但是它只适用于一个单词搜索,而不是多个单词搜索.编辑如
何在
浏览 2
提问于2017-03-16
得票数 0
2
回答
Lucene
中的模糊查询
、
、
我在JAVA中使用
Lucene
,并根据公司名称在我们的数据库中
索引
一个表。在
索引
之后,我希望对我们希望输入到数据库中的值进行模糊匹配(Levenshtein距离)。正如我所说的,我已经在公司名称
上
为数据库建立了
索引
,然后具有以下代码: Qu
浏览 1
提问于2010-07-29
得票数 1
2
回答
基于多个匹配列的
Lucene
查询评分
、
我正在使用
Lucene
直接搜索联系人与数据库中的人的一般联系信息,
如
名字,姓氏,电话号码,地址等。这个问题特别涉及到搜索的名字和姓氏。这就是我如何对这些名字进行
索引
。indexReader);Analyzer analyzer = new StandardAnalyzer(Version.
LUCENE
queryString.split(" "); for(
浏览 0
提问于2012-01-26
得票数 0
回答已采纳
6
回答
冬眠搜索,
Lucene
还是其他的选择?
、
、
、
、
我有一个查询,它在表的大约11个字符串或文本字段
上
执行ILIKE,它不是很大(500 000),但是对于ILIKE显然太大,搜索查询大约需要20秒。我脑子里想的是: 我从需要搜索的所有列中组装了额外的TVECTOR列,并在其
上
创建了全文
索引
。全文搜索速度相当快。但是.我不能在我的.hbms中映射这个TVECTOR类型。
浏览 9
提问于2011-05-25
得票数 10
回答已采纳
5
回答
Lucene
是键/值HashMap的好选择吗?
、
、
、
我知道
Lucene
可以做到这一点,只要有两个字段: key和value;但是它效率高吗?有没有其他更简单的解决方案?注意:我需要持久化它。
浏览 0
提问于2011-01-12
得票数 1
回答已采纳
1
回答
Sitecore将
Lucene
转换为Solr
、
、
目前,我有
lucene
搜
索引
擎在我的sitecore 8的例子。它工作得很好,但在我们的生产服务器
上
发生了一些变化。生产服务器现在是两个具有负载平衡的内容交付服务器和一个内容管理服务器。我读到,在这种架构中很难使用
lucene
。他们建议用Solr代替
lucene
。 我能够在这个的帮助下设置solr。我遇到的问题是将我的自定义搜索
索引
配置转换为SOLR配置(schema.xml)。我的搜索
索引
配置包含
计算
字段和只
索引
这些特定字段的包含模
浏览 0
提问于2015-11-11
得票数 0
回答已采纳
4
回答
使用SQL Server配置
Lucene
.Net
、
有没有人使用
Lucene
.NET而不是使用sql server附带的全文搜索? 如果是这样的话,我会对你是如何实现它感兴趣的。例如,您是否编写了一个windows服务,每小时查询一次数据库,然后将结果保存到
lucene
.net
索引
中?
浏览 1
提问于2008-08-31
得票数 60
回答已采纳
1
回答
单词共现-在一组n-gram中查找术语的同现
、
、
、
我该如
何在
Java之类的语言中编写一个同现类,它接受一个充满n元语法的文件,并
计算
给定输入词的单词同现。在Hadoop的n-gram列表
上
,有没有使用
Lucene
(
索引
)或类似map-reduce的库或包? 谢谢。
浏览 3
提问于2011-06-29
得票数 1
回答已采纳
4
回答
Lucene
是如何工作的
我想知道
lucene
搜索是如何如此快速地工作的。我在网上找不到任何有用的文档。如果你有任何东西(除了
lucene
源代码)可读,请告诉我。在我的例子中,使用带
索引
的mysql5 text search进行文本搜索查询大约需要18分钟。
lucene
搜索相同的查询只需要不到一秒钟的时间。
浏览 2
提问于2010-04-25
得票数 90
回答已采纳
2
回答
SOLR性能调优
、
、
为了保持一个简单的例子,如果我在omitNorms=true和omitTf=true中有一个
索引
字段(string)和一个存储字段(string),那么我可以期望在
索引
和文档缓存中节省什么呢?如果要缓存文档缓存中的所有文档,如何
计算
所需的空间?比例-
lucene
和solr的文章说,
FuzzyQuery
是缓慢的。如果我使用solr的拼写检查功能,那么基本
上
是使用模糊查询对(因为拼写检查做了相同的编辑距离
计算
)?描述字符串的
lucene
字段缓存的部分有点混
浏览 4
提问于2011-12-25
得票数 11
回答已采纳
1
回答
lucene
索引
安全文件
、
这是我的三个主要问题: 1)所有文件都存储在webdav服务器
上
,但是文件名、id文件类型等信息都存储在数据库(postgresql)中,所以当我创建
索引
时,我需要使用这两个信息。但主要的问题是这个水平是动态
计算
的。在
计算
文件的安全级别时,我们考虑了几个属性。静态属性是文件位置、文件所在的文件夹,还包括动态信息用户配置文件用户角色和部门。因此,当用户" Maggie“登录时,她只能搜索文件"test.pdf”,"test2.doc“等,但如果用户"Stev”登录,他有不同的配置文件,
浏览 0
提问于2013-06-27
得票数 0
回答已采纳
1
回答
Solr Webapp正则表达式搜索
、
、
、
我正在跟踪Solr ,并启动和运行网络应用程序。我知道Solr有一个正则表达式搜索功能,我很难让它工作。在这里,我有一个名为MFR的字段,我希望使用正则表达式来匹配像AVAGO这样的值。但是,它给了我一些错误,比如无法正确解析它,然后我试图转义某些字符,而下面的所有操作都不起作用:MFR:AV/[A/]GOMFR:"AV\[A\]GO"MFR:"AV[A]GO" 现在,我开始问自己,Q参数是否是我可以放置正则表达式的正确位置,或者我甚至不在大
浏览 5
提问于2016-03-01
得票数 0
回答已采纳
1
回答
lucene
搜索功能是否适用于大尺寸文档?
、
我在用
lucene
进行搜索时遇到了一个问题。所以我想知道如
浏览 2
提问于2010-04-27
得票数 0
2
回答
Lucene
查询语言是黑客攻击的证据吗
显然,它不能用来破坏
索引
或破解卡号、密码等(除非有人愚蠢到把卡号或密码放在
索引
中)。 有没有可能通过过于复杂的搜索来关闭服务器?我想我真正需要知道的是,我是否可以将用户输入的
Lucene
查询直接传递给搜
索引
擎,而不需要进行清理,并且不会受到恶意攻击。
浏览 2
提问于2012-04-10
得票数 3
回答已采纳
1
回答
停止导出Server数据库以保护它
、
我有一个vb.net windows窗体应用程序,它在Server 2008
上
的./SQLEXPRESS实例上有一个数据库。 我已经使用下面的链接创建了我的项目的设置。我考虑创建一个新的受密码保护的服务器(正如我在上面的演练中创建了数据库).当我的应用程序安装在用户的电脑
上
时,./sqlexpress除外。
浏览 2
提问于2013-12-11
得票数 0
回答已采纳
3
回答
以of级的数据进行即时搜索
、
、
、
使用
LUCENE
进行
索引
后,
索引
文件的大小比原始文件大一倍。是否有可能减小
索引
文件的大小?如
何在
HADOOP中分发
LUCENE
索引
文件以及如
何在
搜索环境中使用?或者是否有必要使用solr来分发
LUCENE
索引
?我的需求是对of级的文件进行即时搜索...
浏览 3
提问于2011-01-25
得票数 1
回答已采纳
1
回答
搜索数百万模糊散列的最佳方法
、
、
、
(
如
Levenshtein距离)来了解这两个文件的相似度。我尝试过分解散列,并使用
Lucene
(4.7.0)对它们进行
索引
,但是搜索似乎很慢,而且很乏味。我想知道我是否可以使用
Lucene
提供的任何算法来完成我所需要的工作,而不是直接
计算
编辑距离。我听说BK树是这类搜索的最佳
索引
方式,但我不知道该算法的可用实现(
Lucene
是否使用了这些实现?)我还听说,一个可能的解决方案是使用n-gram方法缩小搜索列表,但我不确定这与编辑距离
计算
在包容性和速度
浏览 4
提问于2015-06-01
得票数 6
点击加载更多
扫码
添加站长 进交流群
领取专属
10元无门槛券
手把手带您无忧上云
相关
资讯
深度解析 Lucene 轻量级全文索引实现原理
Elasticsearch如何检索数据
爱奇艺逗芽表情搜索分析与实践
Lucene全文检索的基本原理
分享7款开源的全文搜索引擎!
热门
标签
更多标签
云服务器
ICP备案
对象存储
腾讯会议
云直播
活动推荐
运营活动
广告
关闭
领券