腾讯云
开发者社区
文档
建议反馈
控制台
登录/注册
首页
学习
活动
专区
工具
TVP
最新优惠活动
文章/答案/技术大牛
搜索
搜索
关闭
发布
精选内容/技术社群/优惠产品,
尽在小程序
立即前往
文章
问答
(9999+)
视频
沙龙
1
回答
Lucene
位置
索引
是
如何
高效
工作
的
?
、
、
、
、
通常,任何搜
索引
擎软件都会创建倒排
索引
,以提高搜索速度。每当在quote中有一个搜索查询,比如"Harry Potter Movies",这意味着应该有单词
位置
的
精确匹配,而在搜索中,比如hello /4 world,它通常意味着在单词hello /4 world
的
左侧或右侧4个单词
的
距离范围内找到单词world。我
的
问题
是
,我们可以采用线性检查帖子和计算单词距离之类
的
解决方案,但如果集合真的很
浏览 20
提问于2021-04-15
得票数 1
回答已采纳
2
回答
在
Lucene
.net中使用日期范围
、
我了解
Lucene
.net
是
如何
为文本
索引
工作
的
。我是否能够根据给定
的
日期范围
高效
地搜索文档?或者
Lucene
.net只会使用文本匹配来匹配日期?
浏览 2
提问于2008-11-17
得票数 3
回答已采纳
2
回答
如何
查看
Lucene
索引
、
我正在努力学习和理解
lucene
是
如何
工作
的
,
lucene
索引
中
的
内容是什么。基本上,我想看看数据在
lucene
索引
中
是
如何
表示
的
?我使用
lucene
-core 8.6.0作为依赖项 private Document create(
浏览 5
提问于2020-07-26
得票数 3
1
回答
是否有一种
索引
结构(数据结构)或算法可以
高效
、快速地执行邻近搜索?
、
、
我们知道,elasticsearch使用
Lucene
或著名
的
搜
索引
擎Google会保持
索引
文档中单词
的
偏移距离,以获得更好
的
结果。上述两种软件都在上执行
索引
和搜索,
的
数据量很大。内部
高效
快速
的
特殊
索引
(或数据结构)或算法是什么?那么成本(时间和空间)呢?是否有网页或文档解释谷歌或elasticsearch (
lucene
)使用
的
基于偏移距离
的
算法
浏览 0
提问于2017-07-12
得票数 1
2
回答
Apache
Lucene
- S3目录
、
、
、
如何
将apache
lucene
数据目录和
索引
目录
位置
配置为s3
位置
?String indexDir = "C:\\
Lucene
\\Index"; String dataDir = "C:\\
Lucene</e
浏览 2
提问于2018-04-20
得票数 1
1
回答
高效
的
、独立于数据库
的
PHP地理空间
索引
实现?Zend_Search_
Lucene
扩展?
、
我将经度信息存储在一个MySQL数据库中,该数据库没有很好
的
地理空间搜索支持。我已经为
高效
的
全文搜索维护了一个单独
的
Lucene
文本搜索
索引
,所以我研究了
Lucene
的
地理空间扩展;但它似乎只适用于Java实现,而不适用于我使用
的
Zend_Search_
Lucene
PHP版本。有没有类似的东西可以让我维护一个独立
的
、独立于数据库
的
地理空间
索引
?一个好
的<
浏览 0
提问于2010-12-03
得票数 2
1
回答
solr在哪里存储搜索
索引
,在数据库还是文件中?
、
、
我
是
Solr
的
新手。有人能知道它在哪里存储
索引
吗。提前感谢编辑-2在哪里可以找到
索引
目录,哪个存储数据文件夹?
浏览 5
提问于2011-10-07
得票数 20
回答已采纳
2
回答
如何
与
Lucene
一起在具有多个
位置
的
文档上进行地理空间搜索?
、
、
、
、
我有一个场景,其中
Lucene
索引
中
的
单个文档可能有多个
位置
。该文档
是
分配给它
的
Sitecore项和N个
位置
项
的
表示。点和半径将用于搜索在该半径中至少有一个
位置
的
所有文档。需要使用分配给该文档
的
最接近
的
匹配
位置
,按距离对文档进行排序。我已经将
lucene
.net.contrib.spatial用于单点,但我不能很好地拼凑出多点将
如何</e
浏览 6
提问于2016-05-06
得票数 4
回答已采纳
1
回答
Lucene
指数将有助于加快计数发生吗?
、
我有一个大
的
文本文件,我想从其中统计已知短语
的
出现情况。目前,我将整个文本文件逐行读取到内存中,并使用“查找”函数检查文本文件中是否存在特定短语:对于大型文件来说,这是非常慢
的
。建立一个包含所有可能短语
的
索引
并将它们存储在一个词典中会有帮助,但问题
是
自己创建所有有意义
的
短语
是
很有挑战性
的
。我知道
Lucene
搜
索引
擎支持短语搜索。在使用
Lu
浏览 1
提问于2020-02-10
得票数 0
回答已采纳
1
回答
我可以使用
Lucene
.net
索引
和连接来自多个源
的
结果吗?
我想使用
Lucene
.net来
索引
来自各种来源
的
数据(例如本地文件系统和数据库)。但是,我想链接来自这两个源
的
数据(基于公共字段,例如ID),并将合并
的
信息显示给用户。据我所知,我有三个选择。在
索引
每个源之后: 使用
Lucene
.net将搜索查询中
的
索引
组合到单个结果集中,创建一些自定义代码来追溯关联结果;或者在数据库中存储单独
的
结果集(在我
的
例子中,它将不是源数据库)。然后根据一个连接数据
浏览 1
提问于2011-11-14
得票数 0
回答已采纳
1
回答
没有
位置
和偏移量
索引
的
lucene
短语
是
如何
工作
的
?
、
、
、
Lucene
允许你使用
位置
和偏移量来
索引
词条,但即使没有
位置
和偏移量,也可以使用短语搜索。那么
lucene
如何
在没有这些信息
的
情况下计算
索引
中
的
单词顺序呢?
浏览 1
提问于2012-03-13
得票数 3
1
回答
每次Java应用程序启动时避免
Lucene
指数化
、
、
、
问题:我
的
问题
是
Lucene
在我
的
Java应用程序中所做
的
指数化
工作
每次重新启动应用程序时都要花费50分钟。我尝试过
的
是
:
索引
保存在内存中,所以我将属性更改为"hibernate.directory.provider=filesystem“。因此,
索引
保存在HDD
位置
,但不幸
的
是
,在应用程序重新启动时仍在执行指数化操作。 问:在重新启动应用程序时,有没有
浏览 2
提问于2021-10-26
得票数 0
回答已采纳
1
回答
有没有一个通用
的
网络前端为
Lucene
?
、
我正在构建一个应用程序,它必须以某种方式存储一些千兆字节
的
日志数据(不是确切
的
日志数据,而是类似的日志数据),以便能够
高效
地查询日志数据。我计划使用
Lucene
或其他基于
Lucene
的
东西。当数据通过API进入
索引
时,我不希望为查询数据构建自己
的
前端。这里我不需要任何花哨
的
东西,只是查询
索引
的
一种简单方法。 我不确定Solr是否能解决我
的
问题。是否有类似于查询
Lucene<
浏览 6
提问于2015-12-24
得票数 1
回答已采纳
1
回答
在elasticsearch中查找包含术语
的
文档数
、
、
、
我有一个Elasticsearch
索引
,其中包含了大约25亿个文档,在一个分析
的
字段中包含了大约1800万个不同
的
术语。是否有可能在不搜索
索引
的
情况下快速计算包含一个术语
的
文档数量?似乎ES会在分析字段时存储这些信息,或者可能能够计算倒排
索引
的
长度。如果有一种方法可以搜索多个术语并获得每个术语
的
文档频率,那就更好了。我想经常这样做数千次,但我不知道是否有一种有效
的
方法。
浏览 0
提问于2017-06-16
得票数 0
回答已采纳
1
回答
倒排
索引
对二叉树对.?
、
我一直在使用弹性搜索(由
Lucene
提供动力)和它
的
棒。无论我向它扔了什么,都会燃烧得很快。 我想知道为什么现在快了。我理解它使用倒排
索引
,我也部分理解了基于我发现
的
几篇文章和几段youtube上
的
好视频来解释它
的
内容,但为什么这比Mysql或Mongo中
的
二叉树要快得多呢?我知道这有点像橘子比较,但我没有找到任何真正好
的
解释(就像并排
的
),倒排
索引
与二叉树
索引
的
工作</e
浏览 0
提问于2012-08-31
得票数 3
回答已采纳
2
回答
在C#中
高效
地搜索目录中
的
关键字
、
、
、
我正在尝试想出最有效
的
方法来搜索充满文本文件
的
目录(可能
是
2000个文件,每个文件大约150行)中
的
关键字。如果我只是搜索一个关键字,那么性能不会有太大问题,但在我
的
应用程序中,我希望以后能够搜索不同
的
关键字,可能会搜索多次。因此,每次迭代整个文件集合似乎很耗时。而且在内存中存储一切似乎也相当昂贵
的
内存。做这件事最好
的
方法是什么?我不能访问SQL数据库或类似的东西,所以我不能临时将内容转储到数据库中并定期进行搜索;它只是一个常规
的
Wi
浏览 0
提问于2012-11-05
得票数 4
回答已采纳
1
回答
在Zend框架中向
Lucene
索引
添加内容
、
、
、
每次我向内部网添加一个新模块时,我都会添加功能来
索引
用户插入
的
模块
的
内容。 问题
是
,搜索
工作
正常,但前提
是
我必须从头开始重建所有
索引
。每当我向模块添加新内容时,它们都不会出现在搜索结果中(在完全重建
索引
之前存在
的
内容仍然显示为搜索结果)。我很困惑,因为重新构建整个
索引
的
函数只是调用一个循环中向其添加一个项目的函数,所以据我所知,它应该同样
工作
。但很明显,事实并非如此。这些
是
浏览 3
提问于2016-08-10
得票数 2
回答已采纳
1
回答
理解
lucene
片段
我在一个文件夹中有这3个文件,它们都与
Lucene
创建
的
索引
相关: 它们都是用来做什么
的
,是否有可能将它们转换成人类可读
的
格式,以便更多地了解
lucene
如何
使用它
的
索引
?
浏览 3
提问于2013-07-12
得票数 7
回答已采纳
4
回答
Lucene
和Elasticsearch有什么区别?
、
我知道ElasticSearch
是
建立在Apache
的
基础上
的
,但我想知道两者之间
的
显著差异。
浏览 4
提问于2015-01-06
得票数 195
回答已采纳
1
回答
是否需要用于在
Lucene
中创建
索引
的
原始文件?
、
、
首先,正如我在个人资料中所解释
的
,我不是英语本地人,所以我希望你能原谅我犯了一些语法错误。我想从基于.txt
的
字典中
索引
单词。一旦
Lucene
完成了它
的
索引</e
浏览 3
提问于2014-11-26
得票数 1
回答已采纳
点击加载更多
扫码
添加站长 进交流群
领取专属
10元无门槛券
手把手带您无忧上云
相关
资讯
搜索引擎是如何工作的?
搜索引擎是如何工作的给孩子讲科技
IP地址是如何定位你的位置
搜索引擎排名是如何完成的?
为什么它们是高效工作的基石?-DeepSeek
热门
标签
更多标签
云服务器
ICP备案
腾讯会议
云直播
对象存储
活动推荐
运营活动
广告
关闭
领券