腾讯云
开发者社区
文档
建议反馈
控制台
登录/注册
首页
学习
活动
专区
工具
TVP
最新优惠活动
文章/答案/技术大牛
搜索
搜索
关闭
发布
精选内容/技术社群/优惠产品,
尽在小程序
立即前往
文章
问答
(5861)
视频
沙龙
1
回答
Elasticsearch
索引
像
pdf
文件
这样
的
非
结构化
数据
背后
的
原理
是什么
?
、
我读过
elasticsearch
的
全文搜索,但不能理解它用来
索引
pdf
文件
的
算法。
浏览 21
提问于2017-02-09
得票数 0
1
回答
json文档
的
倒排
索引
、
当我们谈论倒排
索引
时,我们总是谈论
索引
非
结构化
文本文档。但是
ElasticSearch
中
的
文档是JSON格式
的
,它们是“键”-“值”对。所以我想知道JSON文档
的
倒排
索引
是什么
样子
的
。换句话说,当我们
像
"select * from table where name = john“
这样
进行搜索时,ES做了什么?
浏览 1
提问于2018-04-18
得票数 4
1
回答
Elasticsearch
>可以基于字段建立
索引
吗
、
、
、
在ELK (
Elasticsearch
,Logstash,Kibana)
的
上下文中,我了解到Logstash有过滤器来利用grok将日志消息划分为不同
的
字段。根据我
的
理解,将
非
结构化
的
日志
数据
转换为更
结构化
的
数据
只会有所帮助。但是我不知道
Elasticsearch
如何利用字段(由grok完成)来提高查询性能?有没有可能
像
传统
的
关系
数据</
浏览 0
提问于2016-04-29
得票数 0
1
回答
Solr &
Elasticsearch
处理日志和
PDF
的
比较及Banana & Kibana
的
数据
可视化
、
、
、
、
Elasticsearch
和Solr在以下方面如何比较: 编辑 更具体地说,我试图弄清楚
PDF
文档或事件是如何被
索引
的
。我在
Elasticsearch
上做了一些工作,因为我是JSON
的
粉丝,所以当我尝试对
结构化
数据
进行
索
浏览 2
提问于2015-10-29
得票数 0
1
回答
弹性搜索中
的
精确匹配
、
、
、
、
我已经在elastic搜
索引
擎中
索引
了大量
的
pdf
文件
。我已经使用滚雪球分析器分析了这些
非
结构化
数据
。这将使用snowball过滤器将
像
"running“
这样
的
单词转换为"run”。我不能使用另一个字段,因为这些是更大
的
文件
,可以在更大
的
范围内增加
索引
大小。 那么我如何使用雪球过滤器来使用
像
浏览 12
提问于2016-09-02
得票数 1
3
回答
Informatica中
的
PDF
数据
源
、
Informatica如何处理
像
PDF
这样
的
非
结构化
数据
源?如果表格报告存储为
PDF
,我们能否将其作为表格
数据
(如.NET中
的
数据
表)从
PDF
中读出?
浏览 0
提问于2009-04-21
得票数 1
1
回答
什么是非
结构化
数据
,为什么要使用
非
关系
数据
库管理系统呢?
、
我在网上读到了一些关于
非
结构化
数据
的
文章,比如这一个。
非
结构化
数据
是不按照预先设定
的
数据
模型或模式排列
的
信息,因此不能存储在传统
的
关系
数据
库或关系
数据
库管理系统中。因此,我们可以将
非
结构化
数据
存储在传统
的
关系
数据
库管理系统中。 他们给出
的
浏览 0
提问于2021-02-26
得票数 2
回答已采纳
1
回答
ElasticSearch
和缓存之间
的
根本区别
是什么
?
、
、
从理论上讲,您不能将来自SQL查询
的
搜索结果缓存到类似于ElastiSearch
的
数据
库中吗?我知道您会遇到失效问题,但是ElastiSearch和Redis
这样
的
缓存之间有什么根本
的
区别呢?
浏览 3
提问于2020-07-05
得票数 0
1
回答
什么是服务器日志,如何生成服务器日志?
、
、
、
、
谁能解释一下服务器日志和如何为我
的
Node.js网站生成它们。我才刚刚开始。kibana和书面线索是做什么
的
?它们将如何监控我
的
服务器?
浏览 17
提问于2017-06-30
得票数 1
1
回答
如何将此chm
文件
转换为
pdf
?
、
、
、
我想把chm
文件
转换成一个
pdf
文件
。口径
的
命令电子书-转换ebook-convert 1.chm 1.
pdf
只将前7页
的
chm
文件
转换成一个
pdf
文件
,而chm
文件
有更多
的
页面。如何将整个chm
文件
转换为
pdf
文件
?谢谢。
浏览 0
提问于2015-12-04
得票数 4
1
回答
如何上载/
索引
富/
结构化
文本文档以使用
ElasticSearch
进行搜索?
、
、
、
、
我正在围绕包括Microsoft文档、PowerPoints、
PDF
和文本
文件
在内
的
文档建立一个搜
索引
擎。我已经成功地下载并安装了
ElasticSearch
并让它运行(从命令提示符和浏览器-localhost:9200可见)。 我可以上传和搜索手动输入
的
数据
(可以在几个在线教程中找到--比如这个:)。现在我要做(大
的
?)从搜索手动输入
的
数据
跳转到搜索大量
结构化
文本
文件
。我
的
浏览 4
提问于2014-06-11
得票数 1
回答已采纳
1
回答
在kibana上可视化
pdf
数据
、
、
、
我有ELK(Logstash,
Elasticsearch
,Kibana)堆栈设置工作。 可视化是使用CSV
文件
创建
的
,这些
文件
使用logstash加载到kibana。但是,我已经使用
elasticsearch
对
PDF
、DOC
文件
进行了
索引
,并能够查看kibana上
的
数据
并在其中进行搜索。但是,我需要可视化
的
PDF
和DOC格式
的
文本在kibana
像
浏览 11
提问于2018-01-19
得票数 1
2
回答
哪种
数据
库适合
非
结构化
数据
、
我正在做一个包含大量
非
结构化
数据
的
项目。是否有适用于
非
结构化
数据
的
数据
库软件或工具?如果没有工具或其他软件,如果mysql或sql server是我唯一
的
选择,我会使用什么
数据
库设计?
浏览 3
提问于2011-12-10
得票数 3
1
回答
非
结构化
数据
是什么
意思?在使用ETL工具处理
数据
方面?
、
我和一个队友在讨论我们
的
工作经验,他说他在一个叫做Informatica
的
工具中工作。他
的
工作包括从EDI
文件
中提取所需
的
信息并进行转换,然后将它们加载到
数据
库中。他说,EDI
文件
具有
非
结构化
数据
,而不是
像
.CSV和.SQL
这样
的
格式,而在EDI
文件
中,列由“\”符号分隔。在我看来,EDI和CSV没有任何区别,只有CSV是',‘分离’和
浏览 5
提问于2015-09-01
得票数 1
回答已采纳
1
回答
用芹菜作为一种简单
的
罗格斯塔什替代品
、
、
、
、
我
的
第一个想法是
Elasticsearch
+Kibana,但我不想让我
的
部署过于复杂(我已经在使用
Elasticsearch
+Kibana)。所以,当我可以将事件直接发送到
Elasticsearch
(以芹菜为背景)时,我想知道为什么我需要
像
Logstash
这样
的
东西。例如,如果我必须设置Redis或RabbitMQ来向Logstash发送消息,以便它可以发送到
Elasticsearch
,那么我也可以对芹菜做同样
的
操
浏览 5
提问于2016-11-15
得票数 0
回答已采纳
1
回答
用Java代码
索引
ElasticSearch
格式
的
文件
我正在尝试使用Java代码在elastic search 6.3.2中
索引
PDF
文件
。到目前为止,我已经编写了以下代码在ES中保存
pdf
。代码运行良好,我能够保存我
的
Base64编码
的
字符串在ES中。我想知道我所遵循
的
方法是正确
的
还是错误
的
?有没有更好
的
方法呢?以下是我
的
代码: InputStream inputStream = new FileInputStream(new
浏览 48
提问于2018-08-01
得票数 0
回答已采纳
2
回答
创建一个研究
数据
库
、
我想创建一个研究
数据
库,在那里我可以存储和检索文章(
PDF
文件
)。有什么建议吗? 我看过几个关系
数据
库教程,它们都没有提到文档
的
存储和检索,只有原始
数据
。
浏览 14
提问于2015-09-15
得票数 2
1
回答
使用SQL Server 2012建立全文
索引
,但不存储
文件
、
、
我想知道,是否可以在不将文档存储在
数据
库中
的
情况下使用SQL Server 2012
的
全文搜索?我知道有几种服务提供
文件
索引
,而不存储
文件
,而只存储已
索引
的
数据
;是否可以
这样
使用SQL Server 2012? 法比奥。
浏览 4
提问于2012-11-14
得票数 2
回答已采纳
1
回答
Lucene,Sphinx (或任何其他引擎)可以
索引
二进制
数据
吗?
、
、
、
我已经有了一个基于Server 2008
的
应用程序,在这里,我通过存储二进制
文件
(以及
文件
扩展名)来使用全文搜索。这意味着同一列可以存储doc,xls,
pdf
,docx.等等,我选择了这种方法(知道这会很昂贵),因为我有各种各样
的
文件
可以上传,我不想遇到疯狂
的
转换文本从各种类型(xls,xlsx,doc,docx,
pdf
等)
的
文件
。请在mysql中为ex提供一些全文搜索选项: MySql全文搜索(不
索引</e
浏览 1
提问于2013-10-03
得票数 1
回答已采纳
1
回答
Mongo和Mysql(MyIsam)之间有很大
的
速度差异吗?
、
、
给出以下情况:是其中任何一个
的
选择速度都要好
的
吗?在其中任何一个更新/插入速度更快吗?在其中任何一个都有显著
的
优势吗?
浏览 3
提问于2012-03-02
得票数 3
点击加载更多
扫码
添加站长 进交流群
领取专属
10元无门槛券
手把手带您无忧上云
相关
资讯
全文搜索引擎Elasticsearch,这篇文章给讲透了!
了解ElasticSearch
谷歌是怎么把白痴和特朗普联系起来的?
Elasticsearchの初体验 一文了解她
如何处理大规模的日志数据?
热门
标签
更多标签
云服务器
ICP备案
云直播
对象存储
腾讯会议
活动推荐
运营活动
广告
关闭
领券