发布

Elastic Stack专栏

专栏成员
222
文章
502137
阅读量
53
订阅数
如何分析和优化 Elastic 部署的存储占用
你是否曾经查看你的索引,想要了解更多关于存储消耗的细节?或者你使用默认设置导入了自定义数据,想知道数据建模的哪些部分可以产生最大的影响?在这篇博客文章中,我们将探讨如何使用 Elastic 最近推出的 磁盘使用 API 来回答这些问题。
点火三周
2025-03-07
330
创建自定义 ES Rally Tracks 的分步指南
ES Rally 是一款用于测试 Elasticsearch® 性能的工具,能够运行和记录对比测试。
点火三周
2025-03-07
1020
HNSW 搜索的快速过滤模式
多年来,Apache Lucene 和 Elasticsearch 一直支持带有 kNN 查询的过滤搜索,允许用户检索符合特定元数据过滤条件的最近邻。然而,当处理半限制性过滤器时,性能一直较差。在 Apache Lucene 中,我们引入了一种 ACORN-1 的变体,这是一种新的过滤 kNN 搜索方法,在召回率几乎不下降的情况下,搜索速度提高了最多 5 倍。
点火三周
2025-03-05
790
使用 Elastic 分布式 OpenTelemetry 和 Langtrace 追踪基于 RAG 的聊天机器人
目前,大多数 AI 驱动的应用程序都集中在增加最终用户(如 SRE)从 AI 中获得的价值。主要的应用场景是创建各种聊天机器人。这些聊天机器人不仅使用大语言模型(LLMs),还使用 LangChain 等框架和搜索功能在对话过程中改进上下文信息(检索增强生成)。Elastic 的 基于 RAG 的聊天机器人示例应用 展示了如何使用包含嵌入的本地数据与 Elasticsearch 结合,从而在与连接到 LLM 的聊天机器人进行查询时正确提取最相关的信息。这是一个如何使用 Elasticsearch 构建基于 RAG 应用程序的优秀示例。然而,如何监控这个应用程序呢?
点火三周
2025-02-15
840
如何在隔离环境中使用GPU加速的LocalAI进行文本嵌入
你是否希望在Elasticsearch向量数据库之上构建一个RAG应用程序?是否需要对大量数据进行语义搜索?或者你需要在隔离环境中本地运行?这篇文章将告诉你如何实现这些需求。
点火三周
2025-02-07
951
拆解"ES已死"伪命题:Agentic RAG时代搜索引擎的终极形态
最近,某厂商发了一堆公关文章,翻来覆去地炒作 “ES 已死”,“放弃 ES”。这哪是什么正经的技术文章,说白了就是一场算计好的认知陷阱,妥妥的恶意误导。除了把用户带偏,对开源社区来说,有点开创了社区恶意流的先河,吃相难看。咱也犯不着在这没意义的事儿上浪费时间争论,咱直接聚焦到关键问题上:现在 Agentic RAG 都在重塑人机交互模式了,那下一代智能引擎的理想标准到底是啥样?
点火三周
2025-02-06
810
本地测试 DeepSeek R1 用于 RAG 与 Ollama 和 Kibana
最近大家都在讨论DeepSeek R1,这是中国幻方推出的新大型语言模型。新闻中充满了对这个具备链式推理能力且权重公开的LLM对行业影响的猜测。对那些好奇尝试这个新模型与 RAG 以及 Elasticsearch 向量数据库的功能的人来说,这里有一个快速教程,教你如何使用本地推理来使用 DeepSeek R1。在此过程中,我们将使用 Elastic 的 Playground 功能,并发现 Deepseek R1 对 RAG 的一些优缺点。
点火三周
2025-02-04
6501
使用Elasticsearch进行基于图的 RAG
检索增强生成(RAG)通过将大型语言模型(LLM)的输出与事实数据结合,提升其生成能力。然而,传统的基于文档的RAG存在一些局限,如上下文窗口狭窄和数据不连贯。一个有前景的解决方案是利用知识图谱,结构化地组织实体和关系,以实现更深入、更具上下文的检索。本文探讨了如何利用Elasticsearch高效地实现基于图的RAG,通过动态构建和修剪针对用户查询的知识子图,并将其线性化以供LLM使用,从而在不需要额外基础设施的情况下,实现可扩展性和精确性,为基于事实的AI应用开辟了新的可能性。
点火三周
2025-01-29
1630
向量数据库的兴衰
过去几年里,我观察到嵌入技术从大科技公司的“秘密武器”变成了普通开发者的工具。接下来发生的事情——向量数据库的淘金热、RAG(检索增强生成)的炒作周期,以及最终的调整——教会了我们关于新技术如何在更广泛的生态系统中找到自己的位置的宝贵经验。
点火三周
2025-01-20
850
深度剖析:可搜索快照性能测试报告
通过利用Elastic的可搜索快照,冷冻数据层能在低成本下保持良好的性能。这为在预算内管理海量数据并保持高效搜索性提供了令人信服的解决方案。
点火三周
2025-01-20
801
使用 Elastic Playground 与 PDF 文件交流
Elasticsearch 8.16 引入了一项新功能,允许你直接将 PDF 文件上传到 Kibana,并通过 Playground 对其进行分析。在本文中,我们将演示如何使用这一功能,通过上传一份 PDF 格式的简历,并利用 Playground 与其互动。
点火三周
2025-01-12
761
解密Elastic如何用生成式AI提升内部的工作效率
和所有组织一样,Elastic面临着越来越多的信息和数据,使得我们的团队很难保持信息的最新,也让员工从相关资源中找到答案。
点火三周
2025-01-12
1001
向量数据库的兴衰
过去几年里,我观察到嵌入技术从大科技公司的“秘密武器”变成了普通开发者的工具。接下来发生的事情——向量数据库的淘金热、RAG(检索增强生成)的炒作周期,以及最终的调整——教会了我们关于新技术如何在更广泛的生态系统中找到自己的位置的宝贵经验。
点火三周
2025-01-10
1151
Lucene 回顾 2024
2024年,Apache Lucene 迎来了许多重要的更新,包括三年来的首次重大版本更新,带来了许多激动人心的改进和新功能。让我们来看看其中的一些关键亮点。
点火三周
2025-01-10
1230
三分钟带你了解ES降本利器-LogsDB
在当今数字化的企业环境中,数据量呈爆炸式增长,日志数据的管理成为了企业面临的关键挑战之一。传统的日志存储方式早已不堪重负,不仅存在高昂的存储成本,漫长的查询等待时间也严重影响了企业的运营效率,成为企业发展的沉重负担。
点火三周
2025-01-09
2282
带你了解:Elasticsearch Serverless 搜索层的自动扩展
我们新推出的无服务器产品的一个关键特点是,允许用户部署和使用 Elastic,而无需管理底层的项目节点。为此,我们开发了搜索层自动扩展策略,根据多个参数动态选择节点的大小和数量。这个创新确保了你不再需要担心资源的过度配置或不足配置问题。
点火三周
2025-01-08
841
混合搜索的最佳实践
在本文中,我们将通过例子探讨混合搜索,并展示它在与单独使用词法搜索或语义搜索技术相比时的优势。
点火三周
2025-01-04
1041
简化安全分析:将 Amazon Bedrock 集成到 Elastic 中
在不断发展的云计算领域,保持强大的安全性并确保合规性对于各类组织来说都是一个关键挑战。随着企业越来越多地采用云技术,跨平台管理和保护数据的复杂性也在急剧增加。
点火三周
2024-12-27
930
SRE角色的演变:平衡可靠性、成本和创新
想象一下,你的首席技术官(CTO)走进团队会议,突然宣布:“本季度我们需要削减30%的云成本。”作为首席站点可靠性工程师(SRE),你可能会大吃一惊——你的工作不是确保系统可靠性吗?什么时候你开始负责公司的云账单了?
点火三周
2024-12-27
1170
利用本机 OpenTelemetry 发掘无限可能:优先考虑可靠性,而非专有限制
OpenTelemetry (OTel) 正在成为数据摄取的标准,因为它提供了一种与供应商无关的方式来摄取所有遥测信号的数据。Elastic Observability 在 OTel 的发展中处于领先地位,以下是一些重要的公告:
点火三周
2024-12-26
770
点击加载更多
社区活动
Python精品学习库
代码在线跑,知识轻松学
博客搬家 | 分享价值百万资源包
自行/邀约他人一键搬运博客,速成社区影响力并领取好礼
技术创作特训营·精选知识专栏
往期视频·干货材料·成员作品 最新动态
领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档