Elastic Observability 提供精准的洞察,通过 AI 助手、基于 OpenTelemetry (OTel) 的标准化解决方案、扩展至性能分析功能以及增强的日志分析,加速问题解决。
随着 AI 和生成式 AI 的兴起,可观测性正进入一个更加现代化的时代。这些 AI 技术的普及使得可观测性从一个手动、被动的过程,向更主动的 AI 驱动方法转变,能够自动诊断问题并进行修复。
过去,单体应用程序运行在数据中心,软件更新是很少发生的事情。运维团队依赖服务器、网络和存储工具来监控其技术孤岛,手动分析数据,并通过电话会议与他人一起识别、分类和解决问题。随着云计算的出现及其复杂性、基础设施的抽象化和更快的开发周期,运维和 SRE 团队需要可观测性来应对这些新的“未知的未知”。尽管可观测性工具使得连接点稍微变得容易了一些,但整体工作仍然是手动的,并且面临工具孤岛和成本急剧增加的挑战。
凭借在 AI 和机器学习 (ML)、向量数据库、Elasticsearch 相关性引擎 (ESRE) 和检索增强生成 (RAG) 方面的多年经验和创新,Elastic 处于有利地位,可以引领 IT 团队进入这个由 AI 驱动的可观测性新时代——将指标、日志、跟踪和性能分析整合到一个平台中,提供可操作的洞察。
正如 RedMonk 高级分析师 Kelly Fitzpatrick 所述:
2023 年的可观测性挑战在于导航变革性技术和新兴标准,同时管理日益复杂的系统。Elastic 致力于帮助组织应对这些挑战,通过设计用于适应这一不断演变的操作环境的工具。通过其可观测性的 AI 助手,以及对 OpenTelemetry 的持续承诺和 Universal Profiling 的全面可用性,Elastic 旨在帮助 SRE 团队更好地管理系统的成本和复杂性。
Elastic 利用其多年的机器学习专业知识和与生成式 AI 平台的集成,通过相关的、情境感知的 AI 驱动洞察来变革可观测性。Elastic AI 助手可观测性(现处于技术预览阶段),由 Elasticsearch 相关性引擎 (ESRE) 提供支持,增强了对应用程序错误、日志消息和警报的理解,同时提供优化代码效率的建议。此外,Elastic AI 助手的交互式聊天界面允许 SRE 在一个地方交互地聊天和可视化所有相关的遥测数据,同时利用专有的内部信息进行修复。
Elastic 允许用户向助手提供私有数据,如操作手册、过去事件的历史、案例历史等。使用由 Elastic Learned Sparse EncodeR (ELSER) 提供支持的推理处理器,助手可以访问最相关的数据来回答特定问题或执行任务。助手可以通过持续使用和引导学习来学习和增长其知识库。SRE 可以教助手解决特定问题,以便将来在该场景下提供支持,并帮助撰写停机报告、更新操作手册和增强自动修复功能。通过 Elastic AI 助手和机器学习功能的结合,SRE 可以更快、更主动地定位和解决问题,消除繁琐的手动数据检索过程。
通过将内部、业务特定的信息与 LLM 集成,Elastic AI 助手提供高度相关的结果,帮助加速问题识别和解决,极大提升团队的 AIOps 能力。
了解更多关于 Elastic AI 助手如何提供情境感知洞察 来解决可观测性问题。
Elastic 提供对 OpenTelemetry 的原生支持,并致力于未来大多数用户将选择 OTel 作为其 Elastic Observability 和 Elastic Security 的 Schema 架构和数据收集架构。基于其对 OpenTelemetry (OTel) 的 Elastic Common Schema (ECS) 贡献,Elastic 正在巩固其建立 OpenTelemetry 作为行业标准的承诺和投资。这使得客户能够采用开放标准并实现开放摄取的好处。Elastic 正在继续对 OpenTelemetry 做出更多贡献,这将使 SRE 能够使用标准化方法摄取指标、日志和跟踪,以降低成本、增加可见性和实现供应商独立性。
了解如何使用 OpenTelemetry 和 Elastic 来为流行语言进行仪器化,采用标准化的开放日志格式 (ECS),并使用 AI 和 ML 分析数据,以实现 使用 OpenTelemetry 达到供应商独立性。
Elastic 的 Universal Profiling™ 现已全面开放,允许企业实现成本控制、资源优化和可持续增长。复杂的云原生环境通常会给 SRE 团队带来盲点,因为许多组件无法被埋点监控。Universal Profiling 在零埋点和低开销下,始终开启,能够通过查看第三方库来定位性能瓶颈,从而加快问题解决,同时还可以帮助组织降低云成本并减少基础设施的碳足迹。Universal Profiling 赋予 SRE 深入了解消耗资源代码的能力,以帮助优化计算周期并快速识别和解决瓶颈。
Elastic 的增强日志分析之旅为 SRE 提供了自动分类日志的能力,通过其独特的日志路由处理器进一步处理和丰富日志数据,并支持 AI 进行日志分析。使用 Elastic 的机器学习算法,SRE 可以自动分析日志峰值、模式检测、异常发现和变化点检测。Elastic Observability 的日志摄取现在支持 OpenTelemetry 的开放摄取和数百个即插即用的集成和自定义格式,所有这些都具有最佳的成本和性能。Elastic 的增强日志之旅结果是降低存储成本、提高运营效率和缩短解决时间。
了解更多关于 日志管理之旅以及 Elastic 如何提供帮助。
Elastic 继续创新并实现其全栈可观测性解决方案,帮助 SRE 团队通过可操作的洞察管理复杂的混合和多云环境。Elastic 在 AI 和机器学习方面的投资,以及统一、开放和灵活的平台,继续满足客户需求,并将帮助变革可观测性的未来。
原创声明:本文系作者授权腾讯云开发者社区发表,未经许可,不得转载。
如有侵权,请联系 cloudcommunity@tencent.com 删除。
原创声明:本文系作者授权腾讯云开发者社区发表,未经许可,不得转载。
如有侵权,请联系 cloudcommunity@tencent.com 删除。