首页
学习
活动
专区
圈层
工具
发布
首页
学习
活动
专区
圈层
工具
MCP广场
社区首页 >专栏 >Elasticsearch堆外溢出导致频繁OOM怎么办?

Elasticsearch堆外溢出导致频繁OOM怎么办?

原创
作者头像
岳涛
修改于 2022-04-26 08:24:26
修改于 2022-04-26 08:24:26
3.7K3
举报
文章被收录于专栏:大数据生态大数据生态

说明

本文描述问题及解决方法同样适用于 腾讯云 Elasticsearch Service(ES)

  • 系统环境说明

Linux环境:CentOS Linux release 7.2 (Final)

Elasticsearch: 7.10.1

Java:1.8.0_181

  • 机器配置

机器数量:5

内存:8G

硬盘:200G

CPU核心数:2

背景

节点反复下线

当业务不是特别重要的时候,往往升级配置的需求不是很强烈。但是低配机器通常伴随集群不稳定等问题,严重的情况还会直接导致集群无法使用。

问题

节点轮番下线,2分钟下线一个节点,集群无法使用,状态一直RED。即便有副本也无济于事,主分片下线,副本分片被紧急提升为主分片,然而副本分片还没来及恢复,主分片所在的节点又下线了,此时高可用失去意义。

图中可以明显看出节点离线十分频繁。

问题原因

机器配置过低

进一步分析,发现节点下线是因为反复发生OOM。机器配置确实很低,但由于业务场景的原因,这个集群只要保障可用即可,对性能没有要求。基于这些现状,我决定曲线救国。

图中可以看出发生了OOM。

解决方案

方案一:解决堆外使用率过高的问题(可以轻微缓解)

问题的根因是因为内存不足,经过分析,发现是堆外内存使用比较严重,一直在疯涨,达到100%发生OOM。

禁止堆外:

代码语言:json
AI代码解释
复制
curl -H "Content-Type:application/json" -XPUT http://localhost:9200/_cluster/settings -d '{
  "persistent" : {
    "indices.segment_memory.off_heap.enable" : false
   }
}'

禁止堆外之后,明显发现离线频率降低了,但是偶尔还是容易发生两个节点同时离线,导致集群变红。

方案二:解决内存不足的问题(可以有效缓解)

由于业务场景的缘故,对集群性能要求不高,但求集群能够使用即可,这里我想到了增加交换内存

代码语言:shell
AI代码解释
复制
dd if=/dev/zero of=/opt/swap bs=8192 count=1024000
chmod 600 /opt/swap
mkswap /opt/swap
swapon /opt/swap

在增加了交换内存之后,离线的频率明显降低,由之前的分钟级变为了小时级,完全可以满足业务需求。

图中可以看出uptime最近一次重启是21分钟前,最久一次的重启是5小时前。

申明

Elasticsearch官方强烈要求关闭交换内存,目的是为了减少请求延迟。这里是由于业务场景的特殊性,对性能没有要求,所以可以接受请求延迟。

截图来自 —— swapping 是性能的坟墓

方案三:解决异常插件问题(水落石出,彻底根治)

通过一系列的分析,目前看函数调用链,偏向于是QQ分词器的问题。

确认这些函数是QQ分词器里面的。卸载QQ分词器之后,问题解决。

注意:

如果业务需要使用QQ分词器,无法卸载该插件,则可以临时采用方案二,QQ分词器BUG的修复,正在紧张进行中,届时发布后更新此插件即可彻底修复。

原创声明:本文系作者授权腾讯云开发者社区发表,未经许可,不得转载。

如有侵权,请联系 cloudcommunity@tencent.com 删除。

原创声明:本文系作者授权腾讯云开发者社区发表,未经许可,不得转载。

如有侵权,请联系 cloudcommunity@tencent.com 删除。

评论
登录后参与评论
3 条评论
热度
最新
不错哦
不错哦
回复回复点赞举报
66666666666
66666666666
11点赞举报
🤝
🤝
回复回复点赞举报
推荐阅读
编辑精选文章
换一批
Elasticsearch堆外溢出导致频繁OOM怎么办
当业务不是特别重要的时候,往往升级配置的需求不是很强烈。但是低配机器通常伴随集群不稳定等问题,严重的情况还会直接导致集群无法使用。
周银辉
2024/08/27
3370
关于ElasticSearch性能调优几件必须知道的事
ElasticSearch是现在技术前沿的大数据引擎,常见的组合有ES+Logstash+Kibana作为一套成熟的日志系统,其中Logstash是ETL工具,Kibana是数据分析展示平台。ES让人惊艳的是他强大的搜索相关能力和灾备策略,ES开放了一些接口供开发者研发自己的插件,ES结合中文分词的插件会给ES的搜索和分析起到很大的推动作用。ElasticSearch是使用开源全文检索库ApacheLucene进行索引和搜索的,说架构必须和Lucene的一些东西打交道。
大数据技术架构
2020/07/07
1.1K0
【ES三周年】吊打ElasticSearch(入门保姆级教程-1)
文章将介绍:ElasticSearch的作用,搭建elasticsearch的环境(Windows/Linux),ElasticSearch集群的搭建,可视化客户端插件elasticsearch-head的安装及使用,对IK分词器的安装及使用;本章介绍的ElasticSearch操作基于Restful形式(使用http请求的形式)。
北京-宏哥
2023/03/29
23.3K0
【ES三周年】吊打ElasticSearch(入门保姆级教程-1)
【ElasticSearch面试】10道不得不会的ElasticSearch面试题
以下是 ElasticSearch 面试题,相信大家都会有种及眼熟又陌生的感觉、看过可能在短暂的面试后又马上忘记了。**JavaPub**在这里整理这些容易忘记的重点知识及**解答**,建议收藏,经常温习查阅。
JavaPub
2022/03/26
1.3K0
【ElasticSearch面试】10道不得不会的ElasticSearch面试题
Elasticsearch 集群状态变成黄色或者红色,怎么办?
这是系列文章的第六篇,主要探讨:Elasticsearch 集群状态变成黄色或者红色,怎么办?
铭毅天下
2022/04/06
2K0
Elasticsearch 集群状态变成黄色或者红色,怎么办?
内存吞金兽(Elasticsearch)的那些事儿 -- 架构&三高保证
在Gateway中,ElasticSearch默认先把索引存储在内存中,然后当内存满的时候,再持久化到Gateway里。当ES集群关闭或重启的时候,它就会从Gateway里去读取索引数据。比如LocalFileSystem和HDFS、AS3等。
房上的猫
2021/08/31
6410
内存吞金兽(Elasticsearch)的那些事儿 -- 架构&三高保证
一文帮你彻底搞明白ElasticSearch
如:当系统数据量上了10亿、100亿条的时候,我们在做系统架构的时候通常会从以下角度去考虑问题:
lyb-geek
2019/10/10
1.3K0
一文帮你彻底搞明白ElasticSearch
Elasticsearch简介及安装
Elaticsearch,简称为es, es是一个开源的==高扩展的分布式全文检索引擎==,它可以近乎实时的检索数据;本身扩展性很好,可以扩展到上百台服务器,处理PB级别的数据。ES使用Java开发。Lucene作为其核心来实现所有索引和搜索的功能,但是它的目的是通过简单的RESTful API来隐藏Lucene的复杂性,从而让全文搜索变得简单。
ha_lydms
2023/08/10
3780
Elasticsearch简介及安装
Elasticsearch学习,请先看这一篇!
题记 Elasticsearch研究有一段时间了,现特将Elasticsearch相关核心知识、原理从初学者认知、学习的角度,从以下9个方面进行详细梳理。欢迎讨论…… 0. 带着问题上路—ES是如何产生的? ---- (1)思考:大规模数据如何检索? 如:当系统数据量上了10亿、100亿条的时候,我们在做系统架构的时候通常会从以下角度去考虑问题: 1)用什么数据库好?(MySQL、sybase、Oracle、达梦、神通、MongoDB、Hbase…) 2)如何解决单点故障;(lvs、F5、A10、Zoo
铭毅天下
2018/03/20
5.2K0
Elasticsearch学习,请先看这一篇!
让Elasticsearch飞起来!——性能优化实践干货
Elasticsearch性能优化的最终目的:用户体验爽。 关于爽的定义——著名产品人梁宁曾经说过“人在满足时候的状态叫做愉悦,人不被满足就会难受,就会开始寻求。如果这个人在寻求中,能立刻得到即时满足,这种感觉就是爽!”。
铭毅天下
2018/12/28
2.7K0
让Elasticsearch飞起来!——性能优化实践干货
Elasticsearch 线上实战问题及解决方案探讨
我有 1tb 的一个大索引若干,要迁移到另外一个新集群去,有没有好办法?reindex好像会中断......
铭毅天下
2023/11/27
4520
Elasticsearch 线上实战问题及解决方案探讨
Elasticsearch集群监控指标
“本片主要通过两个API讲解Elasticsearch集群监控的指标说明”
create17
2019/01/20
2K0
Elasticsearch集群监控指标
ElasticSearch使用优化之拙见
个人博客纯净版:https://www.fangzhipeng.com/db/2019/09/03/es-optimized.html
方志朋
2022/01/06
4240
ElasticSearch使用优化之拙见
Elasticsearch详解
搜索引擎是对数据的检索,所以我们先从生活中的数据说起。我们生活中的数据总体分为两种:
用户4283147
2022/10/27
4330
Elasticsearch详解
Elasticsearch分片均衡的情况下,还会出现热写造成的bulk reject?
本文描述问题及解决方法同样适用于 腾讯云 Elasticsearch Service(ES)。
岳涛
2021/09/26
1.5K4
Elasticsearch分片均衡的情况下,还会出现热写造成的bulk reject?
Elasticsearch入门与实战
在电商等常见的搜索业务场景中,Elasticsearch扮演着举足轻重的作用。它对于数据的准实时搜索可以达到很高的查询效率,并且天生自带的分布式、高可用、易扩展的能力,也使其具有了十足的魅力。那么,下面就是本篇文章的大纲结构
爪哇缪斯
2023/05/10
1.4K0
Elasticsearch入门与实战
Elasticsearch 21道面试题
img客户端向 Node 1 发送新建、索引或者删除请求。 节点使用文档的 _id 确定文档属于分片 0 。请求会被转发到 Node 3,因为分片 0 的主分片目前被分配在 Node 3 上。 Node 3 在主分片上面执行请求。如果成功了,它将请求并行转发到 Node 1 和 Node 2 的副本分片上。一旦所有的副本分片都报告成功, Node 3 将向协调节点报告成功,协调节点向客户端报告成功。
小熊学Java
2023/07/16
1.4K0
Elasticsearch 21道面试题
深入搜索引擎之 Elasticsearch 必知必会(一):开发视角
两句话了解它是什么 1. 搜索引擎。提供了数据存储、数据处理、数据查询、聚合统计的能力。 2. 创始人说:“不要求你必须是一个数据科学家才能把它用好” 前言 Elasticsearch 是一个很有意思的产品,不同岗位的人,对它的关注维度区别比较大 主要可以分三个层面 开发 基本功能 底层工作原理 数据建模最佳实践 运维 容量规划 性能优化 问题诊断 滚动升级 搜索结果优化 查全率、查准率等指标 搜索与如何解决搜索的相似性问题 具体场景下的调优 对比传统数据库的区别主要在于 传统关系型数据库 事务性 Joi
QQ音乐技术团队
2022/01/06
1.4K0
初识 Elasticsearch7.x(一)
Elasticsearch是一个基于Apache Lucene(TM)的开源搜索引擎。无论在开源还是专有领域,Lucene可以被认为是迄今为止最先进、性能最好的、功能最全的搜索引擎库。
Remember_Ray
2021/12/25
5710
初识 Elasticsearch7.x(一)
ElasticSearch-高级特性
**聚合(aggregations)**可以让我们极其方便的实现对数据的统计、分析、运算。例如:
yuanshuai
2023/11/17
2490
ElasticSearch-高级特性
推荐阅读
相关推荐
Elasticsearch堆外溢出导致频繁OOM怎么办
更多 >
交个朋友
加入腾讯云官网粉丝站
蹲全网底价单品 享第一手活动信息
领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档