前往小程序,Get更优阅读体验!
立即前往
首页
学习
活动
专区
工具
TVP
发布
社区首页 >专栏 >Elastic Searchable snapshot功能初探 二 (hot phase)

Elastic Searchable snapshot功能初探 二 (hot phase)

原创
作者头像
点火三周
修改2021-03-02 14:24:52
6.3K0
修改2021-03-02 14:24:52
举报
文章被收录于专栏:Elastic Stack专栏

在上一篇文章中(Elastic Searchable snapshot功能初探),我们已经做了可搜索快照的简单演示。在总结中,我们提到:

通过以上演示,我们发现,通过配合新的node_roles,我们可以快速将节点标记为冷层(cold tier),在ILM中,这个新的冷层,会自动成为cold phase搬移数据的目的节点。而通过ILM,我们可以快速的通过策略指定索引该什么时候打开可搜索快照功能,并自动帮我们完成对接快照,配置别名的动作。而可搜索快照可以在hot phase就打开,在整个数据生命周期中为我们节省成本。

即可搜索快照功能,在我们的热节点上就可以直接打开。

在本篇博客中,我们将进一步演示该功能。所有的基本配置不变,要准备一套环境可以参考上一篇文章

hot phase Searchable snapshot 演示

创建索引生命周期管理策略

仍然,我们先通过ILM工具来创建一个Hot phase的策略,如下图:

在这里插入图片描述
在这里插入图片描述

这里,我们将rollover的条件改为当索引超过3MB的时候,执行滚动切分。

对应的,为了将注意力放在hot phase,我们不enable另外的warm phase和cold phase

在这里插入图片描述
在这里插入图片描述

创建索引模板和索引别名

因为我们使用的是rollover功能,因此,必须使用data stream或者index alias。在下面的配置中,我们将指定匹配索引的lifecycle.namelifecycle.rollover_alias:

代码语言:txt
复制
PUT _template/searchable_snapshot_hot_demo
{
  "index_patterns": ["data-*"],
  "settings": {
    "index.lifecycle.name": "searchable_snapshot_demo",
    "index.lifecycle.rollover_alias": "data_alias"
  }
}

可以参考rollover的官方文档,我们需要指定一个alias,并且背后的写索引,其索引名需要匹配特定的索引名pattern: ^.*-\d+$。这里的%3Cdata-%7Bnow%2Fd%7D-0001%3E<data-{now-1d}-0001>的URI编码

代码语言:txt
复制
PUT %3Cdata-%7Bnow%2Fd%7D-0001%3E
{
  "aliases": {
    "data_alias": {
      "is_write_index": true
    }
  }
}

写入数据

我们仍然是使用样本数据来做这次演示。通过将kibana_sample_data_logs索引reindex到data_alias,我们将触发之前的索引生命周期管理规则

代码语言:txt
复制
POST _reindex
{
  "source": {
    "index": "kibana_sample_data_logs"
  },
  "dest": {
    "index": "data_alias"
  }
}

当data_alias中的索引大小超过3MB的时候,将自动rollover出新的索引

触发生命周期管理的action

先看样本数据集的情况,一主一副本,14074个文档,占用20mb的存储空间:

在这里插入图片描述
在这里插入图片描述

如果没有启动searchable snapshot,我们看到的是,经过reindex,写入到data-*索引的数据被拆分成3个集群,每个索引都是一主一副本,总体大小在22MB左右

在这里插入图片描述
在这里插入图片描述

而如果打开searchable snapshot功能,可以看到,在hot phase就已经将冗余副本搬移到对象存储中,这时只剩下一个主分片,并且索引名被改为restored-*

在这里插入图片描述
在这里插入图片描述
在这里插入图片描述
在这里插入图片描述

总结

通过以上演示,我们看到,并非需要等到cold phase我们才可使用searchable snapshot,我们可以在索引数据的任意生命周期都可享受到可搜索快照带来的成本降低的优势,唯一需要考虑的是,我们如果平衡搜索性能、故障恢复时间以及存储成本之间的关系。可以预见的是,在一些低并发,对查询延时不是特别敏感的场景,比如运维日志,我们可以完全借助可搜索快照的功能来降低存储成本。

原创声明:本文系作者授权腾讯云开发者社区发表,未经许可,不得转载。

如有侵权,请联系 cloudcommunity@tencent.com 删除。

原创声明:本文系作者授权腾讯云开发者社区发表,未经许可,不得转载。

如有侵权,请联系 cloudcommunity@tencent.com 删除。

评论
登录后参与评论
0 条评论
热度
最新
推荐阅读
目录
  • hot phase Searchable snapshot 演示
    • 创建索引生命周期管理策略
      • 创建索引模板和索引别名
        • 写入数据
          • 触发生命周期管理的action
          • 总结
          相关产品与服务
          对象存储
          对象存储(Cloud Object Storage,COS)是由腾讯云推出的无目录层次结构、无数据格式限制,可容纳海量数据且支持 HTTP/HTTPS 协议访问的分布式存储服务。腾讯云 COS 的存储桶空间无容量上限,无需分区管理,适用于 CDN 数据分发、数据万象处理或大数据计算与分析的数据湖等多种场景。
          领券
          问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档