首页
学习
活动
专区
圈层
工具
发布
社区首页 >专栏 >Elasticsearch实战教程: 如何在海量级数据中进行快速搜索

Elasticsearch实战教程: 如何在海量级数据中进行快速搜索

作者头像
鸽芷咕
发布2025-05-20 15:41:49
发布2025-05-20 15:41:49
2820
举报
文章被收录于专栏:C++干货基地C++干货基地

一、环境搭建

首先,在使用 Elasticsearch 之前,我们需要先安装好服务,操作也很简单。

本次我们选择我们采用CentOS7来部署 ElasticSearch 服务。

登录https://www.elastic.co/cn/downloads/elasticsearch,选择相应的系统环境下载软件包,这里我用的操作系统是CentOS,所以选择Linux环境。

在这里插入图片描述
在这里插入图片描述

1.1、安装JDK

Elasticsearch 是用 Java 语言开发的,所以在安装之前,需要先安装一下JDK

代码语言:javascript
复制
yum -y install java-1.8.0-openjdk

查看java安装情况

代码语言:javascript
复制
java -version

1.2、安装ElasticSearch

进入到对应上传的文件夹,安装ElasticSearch

代码语言:javascript
复制
rpm -ivh elasticsearch-6.1.0.rpm

查找安装路径

代码语言:javascript
复制
rpm -ql elasticsearch

一般是装在/usr/share/elasticsearch/下。

1.3、设置data的目录

创建/data/es-data目录,用于elasticsearch数据的存放

代码语言:javascript
复制
mkdir -p /data/es-data

修改该目录的拥有者为elasticsearch

代码语言:javascript
复制
chown -R elasticsearch:elasticsearch /data/es-data

1.4、设置log的目录

代码语言:javascript
复制
mkdir -p /log/es-log

修改该目录的拥有者为elasticsearch

代码语言:javascript
复制
chown -R elasticsearch:elasticsearch /log/es-log

1.5、修改配置文件elasticsearch.yml

代码语言:javascript
复制
vim /etc/elasticsearch/elasticsearch.yml

修改如下内容:

代码语言:javascript
复制
#设置节点名称
cluster.name: my-es

#设置data存放的路径为/data/es-data
path.data: /data/es-data

#设置logs日志的路径为/log/es-log
path.logs: /log/es-log

#设置内存不使用交换分区,配置了bootstrap.memory_lock为true时反而会引发9200不会被监听,原因不明
bootstrap.memory_lock: false

#设置允许所有ip可以连接该elasticsearch
network.host: 0.0.0.0

#开启监听的端口为9200
http.port: 9200

#增加新的参数,为了让elasticsearch-head插件可以访问es (5.x版本,如果没有可以自己手动加)
http.cors.enabled: true
http.cors.allow-origin: "*"

1.6、启动elasticsearch

启动

代码语言:javascript
复制
systemctl start elasticsearch

查看状态

代码语言:javascript
复制
systemctl status elasticsearch

设置开机启动

代码语言:javascript
复制
systemctl enable elasticsearch

启动成功之后,测试服务是否开启

代码语言:javascript
复制
curl -X GET http://localhost:9200

同时也可以远程测试一下,如果网络被拒绝,检查防火墙是否开启

代码语言:javascript
复制
#查询防火墙状态
firewall-cmd --state

如果状态是active表示已经开启,可以将其关闭

代码语言:javascript
复制
#关闭防火墙
systemctl stop firewalld.service

如果不想开机启动,可以输入如下命令

代码语言:javascript
复制
#禁止firewall开机启动
systemctl disable firewalld.service

二、创建数据索引

在Elasticsearch中,数据是以JSON格式存储的。首先,我们需要创建一个索引,索引相当于一个数据集合,它可以包含一个或多个类型(type)。

2.1创建 my_index的索引

代码语言:javascript
复制
PUT /my_index
{
  "settings": {
    "number_of_shards": 1,
    "number_of_replicas": 0
  },
  "mappings": {
    "properties": {
      "title": { "type": "text" },
      "content": { "type": "text" }
    }
  }
}

在上面的例子中,我们创建了一个名为my_index的索引,并设置了分片数为1,副本数为0。同时,我们定义了两个字段titlecontent,它们的类型都是文本。

三. 进行数据导入

接下来,我们需要将数据导入到Elasticsearch中。可以使用POST请求和bulk API来实现。

代码语言:javascript
复制
POST /my_index/_bulk
{ "index": { "_id": 1 } }
{ "title": "Elasticsearch教程", "content": "这是一篇关于Elasticsearch的教程。" }
{ "index": { "_id": 2 } }
{ "title": "Elasticsearch实战", "content": "这是一篇关于Elasticsearch实战的教程。" }

四、 进行数据搜索

现在,我们的数据已经导入到Elasticsearch中,可以使用GET请求来搜索数据。

代码语言:javascript
复制
GET /my_index/_search
{
  "query": {
    "match": {
      "title": "Elasticsearch"
    }
  }
}

上面的例子中,我们使用了一个简单的匹配查询来搜索标题中包含"Elasticsearch"的文档。

总结

在本教程中,我们学习了如何在Elasticsearch中创建索引、导入数据、进行数据搜索以及一些性能优化建议。希望这些内容能够帮助您在海量级数据中实现快速搜索。

本文参与 腾讯云自媒体同步曝光计划,分享自作者个人站点/博客。
原始发表:2024-07-03,如有侵权请联系 cloudcommunity@tencent.com 删除

本文分享自 作者个人站点/博客 前往查看

如有侵权,请联系 cloudcommunity@tencent.com 删除。

本文参与 腾讯云自媒体同步曝光计划  ,欢迎热爱写作的你一起参与!

评论
登录后参与评论
0 条评论
热度
最新
推荐阅读
目录
  • 一、环境搭建
    • 1.1、安装JDK
    • 1.2、安装ElasticSearch
    • 1.3、设置data的目录
    • 1.4、设置log的目录
    • 1.5、修改配置文件elasticsearch.yml
    • 1.6、启动elasticsearch
  • 二、创建数据索引
    • 2.1创建 my_index的索引
  • 三. 进行数据导入
  • 四、 进行数据搜索
  • 总结
领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档