22. 索引库操作

空~2022年11月9日
  • SpringCloud
大约 4 分钟

22. 索引库操作

索引库就类似数据库表,mapping 映射就类似表的结构。

我们要向 es 中存储数据,必须先创建“库”和“表”。

初步检索:

查看索引库全部节点

http://39.108.190.63:9200/_cat/nodes
172.18.0.2 76 96 12 0.45 0.54 0.52 cdfhilmrstw * 179a0f8167f4

查看 es 健康状况

http://39.108.190.63:9200/_cat/health
1669435763 04:09:23 docker-cluster green 1 1 7 7 0 0 0 0 - 100.0%

查看主节点

http://39.108.190.63:9200/_cat/master
M0fX9nn7Q6W4cWdWRtCpog 172.18.0.2 172.18.0.2 179a0f8167f4

查看全部索引, 相当于数据库 show databases

http://39.108.190.63:9200/_cat/indices
green open .kibana_7.12.1_001              BFjrLap2Q2OyZyDKI8cA6Q 1 0 39  56  4.2mb  4.2mb
green open .apm-custom-link                sNIBsElQRR-zQAKrFZPy1g 1 0  0   0   208b   208b
green open .apm-agent-configuration        QNIHj9K6Scet_gDAF-QA1Q 1 0  0   0   208b   208b
green open .kibana_task_manager_7.12.1_001 YpCID05eQti_VFBE78BCrg 1 0  9 743  2.2mb  2.2mb
green open .kibana-event-log-7.12.1-000001 xg-ES9ilS1uXtjDKpvNw0g 1 0  4   0 21.8kb 21.8kb
green open .tasks                          1Fzgw3iCQ-SUq9OkwL0ekw 1 0  6   0 34.8kb 34.8kb

22.1.mapping 映射属性

mapping 是对索引库中文档的约束,常见的 mapping 属性包括:

  • type:字段数据类型,常见的简单类型有:
    • 字符串:text(可分词的文本)、keyword(精确值,例如:品牌、国家、ip 地址)
    • 数值:long、integer、short、byte、double、float、
    • 布尔:boolean
    • 日期:date
    • 对象:object
  • index:是否创建索引,默认为 true
  • analyzer:使用哪种分词器
  • properties:该字段的子字段

例如下面的 json 文档:

{
  "age": 21,
  "weight": 52.1,
  "isMarried": false,
  "info": "黑马程序员Java讲师",
  "email": "zy@itcast.cn",
  "score": [99.1, 99.5, 98.9],
  "name": {
    "firstName": "云",
    "lastName": "赵"
  }
}

对应的每个字段映射(mapping):

  • age:类型为 integer;参与搜索,因此需要 index 为 true;无需分词器
  • weight:类型为 float;参与搜索,因此需要 index 为 true;无需分词器
  • isMarried:类型为 boolean;参与搜索,因此需要 index 为 true;无需分词器
  • info:类型为字符串,需要分词,因此是 text;参与搜索,因此需要 index 为 true;分词器可以用 ik_smart
  • email:类型为字符串,但是不需要分词,因此是 keyword;不参与搜索,因此需要 index 为 false;无需分词器
  • score:虽然是数组,但是我们只看元素的类型,类型为 float;参与搜索,因此需要 index 为 true;无需分词器
  • name:类型为 object,需要定义多个子属性
    • name.firstName;类型为字符串,但是不需要分词,因此是 keyword;参与搜索,因此需要 index 为 true;无需分词器
    • name.lastName;类型为字符串,但是不需要分词,因此是 keyword;参与搜索,因此需要 index 为 true;无需分词器

22.2.索引库的 CRUD

这里我们统一使用 Kibana 编写 DSL 的方式来演示。

22.2.1.创建索引库和映射

基本语法

  • 请求方式:PUT / POST
  • 请求路径:/索引库名,可以自定义
  • 请求参数:mapping 映射

PUT 可以指定新增和修改, PUT 必须指定 id 一般是做修改操作

格式:

POST /索引库名称
{
  "mappings": {
    "properties": {
      "字段名":{
        "type": "text",
        "analyzer": "ik_smart"
      },
      "字段名2":{
        "type": "keyword",
        "index": "false"
      },
      "字段名3":{
        "properties": {
          "子字段": {
            "type": "keyword"
          }
        }
      },
      // ...略
    }
  }
}

示例

POST /heima
{
  "mappings": {
    "properties": {
      "info":{
        "type": "text",
        "analyzer": "ik_smart"
      },
      "email":{
        "type": "keyword",
        "index": "falsae"
      },
      "name":{
        "properties": {
          "firstName": {
            "type": "keyword"
          }
        }
      },
      // ... 略
    }
  }
}

22.2.2.查询索引库

基本语法

  • 请求方式:GET

  • 请求路径:/索引库名

  • 请求参数:无

格式

GET /索引库名

示例

image-20210720211019329

22.2.3.修改索引库

倒排索引结构虽然不复杂,但是一旦数据结构改变(比如改变了分词器),就需要重新创建倒排索引,这简直是灾难。因此索引库一旦创建,无法修改 mapping

虽然无法修改 mapping 中已有的字段,但是却允许添加新的字段到 mapping 中,因为不会对倒排索引产生影响。

语法说明

PUT /索引库名/_mapping
{
  "properties": {
    "新字段名":{
      "type": "integer"
    }
  }
}

示例

image-20210720212357390

22.2.4.删除索引库

语法:

  • 请求方式:DELETE

  • 请求路径:/索引库名

  • 请求参数:无

格式:

DELETE /索引库名

在 kibana 中测试:

image-20210720212123420

22.2.5.总结

索引库操作有哪些?

  • 创建索引库:PUT /索引库名
  • 查询索引库:GET /索引库名
  • 删除索引库:DELETE /索引库名
  • 添加字段:PUT /索引库名/_mapping