22. 索引库操作
2022年11月9日
22. 索引库操作
索引库就类似数据库表,mapping 映射就类似表的结构。
我们要向 es 中存储数据,必须先创建“库”和“表”。
初步检索:
查看索引库全部节点
http://39.108.190.63:9200/_cat/nodes
172.18.0.2 76 96 12 0.45 0.54 0.52 cdfhilmrstw * 179a0f8167f4
查看 es 健康状况
http://39.108.190.63:9200/_cat/health
1669435763 04:09:23 docker-cluster green 1 1 7 7 0 0 0 0 - 100.0%
查看主节点
http://39.108.190.63:9200/_cat/master
M0fX9nn7Q6W4cWdWRtCpog 172.18.0.2 172.18.0.2 179a0f8167f4
查看全部索引, 相当于数据库 show databases
http://39.108.190.63:9200/_cat/indices
green open .kibana_7.12.1_001 BFjrLap2Q2OyZyDKI8cA6Q 1 0 39 56 4.2mb 4.2mb
green open .apm-custom-link sNIBsElQRR-zQAKrFZPy1g 1 0 0 0 208b 208b
green open .apm-agent-configuration QNIHj9K6Scet_gDAF-QA1Q 1 0 0 0 208b 208b
green open .kibana_task_manager_7.12.1_001 YpCID05eQti_VFBE78BCrg 1 0 9 743 2.2mb 2.2mb
green open .kibana-event-log-7.12.1-000001 xg-ES9ilS1uXtjDKpvNw0g 1 0 4 0 21.8kb 21.8kb
green open .tasks 1Fzgw3iCQ-SUq9OkwL0ekw 1 0 6 0 34.8kb 34.8kb
22.1.mapping 映射属性
mapping 是对索引库中文档的约束,常见的 mapping 属性包括:
- type:字段数据类型,常见的简单类型有:
- 字符串:text(可分词的文本)、keyword(精确值,例如:品牌、国家、ip 地址)
- 数值:long、integer、short、byte、double、float、
- 布尔:boolean
- 日期:date
- 对象:object
- index:是否创建索引,默认为 true
- analyzer:使用哪种分词器
- properties:该字段的子字段
例如下面的 json 文档:
{
"age": 21,
"weight": 52.1,
"isMarried": false,
"info": "黑马程序员Java讲师",
"email": "zy@itcast.cn",
"score": [99.1, 99.5, 98.9],
"name": {
"firstName": "云",
"lastName": "赵"
}
}
对应的每个字段映射(mapping):
- age:类型为 integer;参与搜索,因此需要 index 为 true;无需分词器
- weight:类型为 float;参与搜索,因此需要 index 为 true;无需分词器
- isMarried:类型为 boolean;参与搜索,因此需要 index 为 true;无需分词器
- info:类型为字符串,需要分词,因此是 text;参与搜索,因此需要 index 为 true;分词器可以用 ik_smart
- email:类型为字符串,但是不需要分词,因此是 keyword;不参与搜索,因此需要 index 为 false;无需分词器
- score:虽然是数组,但是我们只看元素的类型,类型为 float;参与搜索,因此需要 index 为 true;无需分词器
- name:类型为 object,需要定义多个子属性
- name.firstName;类型为字符串,但是不需要分词,因此是 keyword;参与搜索,因此需要 index 为 true;无需分词器
- name.lastName;类型为字符串,但是不需要分词,因此是 keyword;参与搜索,因此需要 index 为 true;无需分词器
22.2.索引库的 CRUD
这里我们统一使用 Kibana 编写 DSL 的方式来演示。
22.2.1.创建索引库和映射
基本语法
- 请求方式:PUT / POST
- 请求路径:/索引库名,可以自定义
- 请求参数:mapping 映射
PUT 可以指定新增和修改, PUT 必须指定 id 一般是做修改操作
格式:
POST /索引库名称
{
"mappings": {
"properties": {
"字段名":{
"type": "text",
"analyzer": "ik_smart"
},
"字段名2":{
"type": "keyword",
"index": "false"
},
"字段名3":{
"properties": {
"子字段": {
"type": "keyword"
}
}
},
// ...略
}
}
}
示例
POST /heima
{
"mappings": {
"properties": {
"info":{
"type": "text",
"analyzer": "ik_smart"
},
"email":{
"type": "keyword",
"index": "falsae"
},
"name":{
"properties": {
"firstName": {
"type": "keyword"
}
}
},
// ... 略
}
}
}
22.2.2.查询索引库
基本语法:
请求方式:GET
请求路径:/索引库名
请求参数:无
格式:
GET /索引库名
示例:
22.2.3.修改索引库
倒排索引结构虽然不复杂,但是一旦数据结构改变(比如改变了分词器),就需要重新创建倒排索引,这简直是灾难。因此索引库一旦创建,无法修改 mapping。
虽然无法修改 mapping 中已有的字段,但是却允许添加新的字段到 mapping 中,因为不会对倒排索引产生影响。
语法说明:
PUT /索引库名/_mapping
{
"properties": {
"新字段名":{
"type": "integer"
}
}
}
示例:
22.2.4.删除索引库
语法:
请求方式:DELETE
请求路径:/索引库名
请求参数:无
格式:
DELETE /索引库名
在 kibana 中测试:
22.2.5.总结
索引库操作有哪些?
- 创建索引库:PUT /索引库名
- 查询索引库:GET /索引库名
- 删除索引库:DELETE /索引库名
- 添加字段:PUT /索引库名/_mapping