一、简单了解ElasticSearch
创始人
2025-05-31 19:48:49
0

目录

  • 一、ElasticSearch简介
    • 1.ES与关系型数据库对比
    • 2.什么是全文检索
    • 3.分词原理(基于倒排索引)
  • 二、核心概念
    • 1.索引index
    • 2.映射mapping
    • 3.字段filed
    • 4.字段类型type
    • 5.文档document
    • 6.集群cluster
    • 7.节点node
    • 8.分片
    • 9.副本
  • 三、搭建es单机版、集群版
    • 1.搭建es
    • 2.集成kibana,安装ik分词器

一、ElasticSearch简介

1.ES与关系型数据库对比

关系型database(数据库)table(表)row(行)column(列)
ESindex(索引库)type(类型)document(文档)field(字段)

2.什么是全文检索

全文检索:
通过一个程序扫描文本中的每一个单词,针对单词建立索引,并保存该单词在文本中的位置、以及出现的次数。
当用户查询时,通过之前建立好的索引来查询,将索引中单词对应的文本位置、出现的次数返回给用户,因为有了具体文本的位置,所以就可以将具体内容读取出来了。

3.分词原理(基于倒排索引)

上来就懵逼了,何为倒排索引呢?还有正排索引

先跟着我的步骤先来了解一下数据是怎么存到ES中的

主要分为三个步骤
①分词
②去重
③排序
我们把如下数据存到ES中(以英文内容为例)
在这里插入图片描述

首先第一步:①分词
在这里插入图片描述
第二步:②去重
在这里插入图片描述
第三步:③排序
在这里插入图片描述
带着上边的疑问继续看。
我们要搜索一个内容如下

hello july what

搜索的内容背会拆开
分hello、july、what
根据这三个词去索引库搜索
在这里插入图片描述
通过单词查找index的方式就称为倒排索引,那正排索引原理正好和它相反即通过index找word
完整流程如下
在这里插入图片描述

二、核心概念

1.索引index

一个索引就是一个拥有几份相似特征文档的集合。好比如上分讲解的倒排索引的例子(hello july,hello world)。
一个索引由一个名字来标识(必须全部是小写字母),并且对这个索引中文档进行索引、搜索、更新、删除的时候,都要使用到。简单理解为mysql的表名。

2.映射mapping

处理数据的方式和规则方面做一些限制,例如某个字段的数据类型、默认值、分词器、是否被索引等,都是映射里可以设置的。简单理解为mysql的表结构。

3.字段filed

相当于mysql表中的列

4.字段类型type

每一个字段都应该有一个对应的类型,在es中例如:text 、keyword、byte等

5.文档document

一个文档一个可以被索引的基础信息单元,类似mysql中的一条记录。文档以json格式来表示。

6.集群cluster

一个集群就是一个或者多个节点组在一起,它们共同持有整个的数据,并一起提供索引和搜索功能。

7.节点node

一个节点是集群中的一个服务器,作为集群的一部分,它存储数据,参与集群的索引和搜索功能。
一个节点可以通过配置集群名称的方式来加入一个值得的集群。默认情况下,每个节点都会被安排加入到一个叫"elasticsearch"的集群中。在一个集群里,可以拥有任意多个节点。并且,如果当前网络中没有运行任何es节点,这是启动一个节点,会默认创建并加入到"elasticsearch"集群。

8.分片

问题1:一个索引可以存储超出单个结点硬件限制的大量数据(这里理解为一台服务为一个节点,这台服务器硬盘空间最大1TB,意思就是说我有一个索引库里边存的数据占用空间比1TB还多,那么单个结点是无法全部存储下来。)。
问题2:再或者单个结点处理搜索请求,响应比较慢。

Elasticsearch解决这两个问题的方式就是分片,把一个索引划分成多份(假如把一个索引设置分片数量为10,那就是划分10份,每份加在一起是索引的全部内容)。

①当创建索引时,你可以指定分片数量,在es7.x版本默认分片和副本数量都是1。
②每个分片本身也是一个功能完善并且独立的"索引",这个"索引"可以被放置到集群中的任何节点上。
③分片的重要性:
允许水平分割/扩展你的内容容量
允许在分片之上进行分布式,并行的操作,从而提高性能,吞吐量。
④分片如何分布,怎么从这么多分片聚合回搜索的请求,都是由elasticsearch管理的。
(如果想要深入了解还是建议去逛逛官网这里不详细展开说明)

9.副本

一些中间件高可用的策略,思路基本上大同小异(比如kafka)。在一个网络或者云服务环境中,可能因为各种各样的情况导致出现一些异常和报错甚至宕机,使得某个分片/节点处于离线状态,或者直接消失。这种情况下,有一个故障转移机制是非常有用的。而因为这样情况的存在,Elasticsearch允许创建分片的一份或者多份拷贝,这些拷贝叫做分片副本,或者称副本。


三、搭建es单机版、集群版

1.搭建es

搭建教程

2.集成kibana,安装ik分词器

教程

相关内容

热门资讯

王凤英入职小鹏3年终获股权,此... 5月7日消息,小鹏汽车披露的监管及年报信息显示,公司总裁王凤英已正式进入股东名册,入职小鹏3年后股权...
五块钱红酒卖断货,便宜红酒为何... 最近一段时间,中国的酒类消费市场可以说是显得格外奇怪,一方面,各种高端酒特别是白酒的消费量出现了明显...
财联社C50风向指数调查:4月... 财联社5月8日讯(记者 夏淑媛)新一期财联社“C50风向指数”结果显示,市场机构对4月新增人民币贷款...
央视硬刚国际足联拒掏20亿,背... 作者| 史大郎&猫哥 来源| 是史大郎&大猫财经Pro 央视这次太刚了,离世界杯开幕还有1个月,死活...
新CEO上任直接放大招!Air... 快科技5月8日消息,苹果即将上任的CEO John Ternus对未来一系列新产品充满信心,称这些设...
“特朗普拟邀英伟达、波音等CE... 据路透社当地时间5月7日报道,特朗普政府正邀请英伟达、苹果、埃克森美孚、波音等大公司首席执行官,于下...
世界杯,还能看到直播吗? 2026年美加墨世界杯距离开幕,仅剩一个多月时间。多方信息显示,中央广播电视总台(以下简称“央视”)...
机构警告AI芯片热潮风险,超威... 5月7日,据央视财经,隔夜超威半导体公司(AMD)股价飙升近19%,带动AI芯片热潮持续升温。AMD...
银行员工转走储户1800万最新... 银行员工转走储户1800万最新进展:2名储户已收到银行全部款项
原创 中... 1994年,安徽省的经济格局曾发生过一次戏剧性的转折。在那一年,一座名为安庆的城市,其国内生产总值(...
昆都仑区:政策“蓄力”消费焕新 “一台5000多元的空调,叠加‘国补’和商场的以旧换新活动,能优惠1000元左右,旧机还能免费上门拆...
乐悦置业竞得佛山顺德乐从镇一商... 观点网讯:5月6日,佛山市顺德区乐从镇一商业地块成功出让,由广东省乐悦置业有限公司竞得,乐从南区·邻...
原创 亦... 《爱情没有神话》这部剧,一开始的命运颇为多舛,经历了几次撤档的波折后,终于在观众面前亮相,但其首播的...
美联储34年最大分歧叠加油价飙... 美联储按预期维持利率不变,但内部出现34年来最严重分歧,叠加布油创2022年6月以来新高,美债遭抛售...
支付宝消费券回收后,资金是否支... 摘要: 支付宝消费券回收变现后,资金能否直接转入信用卡?本文解答到账方式的相关规则,帮助用户了解资金...
中医介绍5个化痰穴位!收藏这篇... 很多人忽略了“痰”的危害,觉得咳几下就没事,殊不知,肺里的痰长期堆积,只会一步步加重身体负担。 中医...
黄金平台“杰我睿”涉嫌经济犯罪... 红星资本局5月7日消息,深圳水贝知名金店“杰我睿”兑付困难事件有了新进展。日前,深圳市公安局罗湖分局...
多地出台购房新政促楼市升温 记... 今年的“五一”假期,伴随着多个城市楼市新政密集落地,在叠加市场信心持续修复的作用下,房地产市场热度持...
谁是五一“吸金王”?这5座城市... 来源:市场资讯 (来源:21城市观) 哪座城市成为“五一”假期的大赢家? 图源:摄图网 作者|赵晓...
“低招低裁”格局稳固劳动力市场... 智通财经APP获悉,美国上周初请失业金人数在经历前一周回落至近几十年来最低水平后出现小幅反弹,表明尽...