ElasticSearch系列文章:核心概念介绍

curl扩展  时间:2021-04-11  阅读:()
在《ElasticSearch系列文章:基本介绍》中主要介绍了ElasticSearch一些使用场景,本文将对Elasticsearch的核心概念进行介绍,这对后期使用ElasticSearch有着重要的影响.
1、NearRealtime(NRT):准实时Elasticsearch是一个准实时的搜索平台,这意味着当你索引一个文档(document)时,在细微的延迟(通常1s)之后,该文件才能被搜索到.
2、Cluster:集群一个集群是一个或多个nodes(servers)的集合,一起保存整个数据,并且提供从所有nodes上进行联合索引(federatedindexing)和搜索功能.
节点(node)是一个运行着的Elasticsearch实例.
集群(cluster)是一组具有相同cluster.
name的节点集合,他们协同工作,共享数据并提供故障转移和扩展功能,当然一个节点也可以组成一个集群.
你最好找一个合适的名字来替代cluster.
name(config/elasticsearch.
yml)的默认值,比如你自己的名字,这样可以防止一个新启动的节点加入到相同网络中的另一个同名的集群中.
比如你可以使用logging-dev,logging-stage和logging-prod来表示development,staging和production的集群环境.
3、Node:节点一个Node是Elasticsearch集群的一个服务器,用来存储数据并且参与到集群的索引和搜索功能中.
和集群的名称一样,一个Node也需要定义一个名字node.
name(config/elasticsearch.
yml),如果你不想使用默认,可以手工修改.
一个Node通过配置可以根据集群的名称cluster.
name加入一个指定的Elasticsearch集群.
4、Index:索引index是具有相似特征的文档(document)集合.
例如,你可以有顾客数据的index、商品种类的index和订单数据的index.
每个index都有唯一的名称(必须小写),当执行索引、搜索、更新和删除操作时都需要根据该名称找到对应的index.
一个cluster可以包含任意数量的index.
5、Type:类型在一个index中,可以定义一个或多个type.
type是index的逻辑分类.
通常,type拥有一组通用field的文档集合.
举例,你运行一个博客平台,把全部数据存储在一个index中.
在这个index中,你可以为用户数据定义一个type,为博客数据定义一个type,为评论数据定义一个type.
6、Document:文档document是索引的基本单元信息.
举例,你有一个客户的document、一个商品的documen1/3t和一个订单的document.
该document用JSON表示.
一个index/type中,可以包含任意多的document.
注意,虽然document物理上存在index中,document实际上必须被分配到index中的type上.
7、Shards和Replicas:分片和副本一个index可以存储数量超出硬件限制的数据.
举例,一个index包含10亿文档,占据1TB硬盘空间,就会导致无法放在单个节点硬盘上或者响应request太慢.
为了解决这个问题,Elasticsearch提供了将索引分片的技术,称为shard.
当创建一个index,可以指定shard的数量.
每个shard内部都是全功能而且相互独立的"index",可以放在cluster上的任意node上.
Sharding重要的两个主要原因:(1)允许横向扩展容量(2)分布式并行操作shard(可能在多个node上),因而提高性能分片是如何分布、文档是如何聚合回搜索结果的机制完全由Elasticsearch管理,对用户透明.
在网络/云环境中,故障是很常见的,比如一个shard/node宕了,因而容错机制非常有效,也是被推荐的.
为此,Elasticsearch允许创建index的shard的一个或多个副本,称为replica.
Replication重要的两个主要原因:(1)提供高可用性,以防shard/node失效.
注意,一个replicashard绝对不能分配到它原先所在node(即创建副本的原本所在的node);(2)允许扩展搜索容量,因为搜索可以并行在所有replica上执行总结每个index可以被分为多个shard.
一个index也可以被复制0份或者多份.
一旦复制过,每个index将有主shard(创建副本的原本所在的shard)和replicashard(主shard的副本).
shard和replica的数量可以在index创建的时候自定义.
index创建之后,你可以动态改变replica的数量,但是不能改变shard的数量.
在默认情况下,每个index被分配5个主shard和1个replica,这意味着,如果你在cluster中有至少两个节点,每个index将有10个shard,分别是5个主shard和另外5个replicashard(1个完整的replica).
需要注意的是,每个Elasticsearch的shard是一个Lucene的index.
在一个单独的Lucene的index中有最大数量的documents.
因为LUCENE-5843(https://issues.
apache.
org/jira/browse/LUCENE-5843)的原因,这个documents数量被限制为2,147,483,519(=Integer.
MAX_VALUE-128),你可以通过_cat/shards(curl10.
20.
18.
20:9200/_cat/shards)的api接口来监控shard的大小.
本博客文章除特别声明,全部都是原创!
2/3原创文章版权归过往记忆大数据(过往记忆)所有,未经许可不得转载.
本文链接:【】()PoweredbyTCPDF(www.
tcpdf.
org)3/3

PacificRack(年付低至19美元),夏季促销PR-M系列和多IP站群VPS主机

这几天有几个网友询问到是否有Windows VPS主机便宜的VPS主机商。原本他们是在Linode、Vultr主机商挂载DD安装Windows系统的,有的商家支持自定义WIN镜像,但是这些操作起来特别效率低下,每次安装一个Windows系统需要一两个小时,所以如果能找到比较合适的自带Windows系统的服务器那最好不过。这不看到PacificRack商家有提供夏季促销活动,其中包括年付便宜套餐的P...

Boomer.Host(年付3.5美)休斯敦便宜VPS

Boomer.Host是一家比较新的国外主机商,虽然LEB自述 we’re now more than 2 year old,商家提供虚拟主机和VPS,其中VPS主机基于OpenVZ架构,数据中心为美国得克萨斯州休斯敦。目前,商家在LET发了两款特别促销套餐,年付最低3.5美元起,特别提醒:低价低配,且必须年付,请务必自行斟酌确定需求再入手。下面列出几款促销套餐的配置信息。CPU:1core内存:...

港云网络(¥1/月活动机器),香港CN2 4核4G 1元/月 美国CN2

港云网络官方网站商家简介港云网络成立于2016年,拥有IDC/ISP/云计算资质,是正规的IDC公司,我们采用优质硬件和网络,为客户提供高速、稳定的云计算服务。公司拥有一流的技术团队,提供7*24小时1对1售后服务,让您无后顾之忧。我们目前提供高防空间、云服务器、物理服务器,高防IP等众多产品,为您提供轻松上云、安全防护。点击进入港云网络官方网站港云网络中秋福利1元领【每人限量1台】,售完下架,活...

curl扩展为你推荐
phpwindPHPWIND和DISCUZ有什么区别支付宝蜻蜓发布蜻蜓支付怎样实现盈利cisco2960配置思科2960G交换机如何将配置百兆改为千兆配置outlookexpress如何开启OUTLOOK EXPRESS功能?字节跳动回应TikTok易主一部电影讲一个小伙子去继承遗产结果是一批雪橇狗男主吹口哨声明不是雪地狂奔大飞资讯新闻资讯包括什么内容?青岛网通测速家用电脑上网(青岛网通)512k网速算不算快,玩主流网游卡不卡即时通如何使用即时通啊网络u盘网吧网络U盘是怎么弄的温州都市报招聘劳务市场找工作可靠吗
北京租服务器 怎么申请域名 linode日本 国外服务器 vmsnap3 gitcafe 线路工具 中国智能物流骨干网 河南移动邮件系统 刀片服务器是什么 metalink 彩虹云 smtp虚拟服务器 免费asp空间 韩国代理ip 免费网络空间 hostease nnt 新疆服务器 免费赚q币 更多