es写数据过程
- 客户端选择一个node发送请求过去,这个node就是coordinating node(协调节点)
- coordinting node,对document进行路由,将请求转发给对应的node(有primary shard)
- 实际的node上的primary shard处理请求,然后将数据同步到replica node
- coordinating node,如果发现primary node和所有replica node都搞定之后,就返回响应结果给客户端
es读数据过程
查询,GET某一条数据,写入某个document,这个document会自动给你分配一个全局唯一的id,doc id,同时也是根据doc id进行hash路由到对应的primary shard上面去。也可以手动指定doc id,比如用订单id,用户id。
你可以通过doc id来查询,会根据doc id进行hash,判断出来当时把doc id分配到了哪个shard上面去,从那个shard去查询
- 客户端发送请求到任意一个node,成为coordinate node
- coordinate node对document进行路由,将请求转发到对应的node,此时会使用round-robin随机轮询算法,在primary shard以及其所有replica中随机选择一个,让读请求负载均衡
- coordinate node返回document给客户端
es关键字搜索
- 客户端发送请求到一个coordinate node
- 协调节点将搜索请求转发到所有的shard对应的primary shard或者replica shard也可以
- query phase: 每个shard将自己的搜索结果(其实就是一些doc id),返回给协调节点,由协调节点进行数据的合并,排序,分页等操作,产出最终的结果。
- fetch phase: 接着由协调节点,根据doc id去各个节点上拉取实际的document数据,最终返回给客户端