1. Elasticsearch 简介
Elasticsearch是一个基于Apache Lucene™的开源搜索引擎。无论在开源还是专有领域,Lucene可以被认为是迄今为止最先进、性能最好的、功能最全的搜索引擎库。
2. Elasticsearch 特点
分布式的实时文件存储,每个字段都被索引并可被搜索
分布式的实时分析搜索引擎
可以扩展到上百台服务器,处理PB级结构化或非结构化数据
3. Elasticsearch 作用
全文检索(全部字段)、模糊查询(搜索)、数据分析(提供分析语法,例如聚合)
4. Elasticsearch 和 solr 比较
(1).Solr 利用 Zookeeper 进行分布式管理,而 Elasticsearch 自身带有分布式协调管理功能;
(2).Solr 支持更多格式的数据,而 Elasticsearch 仅支持json文件格式;
(3).Solr 官方提供的功能更多,而 Elasticsearch 本身更注重于核心功能,高级功能多有第三方插件提供
;
(4).Solr 在传统的搜索应用中表现好于 Elasticsearch,
但在处理实时搜索应用时效率明显低于 Elasticsearch,例如微信附近的人功能就是es 实现的;
(5).es 可以通过RESTful API 做到对数据的增删改(http 请求对数据操作);
5. Elasticsearch 使用案例
GitHub:2013年初,GitHub抛弃了Solr,采取ElasticSearch 来做PB级的搜索。 “GitHub使用ElasticSearch搜索20TB的数据,包括13亿文件和1300亿行代码”
百度:百度目前广泛使用ElasticSearch作为文本数据分析,
6. Elasticsearch 的安装
安装细节步