8 个基于 Lucene 的开源搜索引擎推荐

Lucene是一种功能强大且被广泛使用的搜索引擎,以下列出了8种基于Lucene的搜索引擎,你可以想象它们有多么强大。

8 个基于 Lucene 的开源搜索引擎推荐

1. Apache Solr

Solr
是一个高性能,采用Java5开发,基于Lucene的全文搜索服务器。文档通过Http利用XML加到一个搜索集合中。查询该集合也是通过
http收到一个XML/JSON响应来实现。它的主要特性包括:高效、灵活的缓存功能,垂直搜索功能,高亮显示搜索结果,通过索引复制来提高可用性,提
供一套强大Data Schema来定义字段,类型和设置文本分析,提供基于Web的管理界面等。

2. Elastic Search

ElasticSearch是一个基于Lucene构建的开源、分布式、RESTful搜索引擎。设计用于云计算中,能够达到实时搜索,稳定、可靠、快速,安装使用方便。支持通过HTTP使用JSON进行数据索引。

3. Index Tank

IndexTank
是一套基于Java的索引-实时全文搜索引擎实现,其功能如variables (boosts), categories (facets),
faceted search, snippeting, custom scoring functions,
suggest,以及autocomplete等。IndexTank的设计分离了相关性标记和文档内容,因为相关性标记的生命周期和文档本身是不一样
的,特别是在用户创建的内容的情况下,例如分享次数,Like按钮,+1按钮等。

4. Katta

Katta是一个可扩展的、故障容错的、分布式实施访问的数据存储。

Katta可用于大量、重复、索引的碎片,以满足高负荷和巨大的数据集。这些索引可以是不同的类型。当前该实现在Lucene和Hadoop mapfiles。

5. Bobo Search

Bobo-Browse是一个用java写的lucene扩展组件,通过它可以很方便地在lucene上实现分组统计功能。

比如说搜索电脑,可以得到CPU是Intel的有几条命中记录,CPU是AMD的有几条命中记录。

6. Compass

Compass是一个强大的、事务的、高性能的对象/搜索引擎映射(OSEM:object/search engine mapping)与一个Java持久层框架。Compass包括:

  • 搜索引擎抽象层(使用Lucene搜索引荐)。
  • OSEM(Object/Search Engine Mapping)支持。
  • 事务管理。
  • 类似于Google的简单关键字查询语言。
  • 可扩展与模块化的框架。
  • 简单的API。

7. Summa

Summa是一种由java开发的、快速模块化和可扩展的搜索引擎。Summa 具有如下特点:

  • 综合搜索:Summa能够同时访问许多不同的数据和资料来源,并以一个统一的接口公开。
  • 模块化设计:Summa搜索系统由一系列独立模块组成,这使其维护和升级更简单容易。
  • 可扩展性:Summa支持分布式架构而且能够按比例的扩大或缩小以处理任何数量的数据。
  • 开放标准:Summa基于现代web技术与标准,不包含任何私有代码或原理。
  • 故障容错:如果某单一数据资源或服务出错,Summa 将会继续运行而不受出错部分限制。

8. Constellio

Constellio 是一个开源的搜索解决方案,适合企业级的搜索。基于 Apache Solr 项目构建,使用 Lucene 做为搜索引擎,并提供基于 Web 的网页和文档的检索。可选择文档类型、文件夹以及文件名进行检索。

上一篇:python遍历数据


下一篇:jquery插件 源码