原文地址:http://tech.it168.com/a2014/0929/1670/000001670840_all.shtml
【IT168 评论】传统关系型数据库在诞生之时并未考虑到如今如火如荼的移动、社交以及大数据负载类型,同时也并不适合处理极端规模处理任务。不过大家不必担心,十六家专业企业已经为我们带来他们各自的次世代NoSQL与NewSQL选项。
为什么在处理全新数据类型以及极端业务规模实例时,企业正越来越多地选择备用方案来替代占据领导地位的关系型数据库管理系统(简称RDMS)?
带着这个问题,我们与The Weather公司CIO Bryson Koehler进行了交流——这家公司目前正利用以Riak这款NoSQL数据库为基础的云天气预报系统,以系统每天20TB的惊人速度处理数据。他的回答非常坚决:
“我们知道自己需要在全球范围内运行,我们也知道自己需要处理天文数字级别的庞大数据总量。我知道自己需要从本质角度考虑如何建立这套系统方案。我不希望以附加方式实现、不希望它变成选项而非惟一答案,我更不希望*为其设立一个技术团队来专司维护工作。传统关系型数据处理方案繁琐而复杂,在我看来它也无法应对全球化规模的处理任务。”
在大规模云部署体系中,NoSQL的加入能够给我们带来强有力的支持。我们同样也听到过很多关于NoSQL灵活性、与架构无关的数据处理特性以及MongoDB与Couchbase等产品在部署简便性方面的优势。支持者们认为这些解决方案能够获取移动、社交、点击流以及传感器数据,而且在他们看来、为传统数据库添加JSON支持无异于为小猪描上口红。
面对这样的实际需求,很多支持者可能会力挺NoSQL产品——我们姑且不说SQL——已经是一种成熟的语言,支持着各种类型的事务型与分析型实例。而在NewSQL方面,目前已经有Clustrix、MemSQL以及VoltDB等厂商提供此类解决方案,承诺在保证NoSQL全球化扩展能力的同时又无需放弃SQL特性。
到目前为止,NewSQL选项在人气方面还远不及NoSQL类方案,这一部分是由于其面世时间相对较短、另一方面也是因为将传统方案与数据灵活性相结合绝非易事。进一步讲,NewSQL供应商们还需面对来自老牌SQL厂商的竞争压力,而客户们也更倾向于利用自己熟悉的老办法来解决业务中的新问题。不过NewSQL厂商们认为,这样的作法是个“代价高昂的错误”。
今天我们将一同近距离审视十六款值得关注的NoSQL与NewSQL数据库管理系统。今天我们暂时将图形数据库排除在外,这类方案主要用于非常特殊的网络分析环境,而且也不像NoSQL或者NewSQL那样属于适合广泛使用的方案。同样被排除在外的还有Redis以及Memcached等高人气产品,二者更接近数据缓存层而非持久性数据存储方案。
今天整理出的集合与之前的那篇《十六款*大数据分析平台》也有所区别——虽然这些产品也能够满足操作型分析处理需求,但运行事务型应用才是其核心重点,而这也是数据库与分析平台之间的主要差异。我们也没有在标题中采用“*”之类的字眼,因为这场比拼尚未尘埃落定,特别是NewSQL阵营的竞争更加有待观察。
闲言少叙,下面我们就一同看看这些面向现代数据管理需求的新型选项。
Aerospike内存支持实时决策
DBMS类型: NoSQL
描述: 闪存优化、分布式内存内数据库提供ACID合规性与可调整一致性
知名客户: Appnexus, BlueKai (现在由甲骨文持有), eBay
公司情况: 私营企业,于2009年建立,原名为Citrusleaf公司。
评论: Aerospike提供的内存内速度优势吸引到了众多要求实现毫秒级响应时间的广告网络以及其它Web规模企业的高度关注。Aerospike目前正积极进军新的业务类别,包括游戏、电子商务以及安全等对延迟状况要求较高的一切环境。我们也将密切关注这套平台,看看Aerospike是否能成为应用范围更广泛的解决方案。
官方网站:http://www.aerospike.com/
Cassandra在全球可扩展性竞争中一路领跑
DBMS类型: NoSQL
描述: 大规模可扩展分区行存储,配备多数据中心复制功能
知名客户: Constant Contact, eBay, Netflix
公司情况: Cassandra是由私营公司DataStax支持的开源项目,该公司成立于2010年
评论: Apache Cassandra的主要优势包括灵活性、NoSQL数据模型、多数据中心支持以及在集群化商用硬件上的线性可扩展特性。商业支持与软件发行版目前已经由DataStax正式提供。Cassandra一直享有最具可扩展性NoSQL数据库的良好声誉,不过它的高度复杂性也一直饱受诟病。财力雄厚的DataStax公司目前正在努力简化产品在企业用户层面的可管理性,同时为其加入了低延迟内存内功能;就在最近,Cassandra还根据需求与Apache Spark进行了集成。Couchbase与HBase都是Cassandra的主要竞争对手,其中后者运行在Hadoop环境下、也被广泛视为最关键的一大潜在威胁。
官方网站:http://www.datastax.com/
Clustrix承诺为SQL带来Web规模
DBMS类型: NewSQL
描述: 分布式关系型DBMS支持自动分区与复制功能
知名客户: AOL, Rakuten,赛门铁克
公司情况: 私营企业,创立于2006年
评论: Clustrix一直以高度分布式特性、可扩展容错性且无需牺牲SQL或者ACID事务处理性能为主要卖点。该公司为客户Twoo.com网站建立过21节点部署方案(如上图所示),这也成为“全世界规模最大的向外扩展SQL部门项目。”各大NewSQL供应商都承诺在大规模部署环境下降低运营合规性难度(与现有数据库相比)。Clustrix面临的挑战与竞争对手包括MemSQL、NuoDB以及VoltDB,它们既拥有自己的差异性优势、同时也依靠能够快速构建的优势成功吸引到了众多大规模客户。
官方网站:http://www.clustrix.com/
Couchbase紧紧跟随移动应用的脚步
DBMS类型: NoSQL
描述: 面向文档的数据库,配备移动同步与可嵌入数据库选项
知名客户: Concur, LinkedIN, Zynga
公司情况: 私营企业,创立于2009年
评论: Couchbase一直致力于涵盖所有业务类型,承诺提供MongoDB当中的文档处理优势以及Cassandra的可扩展性优势。该公司最新推出的方案为Couchbase Mobile,这个于今年五月面世的项目能够保证移动应用在联网或者不联网的情况下始终正常运行。该系统将Couchbase Lite可嵌入设备数据库与接入*Couchbase Server的Couchbase Sync Gateway相结合。我们将继续关注Couchbase能否在各条战线上获得成功。
官方网站:http://www.couchbase.com/
DynamoDB为大规模云应用提供支持
DBMS类型: NoSQL数据库服务
描述: 运行在多个Amazon Availability Zone之上且配备S3备份机制的调整可扩展键-值服务
知名客户: AdRoll, Elsevier, SmugMug
公司情况: 自1997年起正式上市
评论: Amazon公司开发出Dynamo是为了扩大其发展势头迅猛的电子商务业务的规模,而且其2007年企业白皮书的发布还为Cassandra、Riak以及其它NoSQL等发展中项目提供了灵感。DynamoDB数据库服务于2012年正式推出,当初它的出现可谓一枝独秀,不过目前数据库服务阵营已经逐渐扩张。目前大家可以选择在同一套云环境中使用多种流行开源数据库(例如Couchbase、MongoDB以及Riak等等),并在必要时将其迁移至其它云或者是内部环境当中。目前还没有哪种内部或者云备选方案能够取代DynamoDB。如果大家在企业中已经全面采用AWS,那么DynamoDB无疑是一套快速、灵活且具备高可扩展性的解决选项。
官方网站:http://aws.amazon.com/dynamodb/
HBase在Hadoop上实现NoSQL
DBMS类型: NoSQL
描述: 宽列式数据库,建立在Hadoop分布式文件系统(简称HDFS)基础之上
知名客户: Bloomberg LP, Facebook, Nielsen
公司情况: 无,HBase是开源Apache Hadoop中的一项功能方案
评论: HBase是一套运行在HDFS之上的NoSQL数据库,因此它能为用户带来独特的功能——直接处理存储在Hadoop当中的数据。其特性包括巨大的可扩展性(被用于Facebook的消息传输系统当中)、读取与写入一致性、表分区自动化处理与可配置能力以及自动故障转移功能。直到现在也就是2014年年中,HBase仍然处于0.98.3版本,这也成为导致其始终无法得到广泛应用的“主要”原因。毫无疑问,HBase拥有巨大的发展潜力,但相对于Hadoop框架迅猛的发展速度,它的开发进程一直显得有些滞后。我们将持续关注一系列相关项目,包括用于实现YARN支持的Hoya、用于SQL支持的Phoenix、用于应用程序开发的Kiji以及承诺打造更成熟、更实用HBase方案的Facebook Hydrabase项目。
官方网站: http://hbase.apache.org/
IBM匆匆拿下Cloudant,但接下来要做什么?
DBMS类型: 基于云的NoSQL DBMS服务
描述: 基于CouchDB的文档存储数据库即服务
知名客户: Expedia, DHL,三星
公司情况: Cloudant于今年二月被IBM所收购。
评论: 当IBM收购Coudant时(具体收购条款并未公开),专家们认为这笔交易的核心在于获取后者的数据库即服务技术及专业知识。一位IBM公司高管也谈到了底层开源CouchDB DBMS的重要性(请不要把CouchDB DBMS与CouchDB相混淆)。DBMS的特性包括可扩展性、可用性、耐久性、读取与写入一致性再加上灵活的数据处理能力(其中包括JSON、全文本以及地理空间数据)。不过CouchDB最近几年似乎被其它NoSQL竞争对手夺去了风头。令人困惑的是,IBM甚至与NoSQL市场上的领导者MongoDB建立起重要的合作关系。不用说,我们将看到IBM在这方面作出下一步行动。我敢打赌,我们会看到更多利用Cloudant功能的数据库即服务方案。
官方网站:https://cloudant.com/
MarkLogic带来成熟的灵活数据管理方案
DBMS类型: NoSQL
描述: 面向文档的数据库,支持符合ACID原则的事务处理与内置搜索功能
知名客户: DowJones, Citigroup, Boeing
公司情况: 私营企业,创立于2001年
评论: MarkLogic早在NoSQL概念广泛普及之前就已经作为成功的XML数据库而拥有悠久的发展历史。MarkLogic被广泛用于各类大规模技术、金融、法律、医疗以及科学等要求灵活管理并重新使用信息的重量级领域。目前这款与架构无关且具备高度可扩展性的集群化DBMS作为NoSQL文档存储方案而获得了广泛应用。该公司多年来始终致力于构建企业级功能,其中包括复制、回滚、自动化故障转移、时间点恢复以及备份/恢复。MarkLogic已经拥有多家高端(大部分集中在出版行业)客户。这家公司能否在MongoDB的环伺之下进一步扩大其普及范围?请大家拭目以待。
官方网站:http://www.marklogic.com/
MemSQL将内存内性能与SQL相结合
DBMS类型: NewSQL
描述: 大规模内存内行存储方案,最近还加入了列式式分析功能。
知名客户: Comcast, CPXi, Shutterstock
公司情况: 私营企业,创立于2011年
评论: 顾名思义,MemSQL与其它大规模NoSQL方案的主要区别在于它结合了内存内机制、符合ACID原则的事务处理性能以及SQL兼容性。除了将关系型接口添加到内存内数据层,MemSQL最近还在闪存与磁盘存储选项中支持压缩列式存储机制,从而深度实现历史分析功能。MemSQL的主要竞争对手为老牌方案VoltDB(以及其它NewSQL数据库),因此这场进行中的竞逐将在比拼的同时拓展NewSQL地位以及客户的接纳程度。
官方网站:http://www.memsql.com/
MongoDB呼吁现代开发者的加入
DBMS类型: NoSQL
描述: 文档存储DBMS
知名客户: 思科, eBay, Intuit, MetLife
公司情况: 私营企业,于2007年创立,最初名为10Gen
评论: 开源MongoDB是目前人气最高的NoSQL数据库,目前其下载量已经超过700万次,实际部署案例也高达数十万。之所以能够获得热烈欢迎,MongoDB最大的卖点在于简单易行的开发流程以及对来自移动、社交以及Web应用程序的现代数据的灵活处理能力。今年五月MongoDB迎来了2.6版本,该公司借此进一步简化了管理工作、强化了安全性并改进了分析功能。这个版本还提升了可扩展性,从而与Cassandra、Couchbase以及Riak等竞争对手缩小这方面的差距。不过相对于可扩展性,MongoDB能够为各类全球化、PB级别且由成百上千用例构成的整体部署方案带来出色的处理速度、开发简易性以及灵活的数据管理机制,这一切足以使其赢得新客户们的青睐。
官方网站:http://www.mongodb.com/
NuoDB将SQL与云集于一身
DBMS类型: NewSQL
描述: 向外扩展关系型DBMS支持持续可用性、地理分布以及云部署方案
知名客户: AutoZone, Dropship Commerce, NorthPoint Solutions
公司情况: 私营企业,创立于2010年
评论: NuoDB是另一家NewSQL新兴企业,而且也承诺为客户带来可扩展性、地理分布部署以及各类为人们所熟知的SQL特性。不出所料,它具备良好的高可用性、热升级、数据冗余以及灾难恢复能力。NuoDB的一大发展转折在于通过内置的多租户支持能力着重强调云部署方案。它是一款很有前途的产品,但作为一家年轻的NewSQL供应商,NuoDB仍然需要进一步向客户证明自身的卓越之处。
官方网站:http://www.nuodb.com/
甲骨文NoSQL数据库:老厂商、新方案
DBMS类型: NoSQL
描述: 分布式键-值存储数据库,源于BerkeleyDB
知名客户: Catalyst IT Services, Passoker, Payback
公司情况: 于1986年上市
评论: NoSQL市场上的各位领导者纷纷表示他们从未将甲骨文NoSQL数据库视为具备竞争力的解决方案,但相信这种情况将很快改变。该产品的目标客户群体显然由那些忠诚的甲骨文方案买家构成,这也符合大多数主导型厂商的供求关系。大家可以免费下载到这款可扩展、分布式键-值存储方案的社区版本,也可以为社区版与完成度更高的企业版购买技术支持服务。该数据库也被绑定在甲骨文大Big Data Appliance中并与其基于Cloudera的Hadoop发行版相集成。甲骨文NoSQL技术社区实际上并不会发布公告或者组织活动,但甲骨文庞大的客户群体当中仍有可观的一批支持者将其视为灵活且可扩展的NoSQL备选方案。
官方网站:http://www.oracle.com/us/products/database/nosql/overview/index.html
Riak走向大规模环境、走向云端
DBMS类型: NoSQL
描述: 分布式键-值存储方案,具备多数据中心复制与自动平衡功能
知名客户: Best Buy, Ideeli, The Weather Company
公司情况: 由私营企业Basho公司支持的开源项目,该公司创立于2007年
评论: 开源Riak在设计目的上主要考虑到高度可扩展性、可用性、容错性以及操作便捷性。由Basho支持的Riak企业版及Raik CS版还加入了对企业级功能的支持以及与Amazon Web Services S3云存储相兼容的能力。The Weather Channel将Riak引入Amazon云,并以其简便性、可扩展性以及始终可用性作为主要卖点。Riak的环状节点集群方案(如上图所示)允许用户随意添加或者移除虚拟节点并据此对数据进行重新分配。Basho公司宣称自己的方案兼有Cassandra的规模优势与更出色的操作便利性。Basho在过去一年中取得了可观的运营收益,不过我们预计其营收未来将趋于稳定、而Basho也将继续推动云部署并以易于操作作为自身特色。
官方网站:http://basho.com/
Splice Machine将事务型SQL推向Hadoop
DBMS类型: NewSQL
描述: SQL-on-Hadoop RDBMS,支持事务与分析型处理任务
知名客户: Harte Hanks
公司情况: 私营企业,创立于2012年
评论: 目前市面上的SQL-on-Hadoop方案可谓层出不穷,但新兴企业Splice Machine显然拥有自己的独门秘笈——该方案能够在Hadoop之上运行事务型应用程序并且同时支持分析型应用。其客户Harte Hanks公司表示,他们目前运行着大量专门针对传统数据库所设计的应用程序,其中包括IBM Unica、COgnos BI以及Ab Initio数据集成软件。这是一家非常年轻的企业,知名客户的名单也显得有些寒酸。不过在Hadoop之上运行事务型应用实在是种独特的思路,这也足以使该公司在英才济济的NewSQL市场上赢得关注。
官方网站:http://www.splicemachine.com/
Translattice将PostgreSQL发扬光大
DBMS类型: NewSQL
描述: 分布式关系型DBMS,具备云与设备部署选项
知名客户: Oakland Raiders
公司情况: 私营企业,创立于2007年
评论: TransLattice以一套大规模分布式PostgreSQL衍生版本起家,项目最初被定名为TransLattice弹性数据库,可以被部署在内部、设备上或者多云环境之下。2013年该公司收购了StormDB,这也是一家致力于扩展PostgreSQL厂商,并利用其知识产权打造出了Postgres-XL——一款可扩展、大规模并行分析数据库。之所以进行此次收购,TransLattice是希望能让多数Postgres用户以熟悉的方式实现对大数据OLTP以及分析的扩展任务。单薄的公共客户参考名单显示,TransLattice与不少NewSQL供应商一样仍然需要进一步证明自己的市场吸引力。
官方网站:http://www.translattice.com/index.shtml
VoltDB打理高速流数据
DBMS类型: NewSQL
描述: 符合ACID与SQL原则的内存内关系型数据库
知名客户: BooYah, Novatel Networks, QualityHealth
公司情况: 私营企业,创立于2009年
评论: VoltDB拥有大规模高速事务处理能力,这要归功于其采用的高分布式内存内架构。作为一套开源GNU许可DBMS并由联合创始人/DBMS大牛Michael Stonebraker博士参与的解决方案,VoltDB能够处理来自电信、移动广告网络以及游戏公司的快速流数据。于今年年初发布的VoltDB 4.0还对分析处理能力进行了升级,带来了更高的查询数据执行能力、支持并发用户操作以及更深层次的SQL时间序列分析能力。VoltDB的直接对手包括MemSQL、NuoDB以及Clustrix,不过今年甲骨文与微软也相继加入战团、希望利用其现有数据库管理系统更为客户所熟悉的优势在市场上保持竞争力。
官方网站:http://voltdb.com/