引言
在本次 ApacheCon2019年的会议上,Cassandra的议题多达 30场次:https://www.apachecon.com/acna19/s/#/schedule?search=Cassandra,与最火的Spark类似。其它一些项目只有个位数的分享。
这么多的分享,背后必然有一个强大的生态社区,本文将梳理下Cassandra的商业公司、云公司、全球使用的大公司及相关生态的支持。另外有份资料表明,从事Cassandra职业的薪水非常可观,排名第五
商业公司
- Datastax:https://www.datastax.com/,是一家位于加州的初创公司,提供了一个商业版本的Apache Cassandra数据库,公司目前已经接近1亿美元的融资。创始人也是Cassandra作者之一,是社区Cassandra较大贡献者。Datastax的Cassandra核心集成了Solr提供检索服务;另外集成Spark,与Cassandra一起搭配,提供流、存储、计算、机器学习一体化的存储计算分析服务。根据一些公开的资料,目前服务了较多世界500强的公司。
- InstaClustr:提供了开源的Cassandra、ES、Spark、Kafka,并且以Cassandra为核心。Cassandra、ES、Spark、Kafka也被称之为新大数据4组件。
- Thelastpickle:一家做Cassandra咨询的公司,公司也有不少的PMC及Committer。其开源了很多外围的工具,比如cassandra-reaper等,可以关注Thelastpickle的首页:https://thelastpickle.com
- scylladb:支持CQL协议的,号称是C++版本的Cassandra,参考:https://www.scylladb.com
- Strapdata:是cassandra + ES结合背后的商业公司,参考:https://www.strapdata.com/
这些商业公司,看起来也是分工合作,有的结合其他组件,有的提供工具,有的不断增强内核,共同把社区做大。
云公司
- AWS:DynamoDB,本身Cassandra就是参考DynamoDB做的,社区也流行Cassandra就是DynamoDB的开源实现。因为AWS已经有DynamoDB,所以并没有支持Cassandra。不过AWS官方支持从Cassandra迁移到DynamoDB。另外一股潮流是 阿里云、Datastax、scylladb都在支持DynamoDB的协议。
- Azure:CosmosDB,号称宇宙数据库,支持CQL的接口。
- Google:Google面临跟AWS及Azure的竞争,他选择的路是直接与各大Paas的商业公司合作,比如:Datastax、Mongo等公司,也会提供Cassandra的支持。
- 阿里云:在数据库的一方产品类别,直接提供原生的Cassandra服务,另外阿里云近期也重点在国内宣传Cassandra及积极贡献社区,是非常有诚意的,参考:https://www.aliyun.com/product/cds
- 华为云:最近华为出了一个多模数据库,宣传是可以支持Cassandra与MongoDB
- 腾讯云:貌似没有支持,不过迫于全球的云公司都对Cassandra有一定的支持,或许后续有一定的动作
全球较大使用Cassandra公司
具体可以参考文章:https://developer.aliyun.com/article/718156。根据不完全统计,在全球有超过10w公司在使用Cassandra,国内至少有5000家企业在使用。列举一些较大的使用的非云公司。(排除 阿里、华为、腾讯、京东等做云的公司)
- Apple:目前有16w台的规模,使用在各个业务线,也是Cassandra社区较为活跃的贡献者
- Netflix:目前有数千台在使用,社区比较活跃,这片文章也了 netflix为什么选择cassandra:https://www.jcount.com/7-reasons-netflix-uses-cassandra-databases/
- Facebook:主导了cassandra+rocksdb的研发:https://thenewstack.io/instagram-supercharges-cassandra-pluggable-rocksdb-storage-engine/
- 360:之前主要用在云盘的业务,也是国内较早的使用者之一,规模也比较大。
- 思科:主要使用在设备制造等场景
与Cassandra结合的生态
- Cassandra + Spark:Datastax维护的项目,目前有1000+的star。参考:https://github.com/datastax/spark-cassandra-connector。Cassandra从10年就开始跟Hadoop结合,后续Cassandra与Spark结合的更加紧密。
- Cassandra + ES:https://www.elassandra.io/ es的每个节点放到了Cassandra的进程里面,同时提供CQL及ES api的接口
- Cassandra + Kafka:支持把Kafka的数据直接写到Cassandra
- Cassandra + RocksDB:RocksDB 与Cassandra同是Facebook开源的项目,两者做加法是天然的结合。CASSANDRA-13476目前也在推进之中,另外Facebook也开源了一个Cassandra与Rocksdb结合的项目Rocksandra
- Cassandra + Datax:Datax是阿里开源的项目,阿里云Cassandra团队即将提交Patch支持Cassandra,包括MySQL写到Cassandra
- Cassandra + Flink:Flink社区支持了Cassandra的connector,参考:https://github.com/apache/flink/tree/master/flink-connectors/flink-connector-cassandra
- Cassandra + Spring:https://github.com/spring-projects/spring-data-cassandra ,支持spring写到Cassandra,此项目还是比较活跃的
- Cassandra + Lucene:Lucene可以作为Cassandra本地二级索引。参考:https://github.com/Stratio/cassandra-lucene-index
- Cassandra + JanusGraph:图数据库,JanusGraph支持以Cassandra为底座提供图服务
- Cassandra + GeoMesa:时空数据库,GeoMesa支持以Cassandra为底座提供时空数据服务
- Cassandra + KairosDB:时序数据库,KairosDB支持以Cassandra为底座提供时序服务
- Cassandra + heroic:时序数据库,heroic支持以Cassandra为底座提供时序服务
- thingsboard:物联网平台,仅仅支持Cassandra作为存储引擎
- devicehive:物联网平台,支持Cassandra作为存储引擎
如果有其它的生态对接,欢迎反馈给社区~
总结
Cassandra背后的力量是很强大的,有全球最大的公司的支持,有数个商业公司支持,大部分的云都支持或者支持CQL语法,另外有数不清楚的其它生态的力量在跟Cassandra做加法。Cassandra真实火的不得了。希望后续Cassandra在 中国Cassandra技术社区、阿里云、各大公司、爱好者的推动下,火起来。 Cassandra你值得拥有~
入群邀约
为了营造一个开放的 Cassandra 技术交流环境,社区建立了微信群公众号和钉钉群,为广大用户提供专业的技术分享及问答,定期开展专家技术直播,欢迎大家加入。另外阿里云提供Cassandra试用:https://www.aliyun.com/product/cds