HDInsight HBase概观

HDInsight HBase概观

什么是HBase的?

HBase它是基于HadoopApache开源NoSQL数据库。它提供了很多非结构化和半结构化数据一致性的随机存取能力的。它是仿照谷歌的BigTable。以家庭为中心的列式数据库。

数据被存储在一个行内的表和数据的行由列族分组。 HBase的是在这个意义上,不管是列也不存储在当中的数据的类型,须要使用它们之前。定义一个无模式数据库。开放源码是首次公布由Mike Cafarella于2007年,线性扩展处理PB级数据的数千个节点。它能够依赖于数据的冗余。批量处理和通过在的Hadoop生态系统的分布式应用程序中提供的其它功能。

什么是AzureHDInsight HBase的?

HDInsight的HBase提供一个管理的集群集成到Azure环境。该簇被配置为直接在Azure斑点存储,这提供了在性能/成本选择低等待时间和添加的弹性存储数据。这使客户能够构建大型数据集工作的交互式站点,构建存储传感器和遥測数据,从数以百万计的端点的服务,以及分析这些数据与Hadoop作业。 HBase的和的Hadoop都是非常好的出发点,在Azure大数据项目,特别是。能够实现实时应用与大型数据集工作。

在HDInsight实现利用HBase的的横向扩展架构,可提供自己主动分片表,强一致性读取和写入,和自己主动故障转移。性能提高了内存快速缓存的读取和高通量流式写入。

虚拟网络的配置也可用于HDInsight HBase的。有关具体信息。请參阅提供HDInsight群集在Azure上的虚拟网络

怎样在HDInsight HBase的数据管理?

数据能够在HBase的使用创造GET,PUT和扫描从HBase的shell命令进行管理。数据通过表决。并阅读使用get命令写入到数据库中。

扫描命令用于获得在一个表中,从多行数据。数据也能够使用HBase的C#的API。它提供了一个客户机库的HBase的REST API的顶端管理。一个HBase的数据库也能够使用Hive查询。的介绍,这些编程模型,请參阅获取使用HBase的用Hadoop在HDInsight開始。协处理器也能够同意在数据库所在的节点数据的处理。

场景:什么是用例HBase的?

BigTable。推而广之,HBase的创建为其典型用例是网页搜索。

搜索引擎建立一个映射条款,包含它们的网页索引。但也有非常多其它的用例HBase的适用哪几个的。都逐项本节。

用例1:key-value存储

HBase的可作为一个键值存储,适用于管理信息系统。 Facebook的HBase的使用他们的邮件系统,它是理想的存储和管理网络通信。

WebTable使用HBase的搜索和管理从网页中提取表。

用例#2:传感器数据

Hase的是用于捕获是从各种来源的增量收集的数据是实用的。这包含社交分析,时间序列,保持交互式仪表盘了解最新的趋势和专柜,以及管理审计日志系统。样例包含彭博交易终端和开放时间序列数据库(OpenTSDB),它存储并提供訪问收集了server系统的健康指标。

用例3:实时查询

Phoenix是Apache HBase的一个SQL查询引擎。它是作为一个JDBC驱动程序和能使查询和使用SQL管理HBase的表。

用例4:HBase的一个平台

应用程序能够在HBase的顶部使用它作为数据存储上执行。样例包含凤凰城,OpenTSDB,KIJI,和Titan。

应用程序还能够整合HBase的。样例包含Hive,Pig,Solr的,风暴,水槽,黑斑羚。星火,神经节和钻孔。

接下来的步骤

得到HDInsight開始使用HBase的用Hadoop

提供HDInsight群集在Azure上的虚拟网络

与HBase的在HDInsight分析微博人气

使用Maven来构建使用HBase的使用HDInsight Java应用程序(的Hadoop)

C#HBase的SDK

另请參阅

Apache的HBase

Bigtable:分布式存储系统的结构化数据

本文翻译自Microsoft Azure官网:http://azure.microsoft.com/en-us/documentation/articles/hdinsight-hbase-overview/

上一篇:hadoop 集群搭建 配置 spark yarn 对效率的提升永无止境 Hadoop Volume 配置


下一篇:20款最好的jQuery文件上传插件