对Hadoop运行负载来说,Orc格式是最小,运行最快的列式存储, 它具有以下特点:
ACID事务支持
包含支持ACID事务和快照隔离.
内建索引
用索引方式可以跳到合适的位置,每列包含最小,最大也包含bloom过滤器.
复杂类型
支持Hive的所有类型,包含复杂类型,struct,lists,maps和unions
快速入门
- 在Hive中运用
- 在Hadoop MapRed中运用
- 在Hadoop MapReduce中运用
- 在Java中使用Orc 核心功能
ORC是Apache项目