一、概述
CDP大数据平台是CDH和HDP合并之后的新版本,使用的hive是3.0版本。CDP在使用上和CDH有很大的不同。
二、Hive默认创建表格不同
CDP默认创建的表格都是事务表;可以进行增、删、改、查操作,不支持设置事务表的相关参数;应该是默认已经设置好了。而CDH需要指定创建的表格时事务表并且需要设置事物操作参数:hive.support.concurrency=true;和hive.txn.manager=org.apache.hadoop.hive.ql.lockmgr.DbTxnManager;才可以对事务表进行删除和更新操作。
三、Hive操作表格方式不同
CDH直接链接hive的hiveserver2就可以通过jdbc的方式操作hive表格;而CDP将hive分为了hive组件、TEZ组件和hive on tez 三部分;三者缺一不可;安装完hive和tez之后,需要再安装hive on tez,并且修改hive on tez的默认端口10000位其他值,不然会报错与hive的端口冲突。再操作读写hive表格时需要链接hive on tez的hiveserver2。
不然会报错:
由此可见,hive on tez 是将hive和tez搭建起来的桥梁,需要通过hive on tez的服务来操作CDP的hive表格。
四、yarn资源队列创建方式不同
4.1 CDH创建资源队列方式
CDH需要先进入到yarn组件,然后使用yarn提供的界面可以直接创建yarn的执行任务的队列。
4.2 CDP创建资源队列方式
CDP直接通过管理界面,进入到yarn的Yarn Queue Manger UI来进行操作。