56.1 演示环境介绍
- CM和CDH已安装且正常运行
- 集群已部署Spark2 On Yarn模式
- 集群已部署Anaconda
- 集群已配置好DNS服务并配置CDSW节点的泛域名解析
- CentOS7.2
- 采用root用户操作
- CM和CDH版本5.13.0
- CDSW版本1.2.0
56.2 操作演示
部署CDSW Parcel包
- 下载CDSW的Parcel,下载地址如下
http://archive.cloudera.com/cdsw/1/parcels/1.2.0/CDSW-1.2.0.p1.183075-el7.parcel
http://archive.cloudera.com/cdsw/1/parcels/1.2.0/CDSW-1.2.0.p1.183075-el7.parcel.sha1
http://archive.cloudera.com/cdsw/1/parcels/1.2.0/manifest.json
- 将下载的文件部署在Apache所在服务器的/var/www/html/cdsw1.2.0目录下
[root@cdh01 cdsw1.2.0]# ll
total 4011980
-rwxr-xr-x 1 rootroot 4108254806 Nov 2 20:30CDSW-1.2.0.p1.183075-el7.parcel
-rwxr-xr-x 1 rootroot 40 Nov 2 18:47 CDSW-1.2.0.p1.183075-el7.parcel.sha1
-rwxr-xr-x 1 rootroot 4231 Nov 218:47 manifest.json
[root@cdh01 cdsw1.2.0]#
- 通过浏览器测试是否部署成功
- 如图说明部署成功
安装CSD文件
- 如图说明部署成功
- 下载CSD文件,使CM支持CDSW安装,文件下载地址
http://archive.cloudera.com/cdsw/1/csd/CLOUDERA_DATA_SCIENCE_WORKBENCH-1.2.0.jar
- 将下载的CLOUDERA_DATA_SCIENCE_WORKBENCH-1.2.0.jar文件放在CM所在服务器的/opt/cloudera/csd目录下
[root@cdh01csd]# cd /opt/cloudera/csd/
[root@cdh01csd]# ll
-rw-r--r--1 root root 8158 Oct 2005:52CLOUDERA_DATA_SCIENCE_WORKBENCH-1.2.0.jar
[root@cdh01csd]#
- 重启Cloudera-scm-server服务
[root@cdh01csd]# service cloudera-scm-server restart
Restartingcloudera-scm-server (via systemctl): [ OK ]
[root@cdh01csd]#
- 添加CDSW节点到集群
- 登录CM,新建一个主机模板
- 选择模板拥有的角色
- 完成主机模板创建
- 使用添加主机引导,进行主机添加,将cdswmaster主机添加到集群
- 选择cdswmaster主机,应用主机模板
- 配置CDSW的Parcle库
- 配置parcel库
- 下载、分配并激活,完成激活
- 配置parcel库
- 安装CDSW服务
- 进入CM主页,选择集群点击“添加服务”
- 进入添加服务引导界面, 选择“Cloudera Data Science Workbench”,点击“继续”
- 选择Master和Worker,点击“继续”
- 输入Domain和Block Device,点击“继续”
- 首次运行CDSW,点击“继续”
- 完成CDSW安装,CDSW启动需要一段时间,等待10-20分钟后再访问CDSW控制台。
- 测试CDSW功能
- 进入CDSW服务,点击链接登录CDSW控制台
- 点击CDSW Web UI进入CDSW登录界面
- 点击“Sign Up fo a New Account”注册,首次注册的账号默认为管理员账号
- 使用admin用户登录CDSW
- 点击New Project创建一个Python工程
- 工程创建完成后,打开“Open Workbench”,启动一个python的会话
大数据视频推荐:
CSDN
大数据语音推荐:
企业级大数据技术应用
大数据机器学习案例之推荐系统
自然语言处理
大数据基础
人工智能:深度学习入门到精通