前言
在先前的文章中,已经介绍了如何在Ubuntu Kylin操作系统下搭建Hadoop运行环境,而现在将在之前工作的基础上搭建Eclipse开发环境。
配置
开发环境:Eclipse 4.2,其他同先前。
第一步 安装Eclipse4.2
在Eclipse官网获取到Eclipse然后解压到用户目录即可。
第二步 编译Hadoop的Eclipse插件
这一步可以选择使用别人编译好了的插件(需注意hadoop版本号 和编译时的Eclipse版本号要一致),也可以自行编译(较繁琐)。
一开始我是自己尝试编译,但是发现项目指定了要使用的JDK版本,而且不是我自己正在用的1.8,于是我决定用别人编译好的 (应该不会运行也指定了JRE版本吧)。
另外,下载插件要看清楚hadoop,eclipse是什么版本,要对应清楚。切记!
第三步 配置开发环境
1. 将hadoop配置文件中所有用到localhost别名的地方替换为主机本来IP。
2. 启动hadoop
3. 启动Eclipse
4. 打开Eclipse的Window->Preferences,可以在打开对话框的左上角看到如下内容:
5. 在输入框中输入hadoop目录地址后确定
6. 在Eclipse的Window-->Show View->Other中选择如下并点击确定
7. 在Eclipse界面下方的Map/Reduce Locations窗口中点击右键->New Hadoop location:
8. 在打开的对话框中,最上面的Location name可以是本次配置名称,可根据自己偏好进行设定。而下面两组Host和Port值则分别为mapred-site.xml及core-site.xml中指定的IP,端口值。
特别说明:所有用到IP地址的地方,不要用localhost这样的别名,而是直接输入IP。
9. 接下来点击上对话框上面的Advanced Parameters,将其中的hadoop.tmp.dir设定为hadoop目录下的tmp子目录(先检查下有没这个子目录,没有就新建一个),然后确定:
在core-site配置文件中也增加此字段的设置:
10. Eclipse左边窗体出现类似下图所示的内容表示配置成功:
小结
1. 如果提示拒绝连接,请格式化hdfs一次。(目前我还不知道为什么要这么做,但这里也没必要纠结以后自然会明白)
2. 配置中可以还会有些问题,欢迎一起交流探讨。