史上最快! 10小时大数据入门实战(三)-分布式文件系统HDFS

史上最快! 10小时大数据入门实战(三)-分布式文件系统HDFS

史上最快! 10小时大数据入门实战(三)-分布式文件系统HDFS

史上最快! 10小时大数据入门实战(三)-分布式文件系统HDFS

史上最快! 10小时大数据入门实战(三)-分布式文件系统HDFS

史上最快! 10小时大数据入门实战(三)-分布式文件系统HDFS

史上最快! 10小时大数据入门实战(三)-分布式文件系统HDFS

史上最快! 10小时大数据入门实战(三)-分布式文件系统HDFS

史上最快! 10小时大数据入门实战(三)-分布式文件系统HDFS

HDFS 环境搭建


史上最快! 10小时大数据入门实战(三)-分布式文件系统HDFS

HDFS 伪分布式环境搭建
史上最快! 10小时大数据入门实战(三)-分布式文件系统HDFS
CentOS 环境安装步骤

MacOS安装环境
史上最快! 10小时大数据入门实战(三)-分布式文件系统HDFS
安装jdk

史上最快! 10小时大数据入门实战(三)-分布式文件系统HDFS
jdk安装路径

史上最快! 10小时大数据入门实战(三)-分布式文件系统HDFS
/usr/libexec/java_home -V:列出所有版本的JAVA_HOME

设置 JAVA_HOME
  • 添加java_home到.bash_profile文件中
export JAVA_HOME=$(/usr/libexec/java_home)
export PATH=$JAVA_HOME/bin:$PATH
export CLASS_PATH=$JAVA_HOME/lib 
史上最快! 10小时大数据入门实战(三)-分布式文件系统HDFS
Mac OS X ssh设置

输入命令ssh localhost,可能遇到如下问题


史上最快! 10小时大数据入门实战(三)-分布式文件系统HDFS

原因是没打开远程登录,进入系统设置->共享->远程登录打开就好


史上最快! 10小时大数据入门实战(三)-分布式文件系统HDFS

这时你再ssh localhost一下
史上最快! 10小时大数据入门实战(三)-分布式文件系统HDFS
  • 下载 Hadoop


    史上最快! 10小时大数据入门实战(三)-分布式文件系统HDFS
  • 解压到soft目录


    史上最快! 10小时大数据入门实战(三)-分布式文件系统HDFS

    史上最快! 10小时大数据入门实战(三)-分布式文件系统HDFS
    官方指南
  • 编辑 hadoop-env.sh 文件


    史上最快! 10小时大数据入门实战(三)-分布式文件系统HDFS

    史上最快! 10小时大数据入门实战(三)-分布式文件系统HDFS

    史上最快! 10小时大数据入门实战(三)-分布式文件系统HDFS

    史上最快! 10小时大数据入门实战(三)-分布式文件系统HDFS

    Hadoop也可以在伪分布模式下的单节点上运行,其中每个Hadoop守护进程都在单独的Java进程中运行


    史上最快! 10小时大数据入门实战(三)-分布式文件系统HDFS

    史上最快! 10小时大数据入门实战(三)-分布式文件系统HDFS
    具体更改

    史上最快! 10小时大数据入门实战(三)-分布式文件系统HDFS
    新建一个临时文件目录

    史上最快! 10小时大数据入门实战(三)-分布式文件系统HDFS
    编辑 hdfs/core-site.xml 文件

    史上最快! 10小时大数据入门实战(三)-分布式文件系统HDFS

    史上最快! 10小时大数据入门实战(三)-分布式文件系统HDFS

    史上最快! 10小时大数据入门实战(三)-分布式文件系统HDFS
    配置 datanode 节点数

    启动 hdfs


    史上最快! 10小时大数据入门实战(三)-分布式文件系统HDFS

    史上最快! 10小时大数据入门实战(三)-分布式文件系统HDFS

    史上最快! 10小时大数据入门实战(三)-分布式文件系统HDFS

史上最快! 10小时大数据入门实战(三)-分布式文件系统HDFS

史上最快! 10小时大数据入门实战(三)-分布式文件系统HDFS

查看进程
史上最快! 10小时大数据入门实战(三)-分布式文件系统HDFS

访问http://localhost:50070/
史上最快! 10小时大数据入门实战(三)-分布式文件系统HDFS

表示HDFS已经安装成功
史上最快! 10小时大数据入门实战(三)-分布式文件系统HDFS
存活节点

步骤小结
史上最快! 10小时大数据入门实战(三)-分布式文件系统HDFS

关闭
史上最快! 10小时大数据入门实战(三)-分布式文件系统HDFS

HDFS Shell 操作

史上最快! 10小时大数据入门实战(三)-分布式文件系统HDFS

官网指南


史上最快! 10小时大数据入门实战(三)-分布式文件系统HDFS

先启动 HDFS

史上最快! 10小时大数据入门实战(三)-分布式文件系统HDFS
配置 hadoop 环境变量

史上最快! 10小时大数据入门实战(三)-分布式文件系统HDFS
成功

史上最快! 10小时大数据入门实战(三)-分布式文件系统HDFS
指令集

史上最快! 10小时大数据入门实战(三)-分布式文件系统HDFS
dfs fs 无差异

史上最快! 10小时大数据入门实战(三)-分布式文件系统HDFS
上传一个 txt 文件
史上最快! 10小时大数据入门实战(三)-分布式文件系统HDFS

创建文件夹


史上最快! 10小时大数据入门实战(三)-分布式文件系统HDFS

多层次文件夹


史上最快! 10小时大数据入门实战(三)-分布式文件系统HDFS

遍历所有文件夹
史上最快! 10小时大数据入门实战(三)-分布式文件系统HDFS

史上最快! 10小时大数据入门实战(三)-分布式文件系统HDFS

史上最快! 10小时大数据入门实战(三)-分布式文件系统HDFS

史上最快! 10小时大数据入门实战(三)-分布式文件系统HDFS

删除文件/文件夹


史上最快! 10小时大数据入门实战(三)-分布式文件系统HDFS

史上最快! 10小时大数据入门实战(三)-分布式文件系统HDFS

史上最快! 10小时大数据入门实战(三)-分布式文件系统HDFS
所上传的文件

Java 操作 HDFS 开发环境搭建

史上最快! 10小时大数据入门实战(三)-分布式文件系统HDFS

史上最快! 10小时大数据入门实战(三)-分布式文件系统HDFS

史上最快! 10小时大数据入门实战(三)-分布式文件系统HDFS

史上最快! 10小时大数据入门实战(三)-分布式文件系统HDFS

史上最快! 10小时大数据入门实战(三)-分布式文件系统HDFS

史上最快! 10小时大数据入门实战(三)-分布式文件系统HDFS
pom 文件

JavaAPI 操作 HDFS文件系统

史上最快! 10小时大数据入门实战(三)-分布式文件系统HDFS

史上最快! 10小时大数据入门实战(三)-分布式文件系统HDFS
测试通过

史上最快! 10小时大数据入门实战(三)-分布式文件系统HDFS
  • 测试创建文件方法


    史上最快! 10小时大数据入门实战(三)-分布式文件系统HDFS

    史上最快! 10小时大数据入门实战(三)-分布式文件系统HDFS
  • 查看 HDFS 文件的内容


    史上最快! 10小时大数据入门实战(三)-分布式文件系统HDFS

    史上最快! 10小时大数据入门实战(三)-分布式文件系统HDFS
  • 上传文件到 HDFS


    史上最快! 10小时大数据入门实战(三)-分布式文件系统HDFS
  • 上传文件到 HDFS(带进度条)


    史上最快! 10小时大数据入门实战(三)-分布式文件系统HDFS

    史上最快! 10小时大数据入门实战(三)-分布式文件系统HDFS
    测试通过

    史上最快! 10小时大数据入门实战(三)-分布式文件系统HDFS
  • 下载文件到本地


    史上最快! 10小时大数据入门实战(三)-分布式文件系统HDFS

    史上最快! 10小时大数据入门实战(三)-分布式文件系统HDFS
    测试通过

    史上最快! 10小时大数据入门实战(三)-分布式文件系统HDFS
  • 查看某个目录下的所有文件


    史上最快! 10小时大数据入门实战(三)-分布式文件系统HDFS

    史上最快! 10小时大数据入门实战(三)-分布式文件系统HDFS
    测试通过

    史上最快! 10小时大数据入门实战(三)-分布式文件系统HDFS
  • 删除文件/文件夹


    史上最快! 10小时大数据入门实战(三)-分布式文件系统HDFS

    史上最快! 10小时大数据入门实战(三)-分布式文件系统HDFS

    史上最快! 10小时大数据入门实战(三)-分布式文件系统HDFS
上一篇:windows多线程同步--事件


下一篇:从硬盘安装Linux操作系统的方法步骤