fastDFS原理及环境搭建

1. fastDSF介绍

FastDFS是用c语言编写的一款开源的分布式文件系统,它是由淘宝资深架构师余庆编写并开源。FastDFS专为互联网量身定制,充分考虑了冗余备份、负载均衡、线性扩容等机制,并注重高可用、高性能等指标,使用FastDFS很容易搭建一套高性能的文件服务器集群提供文件上传、下载等服务。

​ 为什么要使用fastDFS呢?

​ 上边介绍的NFS、GFS都是通用的分布式文件系统,通用的分布式文件系统的优点的是开发体验好,但是系统复杂性高、性能一般,而专用的分布式文件系统虽然开发体验性差,但是系统复杂性低并且性能高。fastDFS非常适合存储图片等那些小文件,fastDFS不对文件进行分块,所以它就没有分块合并的开销,fastDFS网络通信采用socket,通信速度很快。

2. fastDSF工作原理

2.1 fastDSF架构

FastDFS架构包括 Tracker server和Storageserver。客户端请求Tracker server进行文件上传、下载,通过Tracker server调度最终由Storage server完成文件上传和下载。

如下图:

fastDFS原理及环境搭建

1)Tracker

​ Tracker Server作用是负载均衡和调度,通过Tracker server在文件上传时可以根据一些策略找到Storage server提供文件上传服务。可以将tracker称为追踪服务器或调度服务器。

​ FastDFS集群中的Tracker server可以有多台,Tracker server之间是相互平等关系同时提供服务,Tracker server不存在单点故障。客户端请求Tracker server采用轮询方式,如果请求的tracker无法提供服务则换另一个tracker。

2)Storage

​ Storage Server作用是文件存储,客户端上传的文件最终存储在Storage服务器上,Storage server没有实现自己的文件系统而是使用操作系统的文件系统来管理文件。可以将storage称为存储服务器。

​ Storage集群采用了分组存储方式。storage集群由一个或多个组构成,集群存储总容量为集群中所有组的存储容量之和。一个组由一台或多台存储服务器组成,组内的Storage server之间是平等关系,不同组的Storage server之间不会相互通信,同组内的Storage server之间会相互连接进行文件同步,从而保证同组内每个storage上的文件完全一致的。一个组的存储容量为该组内的存储服务器容量最小的那个,由此可见组内存储服务器的软硬件配置最好是一致的。

​ 采用分组存储方式的好处是灵活、可控性较强。比如上传文件时,可以由客户端直接指定上传到的组也可以由tracker进行调度选择。一个分组的存储服务器访问压力较大时,可以在该组增加存储服务器来扩充服务能力(纵向扩容)。当系统容量不足时,可以增加组来扩充存储容量(横向扩容)。

3)Storage状态收集

​ Storage server会连接集群中所有的Tracker server,定时向他们报告自己的状态,包括磁盘剩余空间、文件同步状况、文件上传下载次数等统计信息。

2.2 文件上传流程

fastDFS原理及环境搭建

​ 客户端上传文件后存储服务器文件ID返回给客户端,此文件ID用于以后访问该文件的索引信息。文件索引信息包括:组名,虚拟磁盘路径,数据两级目录,文件名。

fastDFS原理及环境搭建

  • 组名:文件上传后所在的storage组名称,在文件上传成功后有storage服务器返回,需要客户端自行保存。
  • 虚拟磁盘路径:storage配置的虚拟路径,与磁盘选项store_path*对应。如果配置了store_path0则是M00,如果配置了store_path1则是M01,以此类推。
  • 数据两级目录:storage服务器在每个虚拟磁盘路径下创建的两级目录,用于存储数据文件。
  • 文件名:与文件上传时不同。是由存储服务器根据特定信息生成,文件名包含:源存储服务器IP地址、文件创建时间戳、文件大小、随机数和文件拓展名等信息。

2.3 文件下载流程

fastDFS原理及环境搭建

tracker根据请求的文件路径即文件ID 来快速定义文件。

比如请求下边的文件:

fastDFS原理及环境搭建

1.通过组名tracker能够很快的定位到客户端需要访问的存储服务器组是group1,并选择合适的存储服务器提供客户端访问。

2.存储服务器根据“文件存储虚拟磁盘路径”和“数据文件两级目录”可以很快定位到文件所在目录,并根据文件名找到客户端需要访问的文件。


3.fastDFS安装

​ 如果想自己尝试安装fastDSF也可以按照文档一步一步安装。

​ tracker和storage使用相同的安装包,fastDFS的下载地址在:https://github.com/happyfish100/FastDFS

本教程下载安装包:FastDFS_v5.05.tar.gz

FastDFS是C语言开发,建议在linux上运行,本教程使用CentOS7作为安装环境。

安装细节请参考 “fastDFS安装教程.doc”。

3.1 Tracker配置

本小节介绍Tracker的配置文件内容。

fastDFS的配置文件目录 :/etc/fdfs

主要的配置文件:/etc/fdfs/tracker.conf (tracker配置文件 );storage.conf(storage配置文件)

fastDFS原理及环境搭建

tracker.conf配置内容如下:

端口:port=22122

存储策略:store_lookup=

​ 取值范围:0(轮询向storage存储文件)、1(指定具体的group)、2负载均衡,选择空闲的storage存储

指定具体的group:store_group= 如果store_lookup设置为1则这里必须指定一个具体的group。

tracker 基础目录:base_path=/home/fastdfs,tracker在运行时会向此目录存储storage的管理数据。

3.2 storage配置

本小节介绍storage的配置文件内容。

storage.conf配置 内容如下:

组名:group_name=group1

端口:port=23000

向tracker心跳间隔(秒):heart_beat_interval=30

storage基础目录:base_path=/home/fastdfs

磁盘存储目录,可定义多个store_path:

store_path0=/home/fastdfs/fdfs_storage 此目录下存储上传的文件,在/home/fastdfs/fdfs_storage/data下

store_path1=...

...

上报tracker的地址:tracker_server=192.168.101.64:22122

如果有多个tracker则配置多个tracker,比如:

tracker_server=192.168.101.64:22122

tracker_server=192.168.101.65:22122

....

3.3 启动停止

fastDFS启动/停止脚本目录:

fastDFS原理及环境搭建

fdfs_trackerd:tracker脚本,通过此脚本对 tracker进行启动和停止

/usr/bin/fdfs_trackerd /etc/fdfs/tracker.conf restart

fdfs_storaged:storage脚本,通过此脚本对 storage进行启动和停止

/usr/bin/fdfs_storaged /etc/fdfs/storage.conf restart

上一篇:java – 如何在Android上播放跟踪器模块?


下一篇:分布式文件上传-FastDFS