DAS(Direct-attached Storage) 直连存储
直连式存储与服务器主机之间的连接通常采用 SCSI 连接 , SCSI 通道 是 IO 瓶颈 ; 服务器主机 SCSI ID 资源有限,能够建立的 SCSI 通道连接有限。
无论直连式存储还是服务器主机的扩展,从一台服务器扩展为多台服务器组成的群集 (Cluster) ,或 存储阵列 容量的扩展,都会造成业务系统的停机,
NAS(Network Attached Storage) 网络附加存储——是一个网络上的文件系统
存储设备通过标准的网络拓扑结构 ( 以太网 ) 添加到一群计算机上。应用:文档图片电影共享,云存储。 NAS 即插即用,支持多平台。
NAS 有一关键问题,即备份过程中的带宽消耗, NAS 仍使用网络进行备份和恢复。 NAS 的一个缺点是它将存储事务由并行 SCSI 连接转移到网络上,也就是说 LAN 除了必须处理正常的最终用户传输流外,还必须处理包括备份操作的存储磁盘请求。
NAS 需要服务器自己搜索它的硬盘
NAS方式路径图
SAN(Storage Area Network) 存储区域网络——是一个网络上的磁盘
通过光纤通道交换机连接存储阵列和服务器主机,最后成为一个专用存储网络。 SAN 提供了一种与现有 LAN 连接的简易方法,并且通过同一物理通道支持广泛使用的 SCSI 和 IP 协议。 SAN 允许企业独立地增加它们的存储容量。 SAN 的结构允许任何服务器连接到任何存储阵列,这样不管数据放在哪里,服务器都可以直接存取所需的数据。因为采用了光纤接口, SAN 还具有更高的带宽。
SAN方式路径图
SAN 优点:
将存储和服务器隔离,简化了存储管理,能够统一、集中的管理各种资源。
使存储更为高效。通常网络中,可能一个服务器可用空间用完了,另一个服务器还有很多可用空间。 SAN 把所有存储空间有效的汇集在一起,每个服务器都享有访问组织内部的所有存储空间的同等权利。这一方法能降低文件冗余度。
SAN 能屏蔽系统的硬件,可以同时采用不同厂商的存储设备
SAN 不足:
跨平台性能没有 NAS 好,价格偏高,搭建 SAN 比在服务器后端安装 NAS 要复杂的多。
应用:
NAS 和 SAN 混合搭配的解决方案为大多数企业带来最大的灵活性和性能优势。服务器环境越是异构化, NAS 就越是重要,因为它能无缝集成易购的服务器。而企业数据量越大,高效的 SAN 就越重要。
NAS 能简化对 SAN 的访问。事实上, NAS 是 SAN 理想的网关,能帮助 SAN 提供的数据块以文件形式路由至适当的服务器。与此同时, SAN 能通过减轻非关键数据的大容量存储负担,使 NAS 更为有效的工作。重要文件可以存储在本地的 NAS 设备上,不重要的可以卸到 SAN 中。
NAS、SAN、DAS特性对比
CPU 密集:
某种应用极其消耗 CPU 资源、其程序内部逻辑复杂而且、对磁盘访问量不高。这种程序在运行时、根本不用或少量读取磁盘上的数据只是在程序载入的时候、读入一点点程序数据而已,进程运行后便会使 CPU 的核心处于全速状态,这会造成其他进程同一时间只获得少量的执行时间、影响了性能,必要时、可以将多台机器组成集群来运行这种程序。
IO 密集:
某种程序的内部逻辑并不复杂、耗费的 CPU 资源不多,但要随时读取磁盘上的数据、比如 FTP 服务器
大块连续 IO 密集的环境: SAN
高并发随机小块 IO 或共享访问文件的环境: NAS
CPU 密集的环境: NAS
总结: DAS 存储一般应用在中小企业,与计算机采用直连方式, SAN 存储使用 FC 接口,供性能更佳的存储, NAS 存储则通过以太网添加到计算机上, SAN 和 NAS 的区别主要体现在操作系统在什么位置。
随着主机、磁盘、网络等技术的发展,数据存储的方式和架构也在一直不停改变,本文主要介绍目前主流的存储架构。
存储的分类
根据服务器类型分为:
封闭系统的存储(封闭系统主要指大型机)
开放系统的存储(开放系统指基于Windows、UNIX、Linux等操作系统的服务器)
开放系统的存储分为:内置存储和外挂存储;
外挂存储根据连接的方式分为:直连式存储(Direct-Attached Storage,简称DAS)和网络化存储(Fabric-Attached Storage,简称FAS);网络化存储根据传输协议又分为:网络接入存储(Network-Attached Storage,简称NAS)和存储区域网络(Storage Area Network,简称SAN)。看下图,可以清晰的理解刚才的描述。
常见三种存储架构 DAS、NAS、SAN比较,区别说明:
DAS存储 (直连式存储Direct-Attached Storage)
DAS存储在我们生活中是非常常见的,尤其是在中小企业应用中,DAS是最主要的应用模式,存储系统被直连到应用的服务器中,在中小企业中,许多的数据应用是必须安装在直连的DAS存储器上。
DAS存储更多的依赖服务器主机操作系统进行数据的IO读写和存储维护管理,数据备份和恢复要求占用服务器主机资源(包括CPU、系统IO等),数据流需要回流主机再到服务器连接着的磁带机(库),数据备份通常占用服务器主机资源20-30%,因此许多企业用户的日常数据备份常常在深夜或业务系统不繁忙时进行,以免影响正常业务系统的运行。直连式存储的数据量越大,备份和恢复的时间就越长,对服务器硬件的依赖性和影响就越大。
直连式存储与服务器主机之间的连接通道通常采用SCSI连接,随着服务器CPU的处理能力越来越强,存储硬盘空间越来越大,阵列的硬盘数量越来越多,SCSI通道将会成为IO瓶颈;服务器主机SCSI ID资源有限,能够建立的SCSI通道连接有限。
无论直连式存储还是服务器主机的扩展,从一台服务器扩展为多台服务器组成的群集(Cluster),或存储阵列容量的扩展,都会造成业务系统的停机,从而给企业带来经济损失,对于银行、电信、传媒等行业7×24小时服务的关键业务系统,这是不可接受的。并且直连式存储或服务器主机的升级扩展,只能由原设备厂商提供,往往受原设备厂商限制。
NAS存储 (网络接入存储Network-Attached Storage)
NAS存储也通常被称为附加存储,顾名思义,就是存储设备通过标准的网络拓扑结构(例如以太网)添加到一群计算机上。NAS是文件级的存储方法,它的重点在于帮助工作组和部门级机构解决迅速增加存储容量的需求。如今用户采用NAS较多的功能是用来文档共享、图片共享、电影共享等等,而且随着云计算的发展,一些NAS厂商也推出了云存储功能,大大方便了企业和个人用户的使用。
NAS产品是真正即插即用的产品。NAS设备一般支持多计算机平台,用户通过网络支持协议可进入相同的文档,因而NAS设备无需改造即可用于混合Unix/Windows NT局域网内,同时NAS的应用非常灵活。
但NAS又一个关键性问题,即备份过程中的带宽消耗。与将备份数据流从LAN中转移出去的存储区域网(SAN)不同,NAS仍使用网络进行备份和恢复。NAS 的一个缺点是它将存储事务由并行SCSI连接转移到了网络上。这就是说LAN除了必须处理正常的最终用户传输流外,还必须处理包括备份操作的存储磁盘请求。
SAN存储 (存储区域网络Storage Area Network)
存储区域网络,从名字上我们也可以看出,这个是通过光纤通道交换机连接存储阵列和服务器主机,最后成为一个专用的存储网络。SAN经过十多年历史的发展,已经相当成熟,成为业界的事实标准(但各个厂商的光纤交换技术不完全相同,其服务器和SAN存储有兼容性的要求)。
SAN提供了一种与现有LAN连接的简易方法,并且通过同一物理通道支持广泛使用的SCSI和IP协议。SAN不受现今主流的、基于SCSI存储结构的布局限制。特别重要的是,随着存储容量的爆炸性增长,SAN允许企业独立地增加它们的存储容量。SAN的结构允许任何服务器连接到任何存储阵列,这样不管数据置放在那里,服务器都可直接存取所需的数据。因为采用了光纤接口,SAN还具有更高的带宽。
如今的SAN解决方案通常会采取以下两种形式:光纤信道以及iSCSI或者基于IP的SAN,也就是FC SAN和IP SAN。光纤信道是SAN解决方案中大家最熟悉的类型,但是,最近一段时间以来,基于iSCSI的SAN解决方案开始大量出现在市场上,与光纤通道技术相比较而言,这种技术具有良好的性能,而且价格低廉。
SAN真正的综合了DAS和NAS两种存储解决方案的优势。例如,在一个很好的SAN解决方案实现中,你可以得到一个完全冗余的存储网络,这个存储网络具有不同寻常的扩展性,确切地说,你可以得到只有NAS存储解决方案才能得到的几百T字节的存储空间,但是你还可以得到块级数据访问功能,而这些功能只能在DAS解决方案中才能得到。对于数据访问来说,你还可以得到一个合理的速度,对于那些要求大量磁盘访问的操作来说,SAN显得具有更好的性能。利用SAN解决方案,你还可以实现存储的集中管理,从而能够充分利用那些处于空闲状态的空间。更有优势的一点是,在某些实现中,你甚至可以将服务器配置为没有内部存储空间的服务器,要求所有的系统都直接从SAN(只能在光纤通道模式下实现)引导。这也是一种即插即用技术。
SAN确实具有这些伟大的优点,那么,SAN的缺陷在哪里?SAN有两个较大的缺陷:成本和复杂性,特别是在光纤信道中这些缺陷尤其明显。使用光纤信道的情况下,合理的成本大约是1TB或者2TB大概需要五万到六万美金。从另一个角度来看,虽然新推出的基于iSCSI的SAN解决方案大约只需要两万到三万美金,但是其性能却无法和光纤信道相比较。在价格上的差别主要是由于iSCSI技术使用的是现在已经大量生产的吉比特以太网硬件,而光纤通道技术要求特定的价格昂贵的设备。
因为SAN解决方案是从基本功能剥离出存储功能,所以运行备份操作就无需考虑它们对网络总体性能的影响。SAN方案也使得管理及集中控制实现简化,特别是对于全部存储设备都集群在一起的时候。最后一点,光纤接口提供了10公里的连接长度,这使得实现物理上分离的、不在机房的存储变得非常容易。
总结:最后概括一下就是,DAS存储一般应用在中小企业,与计算机采用直连方式,NAS存储则通过以太网添加到计算机上,SAN存储则使用FC接口,提供性能更加的存储。
SAN与NAS的主要区别体现在操作系统在什么位置,如下图所示:
如今,随着移动计算时代的来临,更多的非结构化数据产生,这对NAS和SAN都是一个挑战,NAS+SAN将是未来主要的存储解决方案,也就是目前比较热门的统一存储。既然是一个集中化的磁盘阵列,那么就支持主机系统通过IP网络进行文件级别的数据访问,或通过光纤协议在SAN网络进行块级别的数据访问。同样,iSCSI亦是一种非常通用的IP协议,只是其提供块级别的数据访问。这种磁盘阵列配置多端口的存储控制器和一个管理接口,允许存储管理员按需创建存储池或空间,并将其提供给不同访问类型的主机系统。
统一存储系统:前端主机接口可支持FC 8Gb、iSCSI 1Gb和iSCSI 10Gb,后端具备SAS 6Gb硬盘扩展接口,可支持SAS、SATA硬盘及SSD固态硬盘具备极佳的扩展能力。实现FC SAN与IP SAN、各类存储介质的完美融合,有效整合用户现有存储网络架构,实现高性能SAN网络的统一部署和集中管理,以适应业务和应用变化的动态需求。主机接口及硬盘接口均采用模块化设计,更换主机接口或硬盘扩展接口,无须更换固件,可大大简化升级维护的难度和工作量。
应用场景
DAS虽然比较古老了,但是还是很适用于那些数据量不大,对磁盘访问速度要求较高的中小企业;
NAS多适用于文件服务器,用来存储非结构化数据,虽然受限于以太网的速度,但是部署灵活,成本低;
SAN则适用于大型应用或数据库系统,缺点是成本高、较复杂。
DAS、NAS、SAN存储技术的比较
什么是NAS
网络储存设备 (Network Attached Storage,NAS),是一种专门的资料储存技术的名称,它可以直接连接在电脑网络上面,对不同操作系统的使用者提供了集中式资料存取服务。
NAS和传统的档案储存服务或是直接储存设备不同的地方在于NAS设备上面的操作系统和软件只提供了资料储存、资料存取、以及相关的管理功能;此外,NAS设备也提供了不止一种档案传输协定。NAS系统通常有一个以上的硬盘,而且和传统的档案服务器一样,通常会把它们组成RAID来提供服务;有了NAS以后,网络上的其他服务器就可以不必再兼任档案服务器的功能。NAS的型式很多样化,可以是一个大量生产的嵌入式设备,也可以在一般的电脑上执行NAS的软件。
NAS用的是以档案为单位的通讯协定,例如像是NFS(在UNIX系统上很常见)或是SMB(常用在Windows系统)。NAS所用的是以档案为单位的通讯协定,相对之下,储域网络(SAN)用的则是以区块为单位的通讯协定、通常是透过SCSI再转为光纤通道或是iSCSI。
NAS设备用的通常是精简版的操作系统,只提供了最单纯的档案服务和其相关的通讯协定;举例来说,有一个叫FreeNAS的开放源码NAS软件用的就是精简版的FreeBSD,它可以在一般的电脑硬件上执行,而商业化的嵌入式设备用的则是封闭源码的操作系统和通讯协定程式。
简单来说NAS就是一台在网络上提供文档共享服务的的网络存储服务器。
NAS的网络结构
NAS存储使用以太网接口直接接入现有以太网网络实现数据的共享。部署灵活,不会对现有网络结构产生变化。
NAS存储的优缺点
NAS的优点:
NAS设备一般支持多计算机平台,用户通过网络支持协议可进入相同的文档,因而NAS设备无需改造即可用于混合Unix/Windows NT局域网内。
其次,NAS设备的物理位置同样是灵活的。它们可放置在工作组内,靠近数据中心的应用服务器,或者也可放在其他地点,通过物理链路与网络连接起来。无需应用服务器的干预,NAS设备允许用户在网络上存取数据,这样既可减小CPU的开销,也能显著改善网络的性能。
对现有网络环境有很好的适应性。NAS设备对企业网络环境基本上没有什么特别的要求和限制,可以很方便的在现有的网络环境中添加NAS设备。这是因为NAS所支持的那些操作系统和网络协议都是已在网络中得到很好的支持,NAS设备的添加不会引发新的网络支持的问题。
高可扩展性。NAS设备的高扩展性很好的满足了企业日益增长的存储需求。NAS的扩展只需通过添加一个节点及网络设备即可(做到真正的即插即用,并且部署位置非常灵活),基本上启动NAS设备,运行相应的网络文件系统,并将这个NAS设备接入网络环境就完成添加了。
NAS集群技术通过一组NAS设备集合来形成如同一个NAS设备,NAS集群技术提供了一定的存储分流,使得不同的NAS设备可以同时工作来满足网络存储的存储需求,从而提高了NAS系统的整体性能,并解决了多个NAS系统的扩展性和管理趋于复杂性的问题。
易管理性。NAS本身就是为了企业内部网络而设计,实现了异构平台下的数据共享,因此NAS的使用和维护成本就相对很低,管理和维护工作也相对简单。用户只需一些简单的初期设置和管理,NAS设备就可以很好的运行起来。
基于网络服务的丰富应用
NAS存储是基于TCP/IP协议的一台网络文件服务器,因此除了提供基本的NFS、SMB等网络共享服务之外还可以根据不同的NAS存储设备提供一些高级的网络应用,如下图威联通NAS所示
在一台NAS设备上同时提供文件共享服务,FTP服务,web服务,日志服务器、打印服务器及备份服务器等基于TCP/IP协议的网络服务。例如在监控存储部署方面具有较大优势。
NAS相对于DAS部署灵活,支持多用户共享使用。
NAS相对于SAN部署成本非常低。
NAS的缺点
NAS没有解决与文件服务器相关的一个关键性问题,即使用过程中的带宽消耗。与将数据流从LAN中转移出去的存储区域网(SAN)不同,NAS仍使用网络进行备份和恢复。NAS 的一个缺点是它将存储事务由并行SCSI连接转移到了网络上。这就是说LAN除了必须处理正常的最终用户传输流外,还必须处理包括备份操作的存储磁盘请求。
存储性能的局限。NAS只适合应用在较小的网络或者局域网内。因为NAS受限于企业网络的带宽,很可能会出现当多台客户端访问NAS文件系统时,NAS的性能大大的下降,最终不能满足用户的需求。
可靠性还有待提高。当企业内部网络发展到一定的规模时,NAS设备的数据服务和数据管理形成了网络的双重负担,也就是说NAS除了要处理正常的终端数据I/O请求外,还需要做备份和恢复等操作。并且NAS后期的扩容成本高;一般的NAS没有高可用配置,容易形成单点故障。
NAS和简单PC服务器的区别
价格优势:
省去了键盘,鼠标,显示器等外部设备,从而大大节约了经费开销,按照平均存储价格来说NAS单位存储对应的价格要远远低于服务器,而且他采用了RAID 5级别的数据保护技术,从而让数据存储更加放心更加安全。
稳定性优势:
功能单纯并且移除了许多不必要的连接器、控制晶片、电子回路,如键盘、鼠标、VGA等;所以架构上相比常见计算机有了简化。
管理优势
NAS设备用的通常是精简版的操作系统,只提供了最单纯的档案服务和其相关的通讯协定,并且针对NAS的服务提供了简便灵活的管理软件。例如web管理,客户端管理等方式。
DAS、NAS和SAN的比较
DAS:直接附加存储
DAS(Direct Attached Storage—直接附加存储)是指将存储设备通过SCSI接口或光纤通道直接连接到一台计算机上。DAS的适用环境为:
1)服务器在地理分布上很分散,通过SAN或NAS在它们之间进行互连非常困难时。
2)存储系统必须被直接连接到应用服务器(如Microsoft Cluster Server或某些数据库使用的“原始分区”)上时;
3)只有单台服务器,存储设备无需与其他服务器共享。
SAN:存储区域网络
先看下下图的SAN存储的网络拓扑图
SAN存储通过光纤交换机将磁盘空间分配给不同的服务器,服务器通过以太网对外提供服务,存储区域与用户的应用区域隔离。
SAN(存储区域网络)通过光纤通道连接到一群计算机上。在该网络中提供了多主机连接,但并非通过标准的网络拓扑。
高带宽:SAN的结构允许任何服务器连接到任何存储阵列,这样不管数据置放在那里,服务器都可直接存取所需的数据。因为采用了光纤接口,SAN还具有更高的带宽。
独立的存储网络:因为SAN解决方案是从基本功能剥离出存储功能,所以运行备份操作就无需考虑它们对网络总体性能的影响。
管理便捷:SAN方案也使得管理及集中控制实现简化,特别是对于全部存储设备都集群在一起的时候。
远距离部署:光纤接口提供了50公里的连接长度,这使得实现物理上分离的、不在机房的存储变得非常容易。
SAN主要用于存储量大的工作环境,如ISP、银行等,最大的缺点就是成本高。
总结
根据DAS、NAS、SAN的不同特性,DAS及SAN是基于存储空间的磁盘分配,是基于硬件层面的存储方式,而NAS则是基于应用层面的存储方式,可以根据应用环境来对其进行总结。
DAS多采用SCSI或SAS接口,由于部署节点的单一性及较高的性能,适用于单一节点的企业级应用,或者地理位置比较分散的服务器使用。DAS由于部署的局限性目前使用量越来越少。
NAS利用现有以太网网络,因此部署灵活,部署的成本非常低,基于TCP/IP协议的特性可以提供丰富的网络服务,基于文件的形式提供数据的存储及备份,但是TCP/IP协议决定了数据传输的数据打包及解包会占用系统资源,另外传输速率受限于以太网的速率,因此不适用于企业级应用,通常部署于部门级应用。
SAN存储使用光纤网络进行传输,并且独立于应用网络,可以提供非常高的带宽,数据的传输基于块协议,无需对数据进行处理,直接进行传送,因此性能最好,另外光纤线路可以提供远距离的高带宽链路,可以实现数据中心的异地灾备应用,但是部署成本较高。因此SAN存储多应用于企业级的存储部署中。
随着技术的发展,以iSCSI技术的IP SAN技术使NAS存储抢占了一部分SAN存储的市场份额,另外随着10Gb以太网技术的