备份系统建设中的四个误区和六个错误

1、企业在建设备份恢复系统的过程中,可能有哪些误区?

主要认识误区有以下几个方面:

1)用双机、阵列复制等系统冗余替代数据备份

双机双柜可实现服务器和存储的高可用性,保障业务持续运行,但绝不能替代备份,因为双机双柜能解决数据的物理错误,例如:服务器或存储故障,但解决不了数据的逻辑错误,例如:病毒,人为误删除数据(rm –f )等。

2)写脚本备份数据库代替数据备份软件

1个2个数据库还能操作过来,假如有100个数据库呢?除了数据库,其他的都要写脚本吗(除非是要开发个备份软件)?非常不建议这样操作,因为这样做问题太多了,如果有条件,就不要再人为写脚本备份了,不久前我碰到一个内部同行,一直用脚本备份的Oracle数据库,等恢复的时候发现每天备份的都是0KB,这才开会讨论脚本备份的没有数据验证功能。需要一套专业的备份软件来做这件事情,否则可能灾难重现。

3)操作系统不用备份

有人说,系统备份什么?坏了就重装呗,数据不丢就行,首先大家应该都用过Ghost软件,容易不?太容易了!其实Unix,Linux,Windows等系统备份恢复如果学会使用不比Ghost难多少,光盘启动,找到想恢复的时间点,分分钟系统就恢复到备份时的状态,但我们想一想,如果没有系统备份工具,我们要重装系统,然后找驱动,安装软件,系统优化,测试,这要多久,一个资深的运维技术6个小时你敢承诺系统能上线吗?我想没有人敢保证,我曾经看过一个工程师为了一个网卡驱动(非常老的服务器)花了一上午的时间。而且有的时候当时部署系统的工程师已经不在了,系统装上了,应用没人会装。想想现在我们的技术人员是不是大半夜的还有在机房维护操作系统的?运维人员忙的要死,天天救火,但技术又没什么长进,想想时间都去哪了。

4)想用CDP代替备份

不论是True CDP还是 CDP(就是业内说的真假CDP)都代替不了备份。我们都知道备份都是放在系统空闲时做,除了游戏企业外其他大多数企业都会选择在夜里备份,因为备份会占用大量系统资源,系统繁忙的时候是不可以备份的,(除非你想让用户骂)。CDP顾名思义持续数据保护,不论真假CDP, 24小时不间断对系统IO读取,对系统的性能影响可想而知,CDP通常嵌入数据中心关键业务应用的I/O路径中,是一个I/O聚散点,其任何不稳定都可能导致关键业务停顿。所以CDP只能用在部分业务上,增强备份软件RPO的指标参数,而不是替代备份软件,不会有企业傻到所有业务都采用CDP保护,而且CDP一定要测试后方能使用,如果遇到产品问题或兼容性问题,你的业务系统可能宕机。


2、企业在搭建备份系统中,可能犯哪些错误?如何避免和解决?

以下内容以分享者所在行业——铁路企业为例,供其他行业参考:

1)多数铁路企业没有考虑到操作系统备份, 本来可以再10分钟就恢复到系统备份时的状态,如果没有系统备份,可能恢复一个系统需要几天的时间.所以企业需要考虑所有重要操作系统的备份.

2)没有培养和配备专业的备份人员,导致备份作业失败率高,问题处理速度缓慢,尤其出现灾难故障的时候不知道如何应对,缺乏专业知识的交流渠道。企业应该加强对备份管理员的重视,给与足够的培训机会,不断提升备份管理员的技术水平.

3)备份项目跟着工程走,每个工程可能会配一套备份系统,形成不同厂家的多种备份系统,很难集中管理,维护繁琐,每天巡检都会大量浪费人力资源。企业需要尽量整合资源,集中管理.

4)系统越来越多,环境越来越复杂,备份时间窗口越来越紧张。采用技术领先、产品兼容性好、技术支持完善的备份厂商产品。

5)很多工程的备份系统使用的是备份软件+VTL,这种情况,当VTL空间满了以后,过期的数据不能自动释放空间,需要人为手动操做,否则所有备份由于没有备份空间而失败,往往备份软件和VTL又是不同厂商,增加了维护难度。采用磁盘阵列或者备份一体化设备作为备份的载体。

6)没有容灾演练平台,都是哪个坏了就恢复哪个,恢复会存在很多不确定性,导致恢复时间长,或者不能恢复。需要在企业搭建自己的容灾演练平台。


3、建设备份系统过程中,可能遇到过哪些技术难点?

1)备份环境越来越复杂,企业中包含各种类型操作系统,各种类型数据库,以及物理环境,虚拟化环境,云环境,缺乏集中、统一的备份管理平台,导致系统管理和维护复杂度增加,管理和维护成本上升;

2)现有物理系统缺乏统一的主机灾难快速恢复解决方案,UNIX、Linux、Windows等各个业务系统的主机灾难恢复主要依靠管理人员手工操作,不同操作系统平台采用完全不同的恢复方案,管理和维护复杂度高,而且效率低下;

3)存储空间问题:相应备份数据如果采用普通存放模式则需要耗费大量的存储空间。因此,如何能将这些数据高效安全的存放也是企业备份面临的的一个问题。

4)备份时间窗口问题,已经很难在一个晚上将所有数据做一次完整的备份。

5)单台服务器故障其影响可能会扩散到其他生产服务器:生产服务器同时管理备份设备,由于需要在SAN中与其他生产服务器共享设备,结果可能会导致关联其他服务器也要做配置变更管理

6)可靠性问题:涉及到备份数据的安全问题。因此,整个系统的可靠性尤为重要,备份经常失败会给企业管理人员造成过大的维护工作量。

7)缺乏必要的校验和恢复演习,面临灾难,手足无措,备份的目的就是可以把丢失的数据恢复到生产的状态,但备份的可靠性并不能够保证备份了的数据就一定可以百分百恢复出来。因此,需要进行定期的数据恢复测试确保备份介质的可用性。

8)缺乏专业的技术人员进行备份管理系统的维护,导致备份作业经常出现失败,也找不到很好的故障解决办法。


4、企业在建设备份系统中,有哪些备份路线可供选择?

可以分别采用4种备份方式:

1)LAN备份

基于局域网(LAN)的备份,服务器将局域网内不同主机的数据通过局域网备份到共享的磁带库中。这种集中备份管理架构,提高了磁带库的利用率,但是数据主要在局域网上传输,增大了网络传输压力。

2)SAN 备份

基于SAN的备份,需要备份的应用服务器通过SAN连接到备份介质上,应用服务器在备份软件的控制下,将数据通过SAN备份到备份介质上。这种架构将大量数据传输从LAN转移到SAN上,减小了网络传输压力,资源也得到了共享,但是备份时仍要耗费备份主机的CPU和内存资源,同时也占用光纤交换机端口。

3)Server-Free备份

也是一种基于SAN的备份,无须在服务器上缓存而直接从在线存储设备向备份介质拷贝数据。这种备份架构使用SCSI远程拷贝命令,允许服务器向一个设备(如磁盘)发送命令,指示它直接向另一个设备(如磁带)传输数据而不需要通过服务器内存。

4)SAN-Client备份

新一代的SAN备份技术,它可以帮助我们无需模拟磁带库的协议而实现光纤网络的 LAN-Free 备份,业务平台无需再承担安装备份设备驱动所带来的风险,同时避免了业务拓展造成的传统备份架构设备仲裁的问题。


5、如何根据企业自身情况选择合适的备份技术路线?

1)LAN备份

备份数据量非常少的应用主机建议使用基于LAN的备份。

2)SAN 备份

数据量比较大、备份频度比较高的应用系统应该采用SAN备份。

3)Server-Free备份

对于海量的数据库系统备份可以采用Server-Free的方式进行备份,即通过在生产服务器上触发磁盘阵列的快照,然后由另外的主机将快照加载并备份。

4)SAN-Client备份

所有采用SAN备份的客户端都适用于SAN-client备份.

企业在选择自家的备份方案的时候,要根据自身的实际情况来定。不但要满足当前的备份需求,还要满足未来一段时间内的扩展。


上一篇:备份系统建设中的四个误区和六个错误


下一篇:详谈持续数据保护(CDP)和数据副本管理(CDM)技术