自从Windows server 2012开始,微软在系统层面提供了重复数据删除功能。重复数据删除是为了文件服务器、虚拟化服务器等设计的。其实只要是存放的文件有大部分内容是相同的就可以发挥很好的效果。前不久装的WSUS服务器,已经使用了3.5T的存储空间了,按这个速度,过不了几个月就会耗尽空间的。因为目前的补丁都是累积更新,即使你一年不打补丁,也只需要安装最新的就可以了。所以这些补丁中肯定有大量数据都是重复的,应该能节省不少空间。
https://www.cnblogs.com/qishine/p/12801699.html
重复数据删除Data Deduplication是属于文件和存储服务下的一个角色服务,系统默认不安装,需要手动安装。安装之后可以在服务器管理器的界面中方便的配置。选中磁盘后,可以选择数据删重的使用场景,包括文件服务器、桌面虚拟化VDI服务器和虚拟化服务器。这些场景中都是有大量文件是重复的情况。因为Windows 重复数据删除不是比对每个文件是否相同,而是把文件分块,比较每个存储块是否相同。如果有相同的就只保留一份,其余做成链接删除数据。至于磁盘格式化的时候选用多大的块block,需要和具体应用相匹配以达到较好的效果。
配置的时候可以选择新的文件经过几天以后才开始删重,以及删除的具体时间和任务进行时间。第一次任务会消耗比较多的时间和系统资源。任务开始后可以使用powershell命令查看状态。可以看到任务进行的百分比和节省的空间。
Get-DedupJob -Volume d:
Get-DedupStatus -Volume d:
任务运行的时候还是非常消耗内存的。fsdmhost.exe会消耗大量的系统资源。所以建议在非工作时间来进行。
当任务完成后,可以看到文件占用的空间变成0了。对于WSUS的数据大概可以节约40%的空间。
更多规划和使用信息细节可以参考微软的文章。Plan to Deploy Data Deduplication
https://docs.microsoft.com/en-us/previous-versions/windows/it-pro/windows-server-2012-R2-and-2012/hh831700(v=ws.11)?redirectedfrom=MSDN
相关文章
- 10-13双字段重复的数据,如何使用sql删除一个
- 10-13sql 删除表中某字段的重复数据
- 10-13数据结构链表——删除值重复的结点
- 10-13CodeForces-920E Connected Components? 广度搜索 判断联通 大量数据下重复点的删除
- 10-13Springcloud学习笔记35--文件存储信息删除和批量功能(delete方式提交,接收map形式的数据,使用@RequestBody 接收)
- 10-13leetcode 删除一张表中重复邮箱的数据,并且保留最小id 的 那条
- 10-13集合差集 哈希表 比较数据库中的图片和服务器上的图片,将服务器上的垃圾图片删除
- 10-13SQL:一句话删除重复的数据
- 10-13[数据恢复答疑]删除了WINDOWS桌面上的文件,该如何恢复数据
- 10-13LeetCode_数据结构入门_删除排序链表中的重复元素