出处:http://blog.csdn.net/sun_app/article/details/18263299
1、dd命令详解
1)中文man手册dd的解释
NAME dd - 转换和拷贝文件
摘要使用方法:
dd [--help] [--version] [if=file] [of=file] [ibs=bytes] [obs=bytes] [bs=bytes] [cbs=bytes] [skip=blocks] [seek=blocks] [count=blocks]
[conv={ascii, ebcdic, ibm, block, unblock, lcase, ucase, swab, noerror, notrunc, sync}]
命令描述
当进行非强制的转换的时候,使用指定的输入和输出块大小拷贝文件 (默认是从标准输入到标准输出。)
它每次从输入读取指定大小的一个块(默认是512字节)。
如果使用 bs=bytes 选项,并且没有转换,除了指定 sync,noerror,或 notrunc之外,那么dd将把全部读到的数据(可以比请求读的少)写到独立的输出块去。这个输出块的长度和读到的数据完全一样,除非指定使用sync(同步)转换,那样的话,数据结尾处将追加NULL字符(或空格,见下)。
其他情况下,输入的时候每次读一个块,然后处理,并将输出结果收集起来,最后写到指定大小的数据块中去。最终的输出块可能会比指定的大小短一些。
数字值选项(以字节或块为单位)后面可以跟一个乘数:
k=1024,b=512,w=2,c=1(w和c是GNU扩展语法。最好别使用w,因为在system V中,它表示2,在4.2 BSD中,它 表示4)。两个或更多的数值表达式可以通过“x”乘起来。
GEU fileutils 4.0并且允许在数据块大小的叙述中使用
下列乘法后缀(用bs=,cbs=,obs=):M=1048576,G=1073741824,
同理可得T,P,E,Z,Y。D后缀表示数值是以 十进制表示的:kD=1000 MD=1000000 GD=1000000000等等。
(注意,在ls、df、du命令中,M等标记的大小是由环境变量确定的,而在DD中,它的值是固定的。)
选项
if=file: 从 file 中读而不是标准输入。
of=file: 写到 file 里去而不是标准输出。除非指定conv=notrunc ,否则, dd 将把 file截为O字节(或由 seek= 选项指定的大小)
ibs=bytes: 一次读 bytes 字节。默认是512。
obs=bytes:一次写 bytes 字节。默认是512。
bs=bytes:一次读和写 bytes 字节。这将覆盖 ibs 和 obs设定的值(并且,设定 bs 不等于同时将 ibs 和obs 设为同一个值,至少在 只使用 sync, noerror 或notrunc转换时是这样的。因为bs规定,每个输入块都应作为单独的数据块拷贝到输出,而不把较短的块组合到一起)。
cbs=bytes: 为block 转换和unblock转换指定转换块的大小。
skip=blocks在拷贝之前,跳过输入文件的前blocks块,每块大小为 ibs-byte 字节。
seek=blocks 在拷贝之前,跳过输出文件的前blocks块,每块大小为 obs-byte 字节。
count=blocks 只拷贝输入文件的前 blocks 块(每块的大小为ibs-byte字节),而不是全部内容,直到文件末尾。
conv=转换"[,"转换"]..." 将文件按 转换参数指定的方式转换(在“,”两边没有空格)
转换方式包括:
ascii 将EBCDIC转换成ascii。
ebcdic 将ascii转换成ebcdic。
ibm 将ascii转换成alternative ebcdic。
block 每一行输入,无论长短,输出都是 cbs 字节,并且其中的“换行”(NEWLINE,即c中的'0)用空格替换。如有必要,行尾会填充空格。
unblock 用“换行”替换每个输入块(cbs 字节大小)末尾的空格。
lcase 将大写字母转换成小写。
ucase 将小写字母转换成大写。
swab 交换每对输入字节。如果读入的字节数是奇数,最后一个字节只是简单的复制到输出(因为没有能跟它交换的 字节了)(POSIX1003.26,PASC翻译1003.2 3号和4号)。
noerror 发生读错误时,继续进行。
notrunc 不截断输出文件。
sync 用0填充到每个输入块的末尾,使其大小为ibs 字节。
GNU标准选项
--help 将用法信息打印到标准输出,并成功退出。
--version 将版本信息打印到标准输出,并成功退出。
-- 结束选项列表。
环境变量
LANG, LC_ALL, LC_CTYPE和LC_MESSAGES具有其通常含义。
遵循标准
POSIX 1003.2
举例
磁带机通常不能接受任意大小的数据块,当最后一个数据片段不能充满整个块时,dd将出现I/O错误。用'dd if=myfile of=/dev/mytape conv=sync', 就可以使全部内容存到磁带上。当然,这样做,把文件从磁带上读回时回产生一个稍大些的文件,因为其尾部填充了一些NUL(空字符)。
注
本手册页描述了fileutils-4.0软件包中的 dd
命令。其他版本的dd会与此稍有不同。有关更正和补充可以发帖到中国Linux 论坛-man手册版。报告程序中的错误,请给fileutils-bugs2gnu.ai.wit.edu 发邮件
2、cp命令详解
cp命令中文man手册
NAME cp - 复制文件和目录
总览
cp [选项] 文件路径
cp [选项] 文件...目录
POSIX 选项: [-fipRr]
GNU 参数(最短形式): [-abdfilprsuvxPR] [-S
SUFFIX] [-V {numbered,existing,simple}] [--sparse=WHEN] [--help]
[--version] [--]描述
cp 复制文件(或者目录等). 可以使用这个命令复制一个文件到一个指定的目的地,或者复制任意多个文件到一个目的目录目录.
如果所给的参数只有两个文件名.它把前一个文件复制到后一个文件上.
如果最后一个命令参数为一个已经存在的目录名,cp会将每一个源文件复制到那个目录下(维持原文件名).
如果最后一个参数不是文件名,目录名,和给出多于两个非选项参数,是错误的.
(因而:如果/b已经存在,那么'cp -r /a /b'会复制/a到/b而成为/b/a.而复制/a/x到/b而成为/b/a/x。
但如果/b事先不存在,它会把/a复制为/b而复制/a/x到/b而成为/b/x.)
所创建的文件和/或目录的模式和原始的文件的模式是一样的,然后用用户umask值修改(除非使用了-p选项),(但在递归方式复制目录时,新建目录会临时地获得他们的最终模式Ored,连同S_IRWXU(0700),以便进程能够读、写、查找这些新建的目录.
复制文件到其自身时它什么事情都不做(除了可能会生成一条错误信息以外).复制到一个现存的不同文件时,系统调用函数`open(path,O_WRONLY|O_TRUNC)'打开目的文件.当复制到一个新文件时,系统调用函数`open(path,O_WRONLY|O_CREAT,mode)'创建该文件.如果这操作失败,该文件存在,和给出了-f选项,cp试图先删除该现存文件,如果删除成功则把它当做一个新文件处理.
POSIX 选项
POSIX 识别四个半选项:
-f 如果需要,删除已存在的目的文件.(如前所述.)
-i 提示是否覆盖现有普通目标文件。(在标准出错上显示问题,从标准输入读取答案.只有明确确认了才复制文件.)
-p 保留原文件的所有者、组、权限(包括 setuid 和 setgid 位),上次修改时间和上次访问时间。如果制作所有者或组信息的副本时出错,则setuid和setgid位被清空。
(要不然源文件和副本的上次访问时间显然是不同的,因为复制操作就是对源文件的访问.)
-R 递归复制目录,如果对象不是普通文件或目录那么做相应正确处理,(因此,一个FIFO或者特殊文件在复制后仍然是一个FIFO型或者相应特殊文件。)
-r 递归复制目录,如果对象不是普通文件或目录那么做一些未声明处理.(因此,我们允许并鼓励用 -r 选项做 -R 的同义词.不过那些愚蠢的特征,象那些在GNU版本的 cp 出现的(见下文)也可以用.)
GNU 细节
通常,读写文件的方式都是一样的.例外情况见下面的 --sparse 选项.
缺省情况下,`cp'并不复制目录(参见下文 -r 选项说明).
cp 通常不会复制文件到自身,但有以下例外: 如果参数 --force --backup 与
源文件一起给出,并且与目的文件并且指向一个普通文件,cp
将生成一个备份文件,不是普通的就是编了号的,就象通常的方法那样声明.在你仅仅想对已有的文件进行备份, 而又不想修改它的时候很有用.GNU 选项
-a, --archive
复制时,尽可能保持文件的结构和属性.(但不保持目录 结构)等同于 -dpR。
-d, --no-dereference
复制符号链接作为符号链接而不是复制它指向的文件,
并且保护在副本中原文件之间的硬链接.
-f, --force
删除存在的目标文件。 (较:原译文缺下面的部分)
-i, --interactive
无论是否覆盖现存文件都作提示。
-l, --link
制作硬链接代替非目录拷贝。
-p, --preserve
保持原始文件的所有者,组,许可,和时间表属性。
-P, --parents
一个斜杠和指定的源文件名构成目的文件。最后送给cp 的参数必须是一个已存在的目录的名字。
例如, 下面这个命令:
cp --parents a/b/c existing_dir 复制文件 `a/b/c' 到 texisting_dir(现有的目录)/a/b/c',建立任何缺少的中间目录。
-r
递归地复制目录,复制任何非目录和非符号链接(那是,FIFOs和特别文件)好象他们是常规的文件一样看待.这意味着尝试读出每个源文件的数据,和把它写到目的地上.因而,用这个选项,cp'可能彻底地终止,当不确定地读一个FIFO或者/dev/tty时,(这是一个缺陷.它意味着如果你不知道在这棵树(目录)中有什么要复制的时候,你不得不避开-r并使用-R打开一个未知的设备文件,比如说一台扫描仪,会有未知的效果发生在硬件上)-R, --recursive
递归地复制目录,保留非目录(参见上面的 -r ).
--sparse=WHEN
一个稀疏file'包容`holes'-占用0字节,它不占用任何物理块;系统把他们作为0调用read'来读.由于许多二进制文件包容许多连续的0字节,这样能保存相当的磁盘空间并且加快速度.省缺情况下,cp通过自然的启发方式发现在源文件里holes并且使相关
的输出文件稀疏.WHEN 值能够是下面中的一个:
auto 默认的行为:如果输入文件是稀疏的,输出文件也是稀疏的.
always 总是使输出文件稀疏.当输入文件所在的文件系统不支 持稀疏文件的时候,这是有用的,但是输出文件所在的文件系统需要(支持稀疏文件).
never 从不使输出文件稀疏.如果你找到一个需要此选项的应用程序,让我们知道.
-s, --symbolic-link
生成符号链接代替非目录拷贝.所有的源文件名必须是绝对的(由`/'开始),除非目的文件是在当前目录.这选项仅仅在系统不支持符号链接时引起一个错误消息.
-u, --update
如果存在的目的地有相同的,或者更新的修改时间,不 复制非目录(文件).
-v, --verbose
在复制前印出文件名.
-x, --one-file-system
跳过来自不同文件系统的子目录.
GNU 备份选项
GNU 版本程序象 cp, mv, ln, install
和patch会在覆盖,改变,或者破坏(文件)前生成一个备份文件.
那个文件由-b选项给出.他们的由-V选项命名.一般情况下备份文件名是源文件名加上后缀,这个后缀由-S 指定.-b, --backup 生成关于覆盖和删除的备份.
-S SUFFIX, --suffix=SUFFIX 加入 SUFFIX(后缀) 到每个备份文件. 如果不指定,使用
SIMPLE_BACKUP_SUFFIX 环境变量的值.如果连 SIMPLE_BACKUP_SUFFIX 都没有设置,省缺是`~'.-V METHOD, --version-control=METHOD
指定如何命名备份文件. METHOD 能够是`numbered' (or `t'), `existing'
(or `nil'), or `never' (or `simple'). 如果不指定,使用 VERSION_CONTROL
环境变量的值.如果VERSION_CONTROL 也没有设置,省缺备份文件类型是`existing'. 这选项相应Emacs变量 `version-control'. 有效的METHODs 是(接受唯一的缩写):t, numbered 总是产生编号的备份。
nil, existing
Make numbered backups of files that already have them, simple
backups of the others.
never, simple
总作简单的备份.
GNU 标准选项
--help 印出用法并退出.
--version 印出版本信息并退出.
-- 结束选项列表.
环境(参数)
变量LANG,LC_ALL,LC_COLLATE,LC_CTYPE和LC_MESSAGES有通常意义.
对于GNU版本,变量SIMPLE_BACKUP_SUFFIX和VERSION_CONTROL控制备份
文件命名.与上面的描述一样.
适用到 POSIX 1003.2
注意 这份 cp 的描述和FILEUTils-4.0中找到的是一样的;另外的版本也许有些微的差别.修正和新增邮到aeb@cwi.nl.报告缺陷到fileutils-
bugs@gnu.ai.mit.edu.
3、通过对cp与dd命令man手册的学习我们看到。
1)cp命令拷贝过程中是整个文件的拷贝,操作对象最小单位是文件。dd拷贝可以以字节拷贝并且可以设置对数据拷贝的大小。
2)cp命令可以拷贝文件夹,其实最终还是文件的拷贝,dd不可以拷贝文件夹。3)dd还可以完成文件在拷贝过程中的转换(字符的转换,字符的填充等),cp不可以,cp会改变文件本身的属性,比如读写权限,但文件内容不会改变。
4)dd拷贝是通过扇区完成的,可以完成磁盘数据的完整拷贝。比如硬盘数据备份 dd if=/dev/sda of=/dev/sdh 可以将sda中的数据完整的拷贝到sdh中,扇区数据完全相同。cp不可以。
5)源码中dd和cp的实现是不一样的,dd在效率上要高于cp,dd使用文件系统接口去实现的就是open等函数,cp不是(还没研究好,大家可以去看一下)。
4)关于cp命令与dd命令的效率问题。大多数人觉得是dd命令的效率高,这个我测试了一下,测试效果如下:(仅供参考,欢迎讨论)
1、以上分别测试dd和cp拷贝小文件和大文件的时间
小文件(小于1k)看不出来,dd和cp的时间都很短,看不出来区别。
大文件(大于150Mb)看到时间cp要比dd效率高,cp时间为0.208s+0.000s=0.208s ,dd时间为0.812s+0.048s=0.860s(实际测试结果)
可以再测试下更大的文件是不是有优势!
2、深入研究需要看源码,以及测试源码的效率。(欢迎讨论delong.wang@sunplusapp.com)