[转]dd命令、cp命令详解+dd命令、cp命令对比 ---delong

2022-12-10 07:48:38

出处：http://blog.csdn.net/sun_app/article/details/18263299

1、dd命令详解

1）中文man手册dd的解释

NAME dd - 转换和拷贝文件

摘要使用方法：

dd [--help] [--version] [if=file] [of=file] [ibs=bytes] [obs=bytes] [bs=bytes] [cbs=bytes] [skip=blocks] [seek=blocks] [count=blocks]

[conv={ascii, ebcdic, ibm, block, unblock, lcase, ucase, swab, noerror, notrunc, sync}]

命令描述

当进行非强制的转换的时候，使用指定的输入和输出块大小拷贝文件（默认是从标准输入到标准输出。）

它每次从输入读取指定大小的一个块（默认是512字节）。

　　如果使用 bs=bytes 选项，并且没有转换，除了指定 sync,noerror,或 notrunc之外，那么dd将把全部读到的数据（可以比请求读的少）写到独立的输出块去。这个输出块的长度和读到的数据完全一样，除非指定使用sync（同步）转换，那样的话，数据结尾处将追加NULL字符（或空格，见下）。

其他情况下，输入的时候每次读一个块，然后处理，并将输出结果收集起来，最后写到指定大小的数据块中去。最终的输出块可能会比指定的大小短一些。

数字值选项（以字节或块为单位）后面可以跟一个乘数：

k=1024，b=512，w=2，c=1（w和c是GNU扩展语法。最好别使用w，因为在system V中，它表示2，在4.2 BSD中，它表示4）。两个或更多的数值表达式可以通过“x”乘起来。

GEU fileutils 4.0并且允许在数据块大小的叙述中使用

下列乘法后缀（用bs=，cbs=，obs=）：M=1048576，G=1073741824，

同理可得T，P，E，Z，Y。D后缀表示数值是以十进制表示的：kD=1000 MD=1000000 GD=1000000000等等。

（注意，在ls、df、du命令中，M等标记的大小是由环境变量确定的，而在DD中，它的值是固定的。）

选项

if=file: 从 file 中读而不是标准输入。

of=file: 写到 file 里去而不是标准输出。除非指定conv=notrunc ，否则， dd 将把 file截为O字节（或由 seek= 选项指定的大小）

ibs=bytes: 一次读 bytes 字节。默认是512。

obs=bytes:一次写 bytes 字节。默认是512。

bs=bytes:一次读和写 bytes 字节。这将覆盖 ibs 和 obs设定的值（并且，设定 bs 不等于同时将 ibs 和obs 设为同一个值，至少在只使用 sync, noerror 或notrunc转换时是这样的。因为bs规定，每个输入块都应作为单独的数据块拷贝到输出，而不把较短的块组合到一起）。

cbs=bytes：为block 转换和unblock转换指定转换块的大小。

skip=blocks在拷贝之前，跳过输入文件的前blocks块，每块大小为 ibs-byte 字节。

seek=blocks 在拷贝之前，跳过输出文件的前blocks块，每块大小为 obs-byte 字节。

count=blocks 只拷贝输入文件的前 blocks 块（每块的大小为ibs-byte字节），而不是全部内容，直到文件末尾。

conv=转换"[,"转换"]..." 将文件按转换参数指定的方式转换（在“,”两边没有空格）

转换方式包括：

ascii 将EBCDIC转换成ascii。

ebcdic 将ascii转换成ebcdic。

ibm 将ascii转换成alternative ebcdic。

block 每一行输入，无论长短，输出都是 cbs 字节，并且其中的“换行”（NEWLINE，即c中的'0）用空格替换。如有必要，行尾会填充空格。

unblock 用“换行”替换每个输入块（cbs 字节大小）末尾的空格。

lcase 将大写字母转换成小写。

ucase 将小写字母转换成大写。

swab 交换每对输入字节。如果读入的字节数是奇数，最后一个字节只是简单的复制到输出（因为没有能跟它交换的字节了）（POSIX1003.26，PASC翻译1003.2 3号和4号）。

noerror 发生读错误时，继续进行。

notrunc 不截断输出文件。

sync 用0填充到每个输入块的末尾，使其大小为ibs 字节。

GNU标准选项

--help 将用法信息打印到标准输出，并成功退出。

--version 将版本信息打印到标准输出，并成功退出。

-- 结束选项列表。

环境变量

LANG, LC_ALL, LC_CTYPE和LC_MESSAGES具有其通常含义。

遵循标准

POSIX 1003.2

举例

磁带机通常不能接受任意大小的数据块，当最后一个数据片段不能充满整个块时，dd将出现I/O错误。用'dd if=myfile of=/dev/mytape conv=sync'，就可以使全部内容存到磁带上。当然，这样做，把文件从磁带上读回时回产生一个稍大些的文件，因为其尾部填充了一些NUL（空字符）。

注

本手册页描述了fileutils-4.0软件包中的 dd

命令。其他版本的dd会与此稍有不同。有关更正和补充可以发帖到中国Linux 论坛-man手册版。报告程序中的错误，请给fileutils-bugs2gnu.ai.wit.edu 发邮件

2、cp命令详解

cp命令中文man手册

NAME cp - 复制文件和目录

总览

cp [选项] 文件路径

cp [选项] 文件...目录

POSIX 选项: [-fipRr]

GNU 参数(最短形式): [-abdfilprsuvxPR] [-S
SUFFIX] [-V {numbered,existing,simple}] [--sparse=WHEN] [--help]
[--version] [--]

描述

cp 复制文件(或者目录等). 可以使用这个命令复制一个文件到一个指定的目的地,或者复制任意多个文件到一个目的目录目录.

如果所给的参数只有两个文件名.它把前一个文件复制到后一个文件上.

如果最后一个命令参数为一个已经存在的目录名，cp会将每一个源文件复制到那个目录下(维持原文件名).

如果最后一个参数不是文件名,目录名,和给出多于两个非选项参数,是错误的.

(因而:如果/b已经存在,那么'cp -r /a /b'会复制/a到/b而成为/b/a.而复制/a/x到/b而成为/b/a/x。

但如果/b事先不存在,它会把/a复制为/b而复制/a/x到/b而成为/b/x.)

所创建的文件和/或目录的模式和原始的文件的模式是一样的，然后用用户umask值修改(除非使用了-p选项),(但在递归方式复制目录时,新建目录会临时地获得他们的最终模式Ored,连同S_IRWXU(0700),以便进程能够读、写、查找这些新建的目录.

复制文件到其自身时它什么事情都不做(除了可能会生成一条错误信息以外).复制到一个现存的不同文件时,系统调用函数`open(path,O_WRONLY|O_TRUNC)'打开目的文件.当复制到一个新文件时,系统调用函数`open(path,O_WRONLY|O_CREAT,mode)'创建该文件.如果这操作失败,该文件存在,和给出了-f选项,cp试图先删除该现存文件,如果删除成功则把它当做一个新文件处理.

POSIX 选项

POSIX 识别四个半选项：

-f 如果需要,删除已存在的目的文件.(如前所述.)

-i 提示是否覆盖现有普通目标文件。(在标准出错上显示问题,从标准输入读取答案.只有明确确认了才复制文件.)

-p 保留原文件的所有者、组、权限（包括 setuid 和 setgid 位），上次修改时间和上次访问时间。如果制作所有者或组信息的副本时出错，则setuid和setgid位被清空。

（要不然源文件和副本的上次访问时间显然是不同的，因为复制操作就是对源文件的访问．）

-R 递归复制目录，如果对象不是普通文件或目录那么做相应正确处理，(因此，一个FIFO或者特殊文件在复制后仍然是一个FIFO型或者相应特殊文件。)

-r 递归复制目录，如果对象不是普通文件或目录那么做一些未声明处理．（因此，我们允许并鼓励用 -r 选项做 -R 的同义词．不过那些愚蠢的特征，象那些在GNU版本的 cp 出现的（见下文）也可以用．）

GNU 细节

通常，读写文件的方式都是一样的．例外情况见下面的 --sparse 选项．

缺省情况下,`cp'并不复制目录(参见下文 -r 选项说明).

cp 通常不会复制文件到自身,但有以下例外：如果参数 --force --backup 与
源文件一起给出，并且与目的文件并且指向一个普通文件，cp
将生成一个备份文件,不是普通的就是编了号的,就象通常的方法那样声明.在你仅仅想对已有的文件进行备份, 而又不想修改它的时候很有用.

GNU 选项

-a, --archive

复制时,尽可能保持文件的结构和属性.(但不保持目录结构)等同于 -dpR。

-d, --no-dereference

复制符号链接作为符号链接而不是复制它指向的文件,

并且保护在副本中原文件之间的硬链接.

-f, --force

删除存在的目标文件。（较：原译文缺下面的部分）

-i, --interactive

无论是否覆盖现存文件都作提示。

-l, --link

制作硬链接代替非目录拷贝。

-p, --preserve

保持原始文件的所有者，组，许可，和时间表属性。

-P, --parents

一个斜杠和指定的源文件名构成目的文件。最后送给cp 的参数必须是一个已存在的目录的名字。

例如, 下面这个命令:

cp --parents a/b/c existing_dir 复制文件 `a/b/c' 到 texisting_dir(现有的目录)/a/b/c',建立任何缺少的中间目录。

-r
递归地复制目录,复制任何非目录和非符号链接(那是,FIFOs和特别文件)好象他们是常规的文件一样看待.这意味着尝试读出每个源文件的数据,和把它写到目的地上.因而,用这个选项,cp'可能彻底地终止,当不确定地读一个FIFO或者/dev/tty时,(这是一个缺陷.它意味着如果你不知道在这棵树(目录)中有什么要复制的时候,你不得不避开-r并使用-R打开一个未知的设备文件,比如说一台扫描仪,会有未知的效果发生在硬件上)

-R, --recursive

递归地复制目录,保留非目录(参见上面的 -r ).

--sparse=WHEN

一个稀疏file'包容`holes'-占用0字节,它不占用任何物理块;系统把他们作为0调用read'来读.由于许多二进制文件包容许多连续的0字节,这样能保存相当的磁盘空间并且加快速度.省缺情况下,cp通过自然的启发方式发现在源文件里holes并且使相关
的输出文件稀疏.

WHEN 值能够是下面中的一个：

auto 默认的行为:如果输入文件是稀疏的,输出文件也是稀疏的.

always 总是使输出文件稀疏.当输入文件所在的文件系统不支持稀疏文件的时候，这是有用的,但是输出文件所在的文件系统需要(支持稀疏文件).

never 从不使输出文件稀疏.如果你找到一个需要此选项的应用程序,让我们知道.

-s, --symbolic-link

生成符号链接代替非目录拷贝.所有的源文件名必须是绝对的(由`/'开始),除非目的文件是在当前目录.这选项仅仅在系统不支持符号链接时引起一个错误消息.

-u, --update

如果存在的目的地有相同的,或者更新的修改时间,不复制非目录(文件).

-v, --verbose

在复制前印出文件名.

-x, --one-file-system

跳过来自不同文件系统的子目录.

GNU 备份选项

GNU 版本程序象 cp, mv, ln, install
和patch会在覆盖,改变,或者破坏(文件)前生成一个备份文件.
那个文件由-b选项给出.他们的由-V选项命名.一般情况下备份文件名是源文件名加上后缀,这个后缀由-S 指定.

-b, --backup 生成关于覆盖和删除的备份.

-S SUFFIX, --suffix=SUFFIX 加入 SUFFIX(后缀) 到每个备份文件. 如果不指定,使用
SIMPLE_BACKUP_SUFFIX 环境变量的值.如果连 SIMPLE_BACKUP_SUFFIX 都没有设置,省缺是`~'.

-V METHOD, --version-control=METHOD

指定如何命名备份文件. METHOD 能够是`numbered' (or `t'), `existing'
(or `nil'), or `never' (or `simple'). 如果不指定,使用 VERSION_CONTROL
环境变量的值.如果VERSION_CONTROL 也没有设置,省缺备份文件类型是

`existing'. 这选项相应Emacs变量 `version-control'. 有效的METHODs 是(接受唯一的缩写):t, numbered 总是产生编号的备份。

nil, existing

Make numbered backups of files that already have them, simple

backups of the others.

never, simple

总作简单的备份.

GNU 标准选项

--help 印出用法并退出.

--version 印出版本信息并退出.

-- 结束选项列表.

环境(参数)

变量LANG,LC_ALL,LC_COLLATE,LC_CTYPE和LC_MESSAGES有通常意义.

对于GNU版本,变量SIMPLE_BACKUP_SUFFIX和VERSION_CONTROL控制备份

文件命名.与上面的描述一样.

适用到 POSIX 1003.2

注意这份 cp 的描述和FILEUTils-4.0中找到的是一样的;另外的版本也许有些微的差别.修正和新增邮到aeb@cwi.nl.报告缺陷到fileutils-

bugs@gnu.ai.mit.edu.

3、通过对cp与dd命令man手册的学习我们看到。

1）cp命令拷贝过程中是整个文件的拷贝，操作对象最小单位是文件。dd拷贝可以以字节拷贝并且可以设置对数据拷贝的大小。
2）cp命令可以拷贝文件夹，其实最终还是文件的拷贝，dd不可以拷贝文件夹。

3）dd还可以完成文件在拷贝过程中的转换（字符的转换，字符的填充等），cp不可以，cp会改变文件本身的属性，比如读写权限，但文件内容不会改变。

4）dd拷贝是通过扇区完成的，可以完成磁盘数据的完整拷贝。比如硬盘数据备份 dd if=/dev/sda of=/dev/sdh 可以将sda中的数据完整的拷贝到sdh中，扇区数据完全相同。cp不可以。

5）源码中dd和cp的实现是不一样的，dd在效率上要高于cp，dd使用文件系统接口去实现的就是open等函数，cp不是（还没研究好，大家可以去看一下）。

4）关于cp命令与dd命令的效率问题。大多数人觉得是dd命令的效率高，这个我测试了一下，测试效果如下：（仅供参考，欢迎讨论）

1、以上分别测试dd和cp拷贝小文件和大文件的时间

小文件（小于1k）看不出来，dd和cp的时间都很短，看不出来区别。

大文件（大于150Mb）看到时间cp要比dd效率高，cp时间为0.208s+0.000s=0.208s ,dd时间为0.812s+0.048s=0.860s（实际测试结果）

可以再测试下更大的文件是不是有优势！

2、深入研究需要看源码，以及测试源码的效率。（欢迎讨论delong.wang@sunplusapp.com）

码农公寓

相关文章