VIM及正则表达式
一、查找/Search + 统计
1、统计某个关键字
方法是:%s:keyword:&:gn
。
其中,keyword是要搜索的关键字,&
表示前面匹配的字符串,n
表示不真正进行替换。有的人说,不加n
也可以,不过不加n
的话,会修改文件的时间信息,%
表示所有行,s
表示substitute,g
表示global,所在行的所有匹配。
二、替换与删除/Substitute/Replace & Delete
1、删除行尾的^M
The ^M
is a carriage-return/CR
character. If you see this, you're probably looking at a file that originated in the DOS/Windows world, where an end-of-line is marked by a carriage return/newline pair, namely CR-LF
, whereas in the Unix world, end-of-line is marked by a single newline.
Read this article for more detail, and also the Wikipedia entry for newline.
This article discusses how to set up vim to transparently edit files with different end-of-line markers.
If you have a file with ^M
at the end of some lines and you want to get rid of them, use this in Vim:
:%s/^M$//g
**Note: ** (Press Ctrl
+V
Ctrl
+M
to insert that ^M
.) You can't directly insert ^
+M
(two characters), which doesn't match the single CR
character.另外可以用\r
(carriage return/車-返/迴)来代替^M
。
参考:
删除行尾的^M
三、居中光标所在行
zz
居中光标所在行zb
zoom base/将光标所在的行跳转到当前页面的最底部zt
top/将光标所在的行跳转到当前页面的最顶部
ctrl+b 页面向后退一页/backward
ctrl+f 页面向前一页/forward
四、正向预搜索匹配
五、列模式/Volumn Mode
1、比如我们经常要用到的注释
,也就是在行首
添加//
(双斜杠)。
在Windows的GVIM下先按CTRL+Q
打开块选择模式
,然后按SHIFT
+上、下、左、右箭头选择相应的区域,后按下SHIFT+I(Insert)
开始插入//
,最后按下`
(1左边的Escape键)即可。
注
:有的时候按下CTRL+V
也可以开启选择模式,但是在Windows下CTRL+V
用作了粘贴键
。
2、在行首添加行号
比较容易理解的版本:
- :%s/^/=printf("%6d\t", line('.')) 或者 :%s:^:=printf("%6d",line('.'))
其中,:(冒号)与/(正斜线)均是作为一个命令的分隔符,后面的(反斜线)是个转义字符。这个printf(formatted print)与C语言中的功能相同,这里的格式%6d,表示输出为6为的10(shí)进制,如果不足6位则在前面用space(空格,Unicode 0x20)填充。line('.'),表示当前行的行号。%
代表100%
,也就是所有的行。
另外,这个匹配可以用另外一种方式去理解,^
(caret/帽子)符号代表的是行首,我们只要用特定的字符把^(行首)
替换了就可以了。
Note:基于此,那么在行首,添加//
注释就非常的简单了。只要[range]s:^://
即可,其中[range]
表示哪些行,比如在5至7行 de' 行首添加注释,则[range]
替换成5,7
即可。
REFER:Inserting Line Numbers into Existing Text
六、复制/删除
(1)复制1个单词:yw
复制n个单词:ynw
(2)复制1行:yy
复制n行:nyy
(3)删除1个单词:dw
(delete word);
删除n个单词:dnw
(4)删除1行:dd
删除n行:ndd
七、匹配中文字符
中文在不同的字符集编码中的匹配规则也不同,这里说的是UNICODE字符集中汉字的匹配规则。
UNICODE标准中,中日韩三国的文字通称为CJK象形文字,在UNICODE 6.3标准中占据的编码块有以下几个:
2E80..2EFF; CJK Radicals Supplement 中日韩部首增补
2F00..2FDF; Kangxi Radicals 康熙部首
3000..303F; CJK Symbols and Punctuation 中日韩符号和标点
31C0..31EF; CJK Strokes 中日韩笔画
3200..32FF; Enclosed CJK Letters and Months 带圈中日韩字母和月份
3300..33FF; CJK Compatibility 中日韩兼容
3400..4DBF; CJK Unified Ideographs Extension A 中日韩统一表意文字扩展A
4DC0..4DFF; Yijing Hexagram Symbols 易经六十四卦符号
4E00..9FFF; CJK Unified Ideographs 中日韩统一表意文字
F900..FAFF; CJK Compatibility Ideographs 中日韩兼容表意文字
FE30..FE4F; CJK Compatibility Forms 中日韩兼容形式
20000..2A6DF; CJK Unified Ideographs Extension B 中日韩统一表意文字扩展B
2A700..2B73F; CJK Unified Ideographs Extension C 中日韩统一表意文字扩展C
2B740..2B81F; CJK Unified Ideographs Extension D 中日韩统一表意文字扩展D
2F800..2FA1F; CJK Compatibility Ideographs Supplement 中日韩兼容表意文字增补
所以如果使用UNICODE字符集,无论使用何种编码转换格式,当然优先utf-8,就可以使用[\uxxxxx-\uxxxxx]
这种格式来匹配相应的象形文字。对于常用汉字,可以用[\u4E00-\u9FFF]
覆盖,但是这个范围没有标点符号,只能匹配 汉字/Kanji/漢字。[\u3000-\u303F]
也只涵盖一部分 全角标点符号,比如没匹配到全角的逗号。
例子:
1、将汉字中间的英文逗号/,
替换为中文逗号/,
。
方法:
:%s:\([\u4e00-\u9fa5]\)\(,\)\([\u4e00-\u9fa5]\):\1,\3:g
其中,\([\u4e00-\u9fa5]\)代表\1,表示分组1;
\(,\)代表\2,表示分组2;
\([\u4e00-\u9fa5]\)代表\3,表示分组3;
上面的第一个:
,表示VIM的命令模式。%
表示在整个文件进行操作。 s
表示 subsitute/替换
。\(
和\)
表示一个分组,分组可以用\n
(n 为1-9)进行代替。
后面的\1,\3
,表示只将 英文逗号,
替换为 中文逗号,
,另外的第1和第3组模式保持不变,g
表示对某一行里面的所有匹配,不加g
表示只替换所在行的第一个。
2、将( 汉字汉字汉字 )
替换为 (汉字汉字汉字)
。即,将英文括号换成中文的括号,并去掉汉字两边的空格。
:%s:\((\s\=\)\([\u4e00-\u9fa5]\+\)\(\s\=)\):(\2):g
解释:将左括号(英文)和左边的空格 分到第1组,中间的汉字为第2组,汉字后的 空格+括号 为第3组。
八、全选、全部复制
1、gg+V+G
全选gg
跳到第1行;V 选择模式;G(Shift+g),跳到最后一行;
2、gg+V+G+y
全选
并复制
3、复制n-m行ngg+V+m+gg+y
n+gg
,跳转到第n行;m+gg跳转到第m行;V,选择;y-yank复制;
参考
1、Search and Replace
2、VIMDoc
3、VIMRegex
4、VIMTips
5、China Unix VIM 中文
6、vim:匹配中文的正则表达式