正则表达式是简明而灵活的表示法,用于查找和替换各种模式的文本。在 SQL Server Management Studio 的“查找和替换”对话框中的“查找内容”字段中,可以使用一组特定的正则表达式。
使用正则表达式进行查找
-
若要在“快速查找”、“在文件中查找”、“快速替换”或 “在文件中替换” 操作过程中,在“查找内容”字段启用正则表达式,请在“查找选项”下选中“使用”,再选择“正则表达式”。
-
“查找内容”字段旁边的“引用列表”三角形按钮将变为可用状态。单击此按钮可显示一组最常用的正则表达式。如果选择了表达式生成器中的某个项,则可将该项插入“查找内容”字符串。
注意 |
---|
“查找内容”字符串中使用的正则表达式与 Microsoft .NET Framework 编程中的有效正则表达式相比,语法上存在差异。例如,在“查找和替换”对话框中,大括号 {} 用于表示带标记的表达式。所以,表达式“zo{1}”将匹配所有“zo”后带标记 1 的匹配项,如“Alonzo1”和“Gonzo1”。但在 .NET Framework 中,{} 符号用于表示量词。因此,表达式“zo{1}”将匹配所有“z”后跟一个“o”的匹配项,如匹配“zone”,但不匹配“zoo”。 |
下表对“引用列表”中提供的正则表达式进行了说明。
表达式 |
语法 |
说明 |
---|---|---|
任何单个字符 |
. |
匹配除换行符外的所有单一字符。 |
零个或更多 |
* |
匹配零或更多前导表达式的匹配项,执行所有可能的匹配。 |
一个或更多 |
+ |
匹配至少一个前导表达式的匹配项。 |
行首 |
^ |
仅匹配行首位置的字符串。 |
行尾 |
$ |
仅匹配行尾位置的字符串。 |
字首 |
< |
仅匹配文本中以此开头的字。 |
字尾 |
> |
仅匹配文本中以此结尾的字。 |
分行符 |
\n |
匹配与平台无关的换行符。在替换表达式中,插入一个换行符。 |
在集合中的任何一个字符 |
[] |
匹配 [] 中的任何一个字符。若要指定字符范围,请列出起始字符和结束字符,并用短划线 (-) 分隔,如 [a-z]。 |
不在集合中的任何一个字符 |
[^...] |
匹配不在 ^ 之后的字符集中的任何一个字符。 |
或 |
| |
匹配“或”符号 (|) 两旁的任一表达式。常用于组中。例如,(sponge|mud) bath 可以匹配“sponge bath”和“mud bath”。 |
Escape |
\ |
将反斜杠 (\) 后的字符作为文字匹配。此表达式允许您搜索正则表达式标记中使用的符号,如 { 和 ^。例如, \^ 可用于查找字符 ^。 |
标记表达式 |
{} |
匹配用括起来的表达式内的文本。 |
C/C++ 标识符 |
:i |
匹配表达式 ([a-zA-Z_$][a-zA-Z0-9_$]*)。 |
用引号括起来的字符串 |
:q |
匹配表达式 (("[^"]*")|(‘[^‘]*‘))。 |
空格或制表符 |
:b |
匹配空格或制表符。 |
整数 |
:z |
匹配表达式 ([0-9]+)。 |
“引用列表”中只列出了部分可在“查找和替换”操作中使用的正则表达式。还可以将下列任一正则表达式插入“查找内容”字符串:
表达式 |
语法 |
说明 |
---|---|---|
最少 - 零个或更多 |
@ |
匹配零个或更多前导表达式的匹配项,匹配尽可能少的字符。 |
最少 - 一个或更多 |
# |
匹配一个或更多前导表达式的匹配项,匹配尽可能少的字符。 |
重复 n 次 |
^n |
匹配前导表达式的 n 个匹配项。例如,[0-9]^4 匹配所有四位数序列。 |
分组 |
() |
将子表达式分组 |
第 n 个标记文本 |
\n |
在“查找或替换”表达式中,指示匹配第 n 个标记表达式的文本,其中 n 为 1 到 9 之间的数字。 在“替换”表达式中,\0 将插入完整的匹配文本。 |
右对齐字段 |
\(w,n) |
在“替换”表达式中,在宽度至少为 w 个字符的字段中,右对齐第 n 个标记表达式。 |
左对齐字段 |
\(-w,n) |
在“替换”表达式中,在宽度至少为 w 个字符的字段中,左对齐第 n 个标记表达式。 |
阻止匹配 |
~(X) |
如果在表达式的此处出现 X,则阻止匹配。例如,real~(ity) 匹配“realty”和“really”中的“real”,但不匹配“reality”中的“real”。 |
字母数字字符 |
:a |
匹配表达式 ([a-zA-Z0-9])。 |
字母字符 |
:c |
匹配表达式 ([a-zA-Z])。 |
十进制数字 |
:d |
匹配表达式 ([0-9])。 |
十六进制数 |
:h |
匹配表达式 ([0-9a-fA-F]+)。 |
有理数 |
:n |
匹配表达式 (([0-9]+.[0-9]*)|([0-9]*.[0-9]+)|([0-9]+))。 |
字母字符串 |
:w |
匹配表达式 ([a-zA-Z]+)。 |
Escape |
\e |
Unicode U+001B。 |
响铃 |
\g |
Unicode U+0007。 |
Backspace |
\h |
Unicode U+0008。 |
制表符 |
\t |
匹配制表符,Unicode U+0009。 |
Unicode 字符 |
\x#### 或 \u#### |
匹配由 Unicode 值确定的字符,其中 #### 为十六进制数字。可以使用 ISO 10646 码位或给出代理项对值的两个 Unicode 码位,指定基本多语言面(即代理项)以外的字符。 |
下表列出了按标准 Unicode 字符属性匹配时的语法。双字母缩写和 Unicode 字符属性数据库中列出的缩写相同。可以将这些缩写指定为字符集的一部分。例如,表达式 [:Nd:Nl:No] 匹配任何数字。
表达式 |
语法 |
说明 |
---|---|---|
大写字母 |
:Lu |
匹配任何单个大写字母。例如,:Luhe 匹配“The”,但不匹配“the”。 |
小写字母 |
:Ll |
匹配任何单个小写字母。例如,:Llhe 匹配“the”,但不匹配“The”。 |
标题大写字母 |
:Lt |
匹配一个大写字母后跟一个小写字母的字符,例如 Nj 和 Dz。 |
修饰字母 |
:Lm |
匹配字母或标点符号(如逗号、交叉重音符和秒号),这些字母或标点符号是用于修饰前导字母的。 |
其他字母 |
:Lo |
匹配其他字母,如歌特字母 ahsa。 |
十进制数字 |
:Nd |
匹配十进制数字(如 0-9)及其全角对等数字。 |
字母数字 |
:Nl |
匹配字母数字,如罗马数字和零的表意数字。 |
其他数字 |
:No |
匹配其他数字,如旧斜体数字一。 |
左标点 |
:Ps |
匹配左标点,如左小括号和左大括号。 |
右标点 |
:Pe |
匹配右标点,如右小括号和右大括号。 |
左引号 |
:Pi |
匹配左双引号。 |
右引号 |
:Pf |
匹配单引号和右双引号。 |
划线号 |
:Pd |
匹配划线号。 |
连接号 |
:Pc |
匹配下划线符号。 |
其他标点 |
:Po |
匹配 (,)、?、"、!、@、#、%、&、*、\、(:)、(;)、‘ 和 /。 |
空格分隔符 |
:Zs |
匹配空格。 |
行分隔符 |
:Zl |
匹配 Unicode 字符 U+2028。 |
段落分隔符 |
:Zp |
匹配 Unicode 字符 U+2029。 |
不占位标记 |
:Mn |
匹配不占位标记。 |
合并标记 |
:Mc |
匹配合并标记。 |
封闭标记 |
:Me |
匹配封闭标记。 |
数学符号 |
:Sm |
匹配 +、=、~、|、< 和 >。 |
货币符号 |
:Sc |
匹配 $ 和其他货币符号。 |
修饰符号 |
:Sk |
匹配修饰符号,如抑扬符、重音符和长音符。 |
其他符号 |
:So |
匹配其他符号,如版权符号、段落标记和度数符号。 |
其他控制 |
:Cc |
匹配行尾。 |
其他格式 |
:Cf |
格式化控制字符,如双向控制字符。 |
代理项 |
:Cs |
匹配代理项对的一半。 |
其他专门用途 |
:Co |
匹配任何专用区域的字符。 |
其他未分配字符 |
:Cn |
匹配未映射到 Unicode 字符的字符。 |
除了标准的 Unicode 字符属性以外,还可以将下列附加属性指定为字符集的一部分。
表达式 |
语法 |
说明 |
---|---|---|
字母 |
:Al |
匹配任何单字符。例如,:Alhe 匹配“The”、“then” 和“reached”之类的字。 |
Numeric |
:Nu |
匹配任何数字。 |
标点 |
:Pu |
匹配任意一个标点符号,如 ?、@、‘ 等等。 |
空格 |
:Wh |
匹配任何类型的空格,包括印刷空格和表意空格。 |
双向 |
:Bi |
匹配自右至左书写的字符,如阿拉伯语和希伯莱语字符。 |
朝鲜文字 |
:Ha |
匹配朝鲜文字字母和组合字母。 |
平假名 |
:Hi |
匹配平假名字符。 |
片假名 |
:Ka |
匹配片假名字符。 |
象形/汉字/日文汉字 |
:Id |
匹配象形字符,如汉字和日文汉字。 |