Ruby Regexp

创建正则表达式对象

#以大写字母开始后面紧跟N个数字,方式一
reg = /[A-Z]\d+/
#方式二
reg = Regexp.new("[A-Z]\d+")
reg = Regexp.new(/[A-Z]\d+/)

匹配检测:=~,当能够匹配的时候,返回第一次匹配的位置,不能匹配的话返回nil

letter_somenum = /[A-Z|a-z]\d+/

if letter_somenum =~ "f1"
    print "f1 matches regexp"
else
    print "f1 not matches regexp"
end

字符串匹配

#只要字符串中含有a到z且紧跟数字的都满足
/[a-z]\d+/

匹配行首行为,^和$。

#匹配以大写字母开头的表达式
reg = /^[A-Z]/
#匹配末尾是大写字母的字符串
second = Regexp.new("[A-Z]$")
p second =~ "F1"
p second =~ "1F"
#首位匹配,全部是大写字母
third = Regexp.new("^[A-Z]+$")

多个字符选一个使用[]

#ABC三个字符中的任意一个
/[ABC]/
#对于连续的字符可以使用-,匹配任意一个大写字母
/[A-Z]/
#匹配任意字母或下划线
/[A-Za-z_]/

中括号里的^,表示之外的字符

#ABC之外的所有字符
/[^ABC]/

一个点,匹配任意的单一字符

#以V开头,以s结尾的所有字符串
never_mind = /^V.*s$/
p never_mind =~ "Voctrals"

匹配一个空白字符(\s)

#F开头,N个字母,空格,N个字母结尾
space = /^F[A-Za-z]+\s[A-Za-z]+$/

匹配一个数字(\d)

#匹配多余0个数字
number = /^\d+$/

匹配一个英文字母或者一个数字(\w)

#匹配三个字母或者数字
letter_num = /^\w\w\w$/

前端匹配成功(\A)

#当且仅当前端匹配成功
front = /\Aabc/

后端匹配成功(\Z),他是应该出现在行尾的。。。

#当且仅当末端匹配成功
back = /abc\Z/

转义字符,如\^,\$,\[,\]等,让他们不再具有特殊意义

重复出现

*: 0次以上

#出现0次A,或者N次A
/A*/

+: 1次以上

#出现N次A,N不允许为0
/A+/

?: 0次或一次

#要么出现A,要么就不要出现A,*这里好像有个BUG!!!*
/A?/

最短匹配

#匹配最短的A*B,最好就是AAB
/A*?B/
#匹配最短的A?B,最好就是AB
/A+?B/

多个字符重复()

#匹配重复的ABC
/(ABC)*/

或者:|

#匹配ABC或者CBA
/(ABC)*|(CBA)*/

正则表达式的一些选项,直接加载//后面就可以了

i,不区分大小写

/[a-z]*/i

s,e,u,n: 指定字符集,默认为n

x: 忽略空白,#之后的内容,这样就可以给正则表达式加注释了

/[a-z]+    #N个字母
\d?    #一个或没有数字
/xi

m:转换换行符号为.

回溯参照:取出满足条件的字符串部分

在正则表达式中用小括号()括起来的部分,可以使用$1,$2等对应着取出来,ruby会自动的去匹配。

/(.)(..)(.)/ =~ "why????"

p $1    #=>"w"
p $2    #=>"hy"
p $3    #=>"?"

如果不想去匹配其中的某些,可以使用?:,放到括号内的前面

/(.)(\d\d)+(.)/ =~ "
p $1    #=>1
p $2    #=>45
p $3    #=>6
/(.)(?:\d\d)+(.)/ =~ "
p $1    #=>1
p $2    #=>6

ruby预留的$`获取匹配字符前面的部分,$&获取匹配的字符串,&'获取匹配字符后面的部分

/Shift/i =~ "control shift alt table"
p $`    #=>"control "
p $&    #=>"shift"
p $'    #=>" alt table"

使用正则表达式的方法!!!!

sub和gsub,用来替换匹配成功的字符串

sub只会替换第一个匹配成功的字符串,并返回

gsub会替换所有匹配的字符串,并返回

他们都不会修改原字符串,除非加上!,^_^

some= "abc  def    ghi jk    lmn"
#把第一个匹配的多个空格替换为_
p some.sub(/\s+/, "_")    #=>"abc_def    ghi jk    lmn"
p some    #=>"abc  def    ghi jk    lmn"
#把所有匹配的多个空格替换为_
p some.gsub(/\s+/, "_")    #=>"abc_def_ghi_jk_lmn"
p some    #=>"abc  def    ghi jk    lmn"

对满足的部分进行处理,并返回处理过后的some

some= "abc  def    ghi jk    lmn"
# 替换第一个满足的部分为^_^
matched = some.sub(/\s+/) { |match|
    "^_^"
}
p matched    #=> "abc^_^def    ghi jk    lmn"

scan方法,跟gsub很像,但是它不会进行取代动作,而是对满足的字符串进行处理:

scantest = "This is a string test for scan"
gather = Array.new

other = scantest.scan(/i./){|matched|
    gather.unshift(matched)
}
p gather    #=>["in", "is", "is"]

当使用()的时候,如果匹配部分为一个变量,则会传递数组给变量,如:

scantest = "This is a string test for scan"

gather = Array.new

scantest.scan(/(i)(.)/){|matched|
    gather.unshift(matched)
}

p gather    #=>[["i", "n"], ["i", "s"], ["i", "s"]]

如果匹配块儿中的变量为多个,不会传递数组,而是传递元素,如:

scantest = "This is a string test for scan"

gather = Array.new

scantest.scan(/(i)(.)/){|a, b|
    gather.unshift(a)
    gather.unshift(b)
}

p gather    #=>["n", "i", "s", "i", "s", "i"]

不指定区块的时候,返回满足的元素组成的数组

scantest = "This is a string test for scan"

gather = Array.new

gather = scantest.scan(/i./)

p gather    #=>["is", "is", "in"]
上一篇:构建CRD工程 - 程序员学点xx 43 k8s


下一篇:elasticsearch的基本用法