创建正则表达式对象
#以大写字母开始后面紧跟N个数字,方式一 reg = /[A-Z]\d+/ #方式二 reg = Regexp.new("[A-Z]\d+") reg = Regexp.new(/[A-Z]\d+/)
匹配检测:=~,当能够匹配的时候,返回第一次匹配的位置,不能匹配的话返回nil
letter_somenum = /[A-Z|a-z]\d+/ if letter_somenum =~ "f1" print "f1 matches regexp" else print "f1 not matches regexp" end
字符串匹配
#只要字符串中含有a到z且紧跟数字的都满足 /[a-z]\d+/
匹配行首行为,^和$。
#匹配以大写字母开头的表达式 reg = /^[A-Z]/
#匹配末尾是大写字母的字符串 second = Regexp.new("[A-Z]$") p second =~ "F1" p second =~ "1F"
#首位匹配,全部是大写字母 third = Regexp.new("^[A-Z]+$")
多个字符选一个使用[]
#ABC三个字符中的任意一个 /[ABC]/
#对于连续的字符可以使用-,匹配任意一个大写字母 /[A-Z]/
#匹配任意字母或下划线 /[A-Za-z_]/
中括号里的^,表示之外的字符
#ABC之外的所有字符 /[^ABC]/
一个点,匹配任意的单一字符
#以V开头,以s结尾的所有字符串 never_mind = /^V.*s$/ p never_mind =~ "Voctrals"
匹配一个空白字符(\s)
#F开头,N个字母,空格,N个字母结尾 space = /^F[A-Za-z]+\s[A-Za-z]+$/
匹配一个数字(\d)
#匹配多余0个数字 number = /^\d+$/
匹配一个英文字母或者一个数字(\w)
#匹配三个字母或者数字 letter_num = /^\w\w\w$/
前端匹配成功(\A)
#当且仅当前端匹配成功 front = /\Aabc/
后端匹配成功(\Z),他是应该出现在行尾的。。。
#当且仅当末端匹配成功 back = /abc\Z/
转义字符,如\^,\$,\[,\]等,让他们不再具有特殊意义
重复出现
*: 0次以上
#出现0次A,或者N次A /A*/
+: 1次以上
#出现N次A,N不允许为0 /A+/
?: 0次或一次
#要么出现A,要么就不要出现A,*这里好像有个BUG!!!* /A?/
最短匹配
#匹配最短的A*B,最好就是AAB /A*?B/ #匹配最短的A?B,最好就是AB /A+?B/
多个字符重复()
#匹配重复的ABC /(ABC)*/
或者:|
#匹配ABC或者CBA /(ABC)*|(CBA)*/
正则表达式的一些选项,直接加载//后面就可以了
i,不区分大小写
/[a-z]*/i
s,e,u,n: 指定字符集,默认为n
x: 忽略空白,#之后的内容,这样就可以给正则表达式加注释了
/[a-z]+ #N个字母 \d? #一个或没有数字 /xi
m:转换换行符号为.
回溯参照:取出满足条件的字符串部分
在正则表达式中用小括号()括起来的部分,可以使用$1,$2等对应着取出来,ruby会自动的去匹配。
/(.)(..)(.)/ =~ "why????" p $1 #=>"w" p $2 #=>"hy" p $3 #=>"?"
如果不想去匹配其中的某些,可以使用?:,放到括号内的前面
/(.)(\d\d)+(.)/ =~ " p $1 #=>1 p $2 #=>45 p $3 #=>6 /(.)(?:\d\d)+(.)/ =~ " p $1 #=>1 p $2 #=>6
ruby预留的$`获取匹配字符前面的部分,$&获取匹配的字符串,&'获取匹配字符后面的部分
/Shift/i =~ "control shift alt table" p $` #=>"control " p $& #=>"shift" p $' #=>" alt table"
使用正则表达式的方法!!!!
sub和gsub,用来替换匹配成功的字符串
sub只会替换第一个匹配成功的字符串,并返回
gsub会替换所有匹配的字符串,并返回
他们都不会修改原字符串,除非加上!,^_^
some= "abc def ghi jk lmn" #把第一个匹配的多个空格替换为_ p some.sub(/\s+/, "_") #=>"abc_def ghi jk lmn" p some #=>"abc def ghi jk lmn" #把所有匹配的多个空格替换为_ p some.gsub(/\s+/, "_") #=>"abc_def_ghi_jk_lmn" p some #=>"abc def ghi jk lmn"
对满足的部分进行处理,并返回处理过后的some
some= "abc def ghi jk lmn" # 替换第一个满足的部分为^_^ matched = some.sub(/\s+/) { |match| "^_^" } p matched #=> "abc^_^def ghi jk lmn"
scan方法,跟gsub很像,但是它不会进行取代动作,而是对满足的字符串进行处理:
scantest = "This is a string test for scan" gather = Array.new other = scantest.scan(/i./){|matched| gather.unshift(matched) } p gather #=>["in", "is", "is"]
当使用()的时候,如果匹配部分为一个变量,则会传递数组给变量,如:
scantest = "This is a string test for scan" gather = Array.new scantest.scan(/(i)(.)/){|matched| gather.unshift(matched) } p gather #=>[["i", "n"], ["i", "s"], ["i", "s"]]
如果匹配块儿中的变量为多个,不会传递数组,而是传递元素,如:
scantest = "This is a string test for scan" gather = Array.new scantest.scan(/(i)(.)/){|a, b| gather.unshift(a) gather.unshift(b) } p gather #=>["n", "i", "s", "i", "s", "i"]
不指定区块的时候,返回满足的元素组成的数组
scantest = "This is a string test for scan" gather = Array.new gather = scantest.scan(/i./) p gather #=>["is", "is", "in"]