php正则匹配中文

<?php

$str = '你是我的+****xiaopingguo  _ 23947237 _+冠军终归这里';

preg_match_all('/[\x{4e00}-\x{9fa5}A-Za-z0-9]+/u', $str, $re);

print_r($re);
//输出结果是:
//Array ( [0] => Array ( [0] => 你是我的 [1] => xiaoweiba [2] => 23947237 [3] => 冠军终归这里 ) )

逐个解释:

1、\x{4e00}-\x{9fa5}是utf编码下汉字的编码范围。

2、A-Za-z0-9,这个代表大写字母、小写字母和数字,没多说的。

3、u是修正符,表示匹配的字符串当成utf-8模式。

仅当备忘。

上一篇:python正则匹配——中文字符的匹配


下一篇:Java实现敏感词过滤(转)