正则表达式——去除文本中的非汉字（VB2005）

2022-05-07 22:39:07

　　本人由于工作关系，需要一段代码，将给定的字符串中的非汉字去除，只保留汉字部分。

　　这个一般用正则表达式比较简单，网上有一些匹配汉字的正则表达式，拿来经过改造就能实现我前面的要求。

　　注释一下，正则表达式[\u4e00-\u9fa5]表示匹配中文，则正则表达式[^\u4e00-\u9fa5]匹配非中文。用Replace方法将匹配的非中文替换为空字符串，也就是去除了文本中的非中文字符。

　　代码格式修正于2012年1月5日

Imports System.Text.RegularExpressions
Public Class clsT
　　Public Function OnlyChinese(ByVal mText As String) As String
　　　　Return Regex.Replace(mText, "[^\u4e00-\u9fa5]", "")
　　End Function
End Class

码农公寓

相关文章