正则表达式——去除文本中的非汉字(VB2005)

 本人由于工作关系,需要一段代码,将给定的字符串中的非汉字去除,只保留汉字部分。

  这个一般用正则表达式比较简单,网上有一些匹配汉字的正则表达式,拿来经过改造就能实现我前面的要求。

  

  注释一下,正则表达式[\u4e00-\u9fa5]表示匹配中文,则正则表达式[^\u4e00-\u9fa5]匹配非中文。用Replace方法将匹配的非中文替换为空字符串,也就是去除了文本中的非中文字符。

  代码格式修正于2012年1月5日 

Imports System.Text.RegularExpressions
Public Class clsT
Public Function OnlyChinese(ByVal mText As StringAs String
    Return Regex.Replace(mText, "[^\u4e00-\u9fa5]""")
End Function
End Class

    本文转自万仓一黍博客园博客,原文链接:http://www.cnblogs.com/grenet/archive/2009/12/11/1622117.html,如需转载请自行联系原作者
上一篇:达摩院的MindOpt优化求解器发布新功能,又获第一,还免费


下一篇:优化求解器之AMPL建模工具简介