C#去除HTML标签


在做网站的时候,用到了去除html标签的问题,用正则匹配到html标签,然后replace即可。

public static string ReplaceHtmlTag(string html, int length = 0)
{
    string strText = System.Text.RegularExpressions.Regex.Replace(html, "<[^>]+>", "");
    strText = System.Text.RegularExpressions.Regex.Replace(strText, "&[^;]+;", "");

    if (length > 0  && strText.Length > length)
        return strText.Substring(0, length);

    return strText;
}

这个方法可以实现去除html标签的功能。

Length参数可以根据传入值取固定长度的值。用于生成文章摘要比较方便。




本文转自齐师傅博客园博客,原文链接:http://www.cnblogs.com/youring2/archive/2013/04/03/2997826.html,如需转载请自行联系原作者

上一篇:TP框架使用命令行


下一篇:《云计算:概念、技术与架构》一1.2 本书未涵盖的内容