import java.util.regex.Matcher;
import
java.util.regex.Pattern;
public class
HTMLSpirit{
public static String
delHTMLTag(String
htmlStr){
String regEx_script="<script[^>]*?>[\\s\\S]*?<\\/script>";
//定义script的正则表达式
String regEx_style="<style[^>]*?>[\\s\\S]*?<\\/style>";
//定义style的正则表达式
String regEx_html="<[^>]+>";
//定义HTML标签的正则表达式
Pattern
p_script=Pattern.compile(regEx_script,Pattern.CASE_INSENSITIVE);
Matcher
m_script=p_script.matcher(htmlStr);
htmlStr=m_script.replaceAll("");
//过滤script标签
Pattern
p_style=Pattern.compile(regEx_style,Pattern.CASE_INSENSITIVE);
Matcher
m_style=p_style.matcher(htmlStr);
htmlStr=m_style.replaceAll("");
//过滤style标签
Pattern
p_html=Pattern.compile(regEx_html,Pattern.CASE_INSENSITIVE);
Matcher
m_html=p_html.matcher(htmlStr);
htmlStr=m_html.replaceAll("");
//过滤html标签
return
htmlStr.trim(); //返回文本字符串
}
}
相关文章
- 01-15HTML5中meta标签的属性有哪些?
- 01-15React index.html引入script时 src中的斜杠都变成了空格,并且还多出了script标签 导致无法加载
- 01-15webpack处理html中img标签引入图片不显示问题
- 01-15webpack处理html中img标签引入图片不显示问题
- 01-15使用HTML中的canvas标签通过js操作制作一个小型英雄抓怪兽的2D小游戏
- 01-15html中meta标签的用处
- 01-15html-Thymeleaf吞噬数据列表中的选项标签
- 01-15HTML中各个标签
- 01-15【转】html5中如何去掉input type date默认样式
- 01-15HTML中块标签,行内标签以及行内块标签的特点及转换