public string StripHT(string strHtml) //从html中提取纯文本
{
Regex regex = new Regex("<.+?>", RegexOptions.IgnoreCase);
string strOutput = regex.Replace(strHtml, "");//替换掉"<"和">"之间的内容
strOutput = strOutput.Replace("<", "");
strOutput = strOutput.Replace(">", "");
strOutput = strOutput.Replace(" ", "");
return strOutput;
}
相关文章
- 01-13webpack4 坑收集:html-webpack-plugin在多页面时,无法将optimization.splitChunks提取的公共块,打包到页面中
- 01-13jQuery EasyUI/TopJUI创建文本验证框(不写js,纯HTML实现!!!)
- 01-13的TinyMCE从我的HTML代码中删除CSS
- 01-13提取行中带有xpath的表格单元格文本内容以供使用?
- 01-13使用c从mp4中提取音频到mp3(不使用args执行ffmpeg)
- 01-13在sqlserver中如何从字符串中提取数字,英文,中文,过滤重复字符
- 01-13使用Python从word文档中提取图像和文本
- 01-13深度学习原理与框架-CNN在文本分类的应用 1.tf.nn.embedding_lookup(根据索引数据从数据中取出数据) 2.saver.restore(加载sess参数)
- 01-13我如何使用Win32com从Word文档中按颜色获取文本?
- 01-13从Wos文本数据中获取摘要进行分析的一种方法