php / html:用换行符替换html结束标记

我正在抓取网页上的html,当我使用php strip_tags时,它会将整个html刷成一行,删除所有结构.

我想通过用换行符替换h,p和br标签来保留结构.

preg替换是否是最好的解决方案?

一旦我替换了所有关闭标签,我就会运行一个条带标签,但这样我就会有一个基本结构.

解决方法:

$str = 'some html';
$tags = array('</p>','<br />','<br>','<hr />','<hr>','</h1>','</h2>','</h3>','</h4>','</h5>','</h6>');
$str = str_replace($tags,"\n",$str);

// then strip tags
上一篇:linux – 如何在Bash脚本中将DOS / Windows换行符(CRLF)转换为Unix换行符(LF)?


下一篇:关于 C#脚本,error CS1010: Newline in constant 的解决方法