我正在从RSS提要中提取内容,但它附带了锚点< a>我需要删除的标签.
为此,我尝试了strip_tags但删除了所有HTML标记,包括< img>.
然后我尝试了:
$content = preg_replace("/<a[^>]\+>|<a>|<\/a>/i", "", $content);
但它对我不起作用100%.
然后我尝试了DOM:
$xml = new DOMDocument();
$xml->loadHTML($content);
$links = $xml->getElementsByTagName('a');
但我不知道如何在没有< a>的情况下提取内容.标签.
解决方法:
在解析rss时,最好剥离所有标签并维护用于文本格式化的标签(< p>,< b>,< i>等).所以你需要将第二个参数传递给strip_tags
.
07001
allowable_tags
You can use the optional second parameter to specify tags which should not be stripped.
例如:
echo strip_tags($contentFromRSS, '<p><div><i><b><u>');