html源代码结构解析,以抽取特定节点内容:
方案一: 正则表达式
方案二: HtmlAgilityPack库 :
HtmlAgilityPack是使用XPath语法,HtmlAgilityPack是一个开源的.NET类库,它的主页是http://htmlagilitypack.codeplex.com/,在这里可以下载到
最新版的类库及API手册,此外还可以下载到一个用于调试的辅助工具。
方案三:Winista.Htmlparser.Net库 :
是.NET平台下解析Html的开源代码,网上有源码下载,百度一下就能搜到,这里就不提供了。并且有英文的帮助文档。