前几天因为数据中加载有html语言的数据,关于html语言和UIWebView,有一些纠结,经过几天的研究,也有了一些自己的简单的见解。
我有两个页面需要加载html语言(注意,这里面的html不是从json解析出来的一段html语言,而是整个网站,然后用谷歌的开发者工具可接看到网站的源码),这段html语言显示的内容包括排版还是比较好的,所以我想直接把这个网站加载到我的程序上,但是由于是别的的数据,概览上面有一段我不想要的数据,滚动视图的详情页面有我很多不想要的数据,所以我就想到了把这段不想要的代码给删除掉。所以我想到了两个办法(网页的源码我们是无法直接的删除的),第一个,我利用UIWebView的js交互的方法,用dom语言把这一段给隐藏掉(例如: [self.webView stringByEvaluatingJavaScriptFromString:@"document.getElementsByClassName(\"m-app-download\")[0].hidden = true;"];),这段代码只有在UIWebView请求结束的时候使用才比较好,所以在加载的时候会先出现你不想要的那一部分,然后请求加载完成了之后(用的loadrequest请求)才会隐藏掉,所以还是达不到预期的效果;第二个办法,把整个后台的数据转换成字符串,然后删除或者修改我不想要的那一部分(例如:1. NSString * dataString = [NSString stringWithContentsOfURL:[NSURL URLWithString:[NSString stringWithFormat:@"%@",webUrl]] encoding:NSUTF8StringEncoding error:nil]; 2. dataString = [dataString stringByReplacingOccurrencesOfString:@"\"m-app-download\"" withString:@"”]; 3. [self.webView loadHTMLString:dataString baseURL:nil];),经过这三部,也能达到预期的效果,但是会存在一个问题,有点卡,暂时先不处理这,最起码达到了要求。
然后我满怀欣喜的去处理滚动视图上的链接,这个地方要比概览的网站大的多,加载的东西也非常多,我就利用第二种方法去处理它,因为我第二种方法是处理字符串,当我看到这个地方的字符串的时候,因为有非常多得相似的地方,字符串很难去处理,又一次陷入了纠结,所以我想到一个比较懒的方法,我现在视觉上让上面的我不想要的隐藏(因为这段字符串处理起来比较的简单),然后下面的我等请求结束后,在用dom给隐藏掉不就行了,然后继续做,后来成功了。
然后我以为是大功告成了,可是在测试的时候,我进入滚动页面详情的时候,非常极其的卡,后来就思考这是为什么,然后想到了一个原因,是不是UIWebView的加载的网站过大,再加上UIWebView的内存不能释放所造成的,然后我开始想这个解决办法,那不用UIWebView不就行了,然后我就想到了以前看到的一个第三方类(TFHpple)用来过滤html的标签,来获取自己想要的那一部分,所以就开始研究TFHpple,后来才知道过滤标签需要用到XPath语言(一种过滤xml和html的语言)(关于XPath的一些知识http://www.ruanyifeng.com/blog/2009/07/xpath_path_expressions.html),后来经过一段时间的学习很快的掌握了这一个知识点(例:使用过程:1.导入 #import “TFHpple.h" #import “TFHppleElement.h" #import “XPathQuery.h” 2.添加一个库,这个库是:libxml2.2.dylib。并且还需要设置一些路径参数,否则会一直报错;这个路径的设置,在 targets中,在build settings搜索Header Search Paths,将debug和release设置不同的值; debug的值设置成:/usr/include/libxml2 release的值设置成:${SDKROOT}/usr/include/libxml2 3. 将html语言转换成data, NSString *dataString = [NSString stringWithContentsOfURL:[NSURL URLWithString:@"http://breadtrip.com/mobile/destination/topic/2387718792/"] encoding:NSUTF8StringEncoding error:nil];
NSData *htmlData = [dataString dataUsingEncoding:NSUTF8StringEncoding]; 4.书写XPath过滤语句: NSString *nodeString = @"//section//dl";
NSString *nodeString = @"//p[@class=\"double-line\"]";
NSString *nodeString = @"//p[@class=\"double-line\"]";
NSString * nodeString = @"//dd[a[@class=\"pic\"]]//img"; //所有的图片
NSString * nodeString = @"//div[@class=\"info\"]//p[@class=\"summary\"][1]"; //获得所有的文字,15段文字
NSString * nodeString = @"//dd[div[@class=\"info\"]]//a[@class=\"pic\"]//img";
NSString * nodeString = @"//header//img”;等等
5.获得想要的那个对象: TFHpple *xpathParser = [[TFHpple alloc] initWithHTMLData:htmlData];
NSArray *elements = [xpathParser searchWithXPathQuery:nodeString];(注意数组里面装得是 TFHppleElement对象, 这样可以打印出来NSString * string = ele.attributes[@"src”]; NSLog(@"%@",string);))然后接卸终于结束了,获得数据进行简单的布局,这样布局的时候就不会有UIWebView那么好看的界面了,很可惜。
后来开始加载页面,本来以为问题已经解决掉了,可是还是非常的卡,这是为什么呢,接着就思考原因然后检查我的代码,这些方法都有( NSString * dataString = [NSString stringWithContentsOfURL:[NSURL URLWithString:[NSString stringWithFormat:@"%@",webUrl]] encoding:NSUTF8StringEncoding error:nil];)这段代码,测试后这段代码的耗时是非常长的,而且这段代码是在主线程来加载的所以,会非常的卡,终于找到了原因,所以就果断的用GCD开辟一条线程去加载数据
创建一个串行异步线程(串行异步能保证效率,又能控制它在异步线程上的执行顺序,所以用这个),然后回到主线程更新UI界面(self.hud是加载时候的蒙版),不出所料,果然非常的快了,各种快。后来想既然这样那么UIWebView应该也没有问题,所以上面的代码改成了UIWebView去loadHTMLString,发现依旧非常的快,而且界面的问题也保证了,果断欣喜。后来我有进行了疯狂的点击测试,发现没有问题,而且很快,但是就在点击了100多次左右,系统打印了内存警告的提示,后来一想,这是对的,因为UIWebView创建后的内存不能够释放,就算你退出了也不能释放,所以这个地方,当很多次的创建就可能导致内存警告(离着闪退还有一段距离),所以这个地方还得用TFHpple解析(很搓的界面是wufa避免了,我还是偷懒先用着UIWebVIew吧)。
总结:问题需要多方面的qu考虑,当遇到卡顿的时候,应该首先想到的就是线程的问题,在满足了功能的要求之后,应该还要站在用户的角度上去思考问题,比如内存问题,体验问题等等,这个地方走了很多的弯路,但是也学到了很多的知识,所以说是值得的。慢慢的积跬步然后去致千里。
以上内容纯属自己的见解,希望有错误大家一起改正。。。