前端优化系列 - H5存储及优化

2021-09-04 14:28:27

前言

数据存储在性能优化中扮演着极其重要的角色。存储类型，存取策略，存储命中率，等等，往往都会影响页面的实际性能。CPU Cache有多级缓存机制，浏览器有MemoryCache机制，服务器有CDN缓存，这些都为了更大程度的提升性能。本文详细介绍与H5页面相关的存储，以及可能的优化思路。

常见H5存储

H5页面相关的存储非常多，我们先看看有那些类型的存储。

通常，与页面加载性能相关的，有下面几种缓存，

（1）MemoryCache

MemoryCache，资源存放在内存中，一般资源响应回来就会放进去，页面关闭就会释放。内存存取性能可达磁盘缓存性能的100倍，但这还不是MemoryCache的最大优势，MemoryCache最大的优势是离排版渲染引擎非常近，可以直接被读取，甚至无需经过线程转换。在真实的页面访问过程中，获取资源的时间，磁盘IO仅仅是其中的一部分，更多的时间往往消耗在各种线程抛转。

（2）ClientCache

ClientCache，客户端缓存，比如，手淘里的ZCache（离线压缩包缓存），本质上属于磁盘缓存。这类Cache的优点是能以相对可控的方式让资源提前缓存在磁盘，但它也有一系列的成本。比如，它需要一套服务器与客户端协同的下发更新逻辑，服务器端需要管理下发，客户端需要提前解压缩。我们可能觉得提前解压并不是什么弱点，但如果有一千个离线包，这个问题就比较严重了，如果不提前解压，就无法保证首次访问性能，如果提前解压会让IO非常繁忙，可能会造成客户端打开时严重卡顿。

（3）HttpCache

HttpCache，是历史比较悠久的缓存，它利用标准的 Cache-Control 与服务器端进行协商，根据标准的规则去缓存或更新资源。它应用非常广泛，是非常有效果的一种磁盘缓存。它的缺点是完全由浏览器按标准规则控制，其它端的控制力度非常弱。比如，某些被HttpCache缓存的静态资源出问题了，通常只能是改页面，不再使用出问题的资源，而无法主动清除出问题的资源。

（4）NetCache

网络相关的Cache，一般是指DNS解析结果的缓存，或预连接的缓存。DNS预解析和预连接是非常重要的，创建一个Https连接的成本非常大，通常需要600ms以上，也就是说，页面如果有关键资源需要全新建连接，秒开基本是不可能了。

（5）CDN

CDN一般是通过负载均衡设备根据用户IP地址，以及用户请求的URL，选择一台离用户比较近，缓存了用户所需的资源，有较好的服务能力的服务器，让用户从该服务器去请求内容。它能让各个用户的缓存共享，缩短用户获取资源的路径，来提升整体的性能。

当然，还有其它非常多类型的Cache，比如，

（1）JS相关，V8 Bytecode Cache，字节码缓存，能极大的减少JS解析耗时，甚至可以提升3-6倍的性能。参考：前端优化系列 - JS解析性能分析

（2）渲染相关，图片解码数据缓存，是一块非常大的内存缓存，约100M，能保证页面滚动过程可以实时获取到图片解码数据，让滚动非常流畅。

（3）页面相关，页面缓存，Safari的PageCache，Firefox的Back-Forward Cache，UC浏览器的WebViewCache，都是一样性质的缓存，将整个执行过的页面保存在内存。标准的页面缓存，进入的条件非常苛刻，大部分情况都无法进入，而且在前进后退的场景才允许使用。

资源响应成本

前面提到，MemoryCache与其它磁盘缓存的最大差异并不在于磁盘IO成本，为什么这样说呢，我们先看看一个HTML文档资源请求的完整过程，

-> Browser UI thread: load url
-> Renderer: set up document loader & do request
-> Renderer: If can use MemoryCache, return resource, commit navigation （直接使用MemoryCache的资源）
-> Browser IO thread: set up request
-> Browser UI thread: NavigationThrottle::WillStartRequest（回调onPageStarted）
-> Browser IO thread: start shouldInterceptRequest
-> Browser UI thread: shouldInterceptRequest, get cache from Zips（从客户端离线包获取资源）
-> Browser IO thread: use shouldInterceptRequest response
-> Browser IO thread: use HttpCache or start network request（使用HttpCache或从网络请求资源）
-> Browser UI thread: NavigationThrottle::WillProcessResponse（进行MIME Sniff检测）
-> Browser IO thread: send response to renderer（响应数据回传到Blink内核）
-> Renderer: set response to MemoryCache, commit navigation（设置响应数据到MemoryCache，供后续流程使用）

我们可以非常清晰的看到，如果资源在MemoryCache，基本是没有加载成本的。但如果在其它Cache，比如，离线包缓存，HttpCache缓存，除了磁盘IO时间，更多的是各种线程抛转的时间，在UI线程特别繁忙的时候，从IO抛消息到UI，可能要200ms，这是非常离谱的。但事实就是这样，资源从磁盘缓存响应回来的过程，会有各种线程抛转的额外成本。

资源响应的成本，MemoryCache几乎是零成本，能在1ms的级别给到内核引擎使用。ZCache和HttpCache的成本都较大，而HttpCache的成本相对少一些，它不需要再走到客户端的外壳层。通常资源从ZCache响应回到内核Blink引擎层需要100ms，UI线程特别繁忙时，ZCache里的主文档资源响应甚至要300ms。

存储优化

一般来说，较好的优化思路就是找到性能瓶颈，然后把瓶颈优化掉，瓶颈位置找的不对，可能就事倍功半。从我们的一些经验来看，加载流程中会影响性能的，一般有下面几个环节：

（1）IO性能

内存存取性能可以达到磁盘IO性能的100倍，但是，硬件性能日新月异，磁盘IO性能也是毫秒级别了，即使慢了100倍，实际也就慢了几毫秒，即磁盘IO性能通常不会成为性能瓶颈。当然，网络IO则另当别论，可能存在较长的等待时间。

（2）网络性能

如果资源请求走了网络，通常时间是消耗在DNS解析和创建连接，当然，资源特别大时传输也有可能比较耗时，吞吐能力比较差的服务器响应时间也可能比较长。DNS解析可以使用HttpDNS之类的技术去进行预解析。创建连接方面，可以用Http2.0降低影响或者实现一些预连接策略。资源走网络的成本是非常大的，我们一般都期望资源能走本地缓存。

（3）线程抛转

通常我们认为资源在本地磁盘了，获取资源的耗时主要在磁盘IO，而事实上，磁盘IO的性能其实是比较好的，更大量的时间消耗在资源响应传递回内核Renderer线程的过程。如果资源在MemoryCache，那么内核各个模块（排版，渲染，JS引擎）是可以直接使用的，几乎是零成本。

那么，什么资源可以放进MemoryCache呢？通常，页面资源加载回来都会放进MemoryCache，以供内核各模块高性能使用，MemoryCache在内核是使用GC管理的，页面关闭时，页面资源没有关联引用，就会从MemoryCache里移除，即可以简单理解为在页面访问过程中资源才会保存在MemoryCache，页面关闭时就会移除。

（4）整页缓存

从性能的角度来看，整页资源缓存的效果无疑是最好的。标准上，有PageCache，Back-Forward Cache，一些浏览器也有自己的实现方案（比如，UC的WebViewCache），这些技术都能将整个页面的资源缓存在内存，在前进后退等特殊场景，能直接从内存里读取整个页面，达到极速打开的效果。

优化实践

前面介绍了很多理论层面的内容，我们接下来介绍一些实践优化案例。

（1）预置资源进MemoryCache

我们先看看预置的过程，在页面的onPageFinished的回调里面去检查是否有资源可以预置，如果有，就通过相关接口把资源设置进内核的MemoryCache。

用户在访问页面时，内核会优先从CustomMemoryCache里面查找，如果找到就直接返回资源响应。CustomMemoryCache里面存储的就是预置进来的资源。

我们并不知道用户即将会访问什么页面，如果把大量的资源都预置进内存，而用户却没有使用，那就会造成浪费。另外，资源在内核内存，仅仅是加快了资源的加载速度，页面的首屏包含非常多非常复杂的流程，某个流程的加速并不一定能带来整体性能的提升，比如，非关键的JS放在内存，可能就会先于一些关键JS被提前执行，反而让首屏更慢。所以，选择放那些资源进内存也是非常有讲究的，能预置的资源一般是非常关键的更新频率较低的少量公共基础资源，比如，手淘里面的web based基础JS，手淘小程序的基础JS，等等。

（2）预加载资源进HttpCache

预置资源进内存，对加载性能的提升是最明显的，但成本也是最大的，会占用用户手机宝贵的内存资源。另外一种预置资源的思路是，提前通过内核去预加载一些资源，资源加载回来之后就直接保存在标准的HttpCache。资源在HttpCache和在客户端缓存（比如，手淘ZCache）的性能差别不大。但如果资源不能放进ZCache，通过这种方式提前放到HttpCache，也是一种优化思路。

（3）使用WebViewCache极速切换页面

H5页面的加载流程是非常重的一套流程，即使同一个页面多次重复访问，也需要走比较完整的流程，耗时极长，这与用户的期望是不符的，通常用户期望访问过的页面就能快速展现出来。在一些特定的场景，H5也是可以做到极速展现的，比如，前进后退。其它的场景，比如页内几个TAB切换，是否也可以用上这类缓存呢？也是可以的，我们在天猫超市首页上就使用此缓存实现了类Native体验的底部导航。

原理上也是比较简单的，在页面首次访问时，会将排版渲染好的页面放进WebViewCache里，WebViewCache是存储完整页面的一块内存。

用户再次访问该页面时，会将WebViewCache内存中的完整页面读取出来，直接绘制展现，而无需再进行加载解析排版渲染等流程，从而达到极速打开的效果。

除了内核提供WebViewCache基础技术之外，前端也需要与内核进行一定的交互，比如，通过JSAPI查询当前页面是否在WebViewCache，如果在则返回它在WebViewCache列表的位置，然后前端就可以使用JSAPI去跳转到相应位置的页面，内核就把页面从内存读取和展现出来。使用此类技术，页面一般能在500ms左右完全展现出来，具有非常好的用户体验。

（4）前端使用LocalStorage缓存HTML文档

当前前端渲染非常流行，页面大部分的逻辑都会由前端JS去执行，JS执行完才会生成完整的HTML文档，而JS执行的成本是非常大的，JS执行时间可能占据首屏时间的50%，有些甚至能达到80%。那么，我们有没有可能将JS执行生成的完整HTML文档缓存起来呢，下次访问时直接使用已缓存的页面，而无需重复执行JS？这也是可以的，我们在天猫超市和天猫国际一些页面上已经使用此技术。

原理上也不复杂，首次访问页面时，JS执行完之后会生成完整的HTML文档，我们将HTML文档缓存到LocalStorage里面。

在后续的访问中，我们优先从LocalStorage里面读取HTML文档，解析排版渲染页面，而无需JS执行去生成页面，让页面展现速度得到极大的提升。

这种方案的关键在于前端能够实现一套DOM-Diff更新的机制，在从LocalStorage读取HTML页面的同时，前端还会发起请求去更新HTML文档，在新的HTML文档回来之后，会和旧的文档进行Diff，针对Diff来进行局部更新，这样能保证页面得到及时的更新。

结束语

前面介绍的H5缓存相关理论与实践，期望能让大家对H5缓存有个整体的了解，理解一些优化的思路和背后的原因。一些优化展现了H5的极致能力，比如，从预置内存里面加载资源，可以在1ms完成一个资源的加载，从WebViewCache里面读取页面，在普通手机500ms就可以展现一个完整页面，这些速度简直是不可思议的，却真实的存在着！很多时候不是H5能力不行，而是H5没有做定制，如果H5进行定制约束优化，也一样可以带来极致的性能提升。

码农公寓

前言

常见H5存储

资源响应成本

存储优化

优化实践

结束语

相关文章