卡顿产生的原因
在 VSync
信号到来后,系统图形服务会通过 CADisplayLink
等机制通知 App
,App
主线程开始在 CPU
中计算显示内容,比如视图的创建、布局计算、图片解码、文本绘制等。随后 CPU
会将计算好的内容提交到 GPU
去,由 GPU
进行变换、合成、渲染。随后 GPU
会把渲染结果提交到帧缓冲区去,等待下一次 VSync
信号到来时显示到屏幕上。由于垂直同步的机制,如果在一个 VSync
时间内,CPU
或者 GPU
没有完成内容提交,则那一帧就会被丢弃,等待下一次机会再显示,而这时显示屏会保留之前的内容不变。这就是界面卡顿的原因。
在开发中,CPU
和GPU
中任何一个压力过大,都会导致掉帧现象,所以在开发时,也需要分别对CPU
和GPU
压力进行评估和优化。
iOS 设备中的 CPU & GPU
CPU
加载资源,对象创建,对象调整,对象销毁,布局计算,Autolayout,文本计算,文本渲染,图片的解码, 图像的绘制(Core Graphics)都是在CPU
上面进行的。
GPU
GPU
是一个专门为图形高并发计算而量身定做的处理单元,比CPU
使用更少的电来完成工作并且GPU
的浮点计算能力要超出CPU
很多。
GPU
的渲染性能要比CPU
高效很多,同时对系统的负载和消耗也更低一些,所以在开发中,我们应该尽量让CPU
负责主线程的UI
调动,把图形显示相关的工作交给GPU
来处理,当涉及到光栅化等一些工作时,CPU
也会参与进来,这点在后面再详细描述。
相对于CPU
来说,GPU
能干的事情比较单一:接收提交的纹理(Texture)和顶点描述(三角形),应用变换(transform)、混合(合成)并渲染,然后输出到屏幕上。通常你所能看到的内容,主要也就是纹理(图片)和形状(三角模拟的矢量图形)两类。
CPU 和 GPU 的协作
由上图可知,要在屏幕上显示视图,需要CPU
和GPU
一起协作,CPU
计算好显示的内容提交到GPU
,GPU
渲染完成后将结果放到帧缓存区,随后视频控制器会按照 VSync
信号逐行读取帧缓冲区的数据,经过可能的数模转换传递给显示器显示。
缓冲机制
iOS
使用的是双缓冲机制。即GPU
会预先渲染好一帧放入一个缓冲区内(前帧缓存),让视频控制器读取,当下一帧渲染好后,GPU
会直接把视频控制器的指针指向第二个缓冲器(后帧缓存)。当你视频控制器已经读完一帧,准备读下一帧的时候,GPU
会等待显示器的VSync
信号发出后,前帧缓存和后帧缓存会瞬间切换,后帧缓存会变成新的前帧缓存,同时旧的前帧缓存会变成新的后帧缓存。
优化方案
在YY
大神的 iOS 保持界面流畅的技巧中详细介绍了 CPU 资源消耗原因和解决方案和 GPU 资源消耗原因和解决方案,这里面包括了开发中的大部分场景,可以帮助我们快速定位卡顿的原因,迅速解决卡顿。
下面是一些常见的优化方案!
TableViewCell 复用
在cellForRowAtIndexPath:
回调的时候只创建实例,快速返回cell
,不绑定数据。在willDisplayCell: forRowAtIndexPath:
的时候绑定数据(赋值)。
高度缓存
在tableView
滑动时,会不断调用heightForRowAtIndexPath:
,当 cell
高度需要自适应时,每次回调都要计算高度,会导致 UI 卡顿。为了避免重复无意义的计算,需要缓存高度。
怎么缓存?
- 字典,NSCache。
- UITableView-FDTemplateLayoutCell
视图层级优化
不要动态创建视图
- 在内存可控的前提下,缓存
subview
。 - 善用
hidden
。
减少视图层级
- 减少
subviews
个数,用layer
绘制元素。 - 少用
clearColor
,maskToBounds
,阴影效果等。
减少多余的绘制操作
图片
- 不要用
JPEG
的图片,应当使用PNG
图片。 - 子线程预解码(
Decode
),主线程直接渲染。因为当image
没有Decode
,直接赋值给imageView
会进行一个Decode
操作。 - 优化图片大小,尽量不要动态缩放(
contentMode
)。 - 尽可能将多张图片合成为一张进行显示。
减少透明 view
使用透明view
会引起blending
,在iOS
的图形处理中,blending
主要指的是混合像素颜色的计算。最直观的例子就是,我们把两个图层叠加在一起,如果第一个图层的透明的,则最终像素的颜色计算需要将第二个图层也考虑进来。这一过程即为Blending
。
会导致blending
的原因:
-
UIView
的alpha
<1
。 -
UIImageView
的image
含有alpha channel
(即使UIImageView
的alpha
是1
,但只要image
含有透明通道,则仍会导致blending
)。
为什么blending
会导致性能的损失?
原因是很直观的,如果一个图层是不透明的,则系统直接显示该图层的颜色即可。而如果图层是透明的,则会引起更多的计算,因为需要把另一个的图层也包括进来,进行混合后的颜色计算。
-
opaque
设置为YES
,减少性能消耗,因为GPU
将不会做任何合成,而是简单从这个层拷贝。
减少离屏渲染
离屏渲染指的是在图像在绘制到当前屏幕前,需要先进行一次渲染,之后才绘制到当前屏幕。
OpenGL
中,GPU
屏幕渲染有以下两种方式:
On-Screen Rendering
即当前屏幕渲染,指的是GPU
的渲染操作是在当前用于显示的屏幕缓冲区中进行。Off-Screen Rendering
即离屏渲染,指的是GPU
在当前屏幕缓冲区以外新开辟一个缓冲区进行渲染操作。
为什么离屏渲染会发生卡顿?主要包括两方面内容:
- 创建新的缓冲区。
- 上下文切换,离屏渲染的整个过程,需要多次切换上下文环境(
CPU
渲染和GPU
切换),先是从当前屏幕(On-Screen)切换到离屏(Off-Screen);等到离屏渲染结束以后,将离屏缓冲区的渲染结果显示到屏幕上又需要将上下文环境从离屏切换到当前屏幕。而上下文环境的切换是要付出很大代价的。
设置了以下属性时,都会触发离屏渲染:
layer.shouldRasterize
,光栅化layer.mask
,遮罩layer.allowsGroupOpacity
为YES
,layer.opacity
的值小于1.0
layer.cornerRadius
,并且设置layer.masksToBounds
为YES
。可以使用剪切过的图片,或者使用layer
画来解决。-
layer.shadows
,(表示相关的shadow开头的属性),使用shadowPath
代替。两种不同方式来绘制阴影: 不使用
shadowPath
使用
shadowPath
性能差别,如下图:
离屏渲染的优化建议
- 使用
ShadowPath
指定layer
阴影效果路径。 - 使用异步进行
layer
渲染(Facebook
开源的异步绘制框架AsyncDisplayKit
)。 - 设置
layer
的opaque
值为YES
,减少复杂图层合成。 - 尽量使用不包含透明(
alpha
)通道的图片资源。 - 尽量设置
layer
的大小值为整形值。 - 直接让美工把图片切成圆角进行显示,这是效率最高的一种方案。
- 很多情况下用户上传图片进行显示,可以在客户端处理圆角。
- 使用代码手动生成圆角
image
设置到要显示的View
上,利用UIBezierPath
(Core Graphics
框架)画出来圆角图片。
合理使用光栅化 shouldRasterize
光栅化是把GPU
的操作转到CPU
上,生成位图缓存,直接读取复用。
优点:
-
CALayer
会被光栅化为bitmap
,shadows
、cornerRadius
等效果会被缓存。
缺点:
- 更新已经光栅化的
layer
,会造成离屏渲染。 -
bitmap
超过100ms
没有使用就会移除。 - 受系统限制,缓存的大小为 2.5X Screen Size。
shouldRasterize
适合静态页面显示,动态页面会增加开销。如果设置了shouldRasterize
为 YES
,那也要记住设置rasterizationScale
为contentsScale
。
异步渲染
在子线程绘制,主线程渲染。例如 VVeboTableViewDemo
理性使用-drawRect:
大家或许感到奇怪,有不少开发者在发有关性能优化的博客当中指出使用-drawRect:
来优化性能。但是我这里不太建议大家未经思考的使用-drawRect:
方法。原因如下:
当你使用UIImageView
在加载一个视图的时候,这个视图虽然依然有CALayer
,但是却没有申请到一个后备的存储,取而代之的是使用一个使用屏幕外渲染,将CGImageRef
作为内容,并用渲染服务将图片数据绘制到帧的缓冲区,就是显示到屏幕上,当我们滚动视图的时候,这个视图将会重新加载,浪费性能。所以对于使用-drawRect:
方法,更倾向于使用CALayer
来绘制图层。因为使用CALayer
的-drawInContext:
,Core Animation
将会为这个图层申请一个后备存储,用来保存那些方法绘制进来的位图。那些方法内的代码将会运行在 CPU
上,结果将会被上传到GPU
。这样做的性能更为好些。
静态界面建议使用-drawRect:
的方式,动态页面不建议。
按需加载
- 局部刷新,刷新一个
cell
就能解决的,坚决不刷新整个section
或者整个tableView
,刷新最小单元元素。 - 利用
runloop
提高滑动流畅性,在滑动停止的时候再加载内容,像那种一闪而过的(快速滑动),就没有必要加载,可以使用默认的占位符填充内容。
关于性能测试
在出现图像性能问题,滑动,动画不够流畅之后,我们首先要做的就是定位出问题的所在。而这个过程并不是只靠经验和穷举法探索,我们应该用有脉络,有顺序的科学的手段进行探索。
首先,我们要有一个定位问题的模式。我们可以按照这样的顺序来逐步定位,发现问题。
- 定位帧率,为了给用户流畅的感受,我们需要保持帧率在
60
帧左右。当遇到问题后,我们首先检查一下帧率是否保持在60
帧。 - 定位瓶颈,究竟是
CPU
还是GPU
。我们希望占用率越少越好,一是为了流畅性,二也节省了电力。 - 检查有没有做无必要的
CPU
渲染,例如有些地方我们重写了drawRect:
,而其实是我们不需要也不应该的。我们希望GPU
负责更多的工作。 - 检查有没有过多的离屏渲染,这会耗费
GPU
的资源,像前面已经分析的到的。离屏渲染会导致GPU
需要不断地onScreen
和offscreen
进行上下文切换。我们希望有更少的离屏渲染。 - 检查我们有无过多的
Blending
,GPU
渲染一个不透明的图层更省资源。 - 检查图片的格式是否为常用格式,大小是否正常。如果一个图片格式不被
GPU
所支持,则只能通过CPU
来渲染。一般我们在iOS
开发中都应该用PNG
格式,之前阅读过的一些资料也有指出苹果特意为PNG
格式做了渲染和压缩算法上的优化。 - 检查是否有耗费资源多的
View
或效果,我们需要合理有节制的使用。 - 最后,我们需要检查在我们
View
层级中是否有不正确的地方。例如有时我们不断的添加或移除View
,有时就会在不经意间导致bug
的发生。
测试工具:
-
Core Animation
,Instruments
里的图形性能问题的测试工具。 -
view debugging
,Xcode 自带的,视图层级。 -
reveal
,视图层级。
参考文章
- 绘制像素到屏幕上
-
iOS图形原理与离屏渲染,在1.4.1中,
这也是为什么 CALayer 有一个叫做 opaque 的属性了。如果这个属性为 NO,GPU 将不会做任何合成,而是简单从这个层拷贝,不需要考虑它下方的任何东西(因为都被它遮挡住了)。
中的opaque
属性为NO
,GPU
将不会做任何合成,这句话时错误的,应该是为YES
,GPU
才不会做任何合成。 - iOS 保持界面流畅的技巧
- Advanced Graphics and Animations for iOS Apps(session 419)
- 使用 ASDK 性能调优 - 提升 iOS 界面的渲染性能
- Designing for iOS: Graphics & Performance
- iOS离屏渲染之优化分析
- iOS视图渲染以及性能优化总结
- iOS 离屏渲染
- 深刻理解移动端优化之离屏渲染
- iOS 流畅度性能优化、CPU、GPU、离屏渲染
- iOS 图形性能优化锦集
- 离屏渲染优化详解:实例示范+性能测试
作者:LaiYoung_
链接:https://juejin.im/post/5ace078cf265da23994ee493
来源:掘金
著作权归作者所有。商业转载请联系作者获得授权,非商业转载请注明出处。