SRE_ Google运维解密

# 第IV部分 管理

SRE_ Google运维解密

SRE_ Google运维解密

#系统可用性时间表

SRE_ Google运维解密

# 专用术语

SLO:服务等级目标

LCE(Land-Covered Earth):紧急检修登陆艇

# 紧急事故管理

SRE_ Google运维解密

SRE_ Google运维解密

SRE_ Google运维解密

SRE_ Google运维解密

一次流程管理良好的事故

SRE_ Google运维解密

SRE_ Google运维解密

# 东西早晚要坏的,这就是生活

# 值得警惕的是,理解一个系统应该如何工作并不能使人成为专家。只能靠调查系统为何不能正常工作才行。

--Brian Redman

# 系统正常,只是该系统无数 异常情况下的一种特例。

--John Allspaw

SRE_ Google运维解密

SRE_ Google运维解密

SRE_ Google运维解密

上一篇:Struts2 源码分析——拦截器的机制


下一篇:模拟Struts2框架Action的实现