本节书摘来自异步社区《IT运维之道》一书中的第3章,第3.5节,作者: * 更多章节内容可以访问云栖社区“异步社区”公众号查看。
3.5 贯穿始终的服务流程
IT运维的第四件要事是将服务流程贯穿于IT运维过程的始终。IT运维服务流程的核心流程包括:事件流程、问题流程、配置管理流程、变更流程、发布流程,如图3.4所示。
3.5.1 事件流程
事件是指IT系统运行中,发生的任何不符合标准操作且已经引起或可能引起服务中断和服务质量下降的IT系统故障。事件处理流程涉及许多IT部门和IT方面的专家。首先是服务热线,服务热线(一线)作为事件的受理责任人,确保首问负责制的流程在整个IT运维服务流程中贯穿实施。当服务热线不能解决发生的事故时,就将其转移给二线技术支持小组。二线技术支持人员首先需要提供临时性的解决办法或补救措施,以尽可能快地恢复服务,避免影响用户正常业务的开展。然后二线技术支持人员分析事件发生的原因,制定解决方案以彻底恢复服务和业务的正常运行。
https://yqfile.alicdn.com/3b3356a35c02a60937469440b57ad3b4b626ffdc.png" >
3.5.2 问题流程
问题是指存在某个未知的潜在原因导致一起或多起事件发生。问题经常是分析多个呈现相同症状的事件后发现的某种状态。问题也可以从单个重要的事件中确认一项错误。这种错误产生的原因虽然未知,但其产生的影响却可能非常严重。问题流程负责解决IT运维运营过程中遇到的所有问题。问题流程包括问题管理和问题控制,其目标在于将由于IT基础架构的错误而导致的问题和事件对业务产生的负面影响减小到最低,以防止与这些错误有关的事件再次发生。为了实现这个目标,问题流程调查分析事件的根本原因后采取有关行动改进或纠正这种状态。
3.5.3 配置管理流程
配置管理是指识别和确认IT系统的配置项,记录和报告配置项状态和变更请求,检验配置项的正确性和完整性等。配置管理流程就是有关如何管理和及时提供准确可靠的IT基础架构配置信息等活动构成的流程。配置管理不仅仅提供单个IT组件的信息,它还提供有关各个配置项之间关系的信息。这些信息是对IT系统故障影响程度分析的基础。配置管理流程负责记录有关IT基础架构的变更情况,监控IT组件状态,确保服务管理人员可以清楚地了解各个版本配置项的信息。
3.5.4 变更流程
变更是指在维护过程中对IT系统或服务所做的各种改变,包括增补、移除和其他修改。变更流程包括变更处理和变更控制,该流程旨在将有关变更对服务级别承诺中的运维服务绩效指标达成而产生的冲突和偏离减小到最低程度。变更流程的实施以变更请求、配置管理数据库和变更实施进度表为基础,经过登记变更请求、筛选和接受变更请求、确定优先级和归类变更请求、制定变更实施计划、实施变更、评价和终止变更、处理紧急变更和变更活动之后,产生变更管理报告等管理信息。
3.5.5 发布流程
发布流程是对经过测试后导入实际应用的新增或修改配置项进行分发和宣传的管理流程。发布流程涉及到已经定义的IT服务的变更,这些变更通过对一些新应用软件与升级硬件或新硬件的结合使用来完成。发布流程和变更流程、配置管理流程是紧密结合的,当新发布引起IT基础架构的变更时,配置管理数据可进行实时的更新,同时发布的内容也要保存到最终软件库中。