系统运维日常工作有哪些,应该具备哪些技能

一、日常工作内容:

1
2
3
4
5
6
7
8
9
10
11
12
1、看监控、网站流量,CDN流量,看邮件有没有普通业务监控报警,看邮件中有没其他需要做的工作
2、处理报警,查看报警的原因,和开发一起解决,并且尽量找出避免再次发生的方法,例如添加一些
定时清理脚本
3、处理发布,基本都是自动化,但是总有发布不成功或者需要回滚的时候,这时候就需要手工介入,
找到原因,并跟开发一起讨论最后是否撤销还是重上
4、日常一起能够自动化的工作尽量找到自动化的方法
5、配合开发搭建测试环境,线上环境,上线代码,以及日常开个权限
6、定期机房巡检
7、灾备演练计划
8、运维流程的设定与标准化
9、运维知识库文档的建立
10、新技术的学习与研究

二、运维应该具备哪些技能:

1
2
3
4
5
6
7
8
9
10
11
12
1、了解运维技术的分类:赵班长写的运维知识体系:https://www.unixhot.com/page/ops 
2、熟悉常见Linux系统(以CentOS/Redhat为主)和故障处理;
3、熟练shell脚本,熟悉php、perl、python、ruby等至少一种开发语言;
4、熟悉常见应用服务(如:Nginx、Tomcat、HAProxy、Redis、RabbitMQ等)的配置维护
及优化(比如NGINX代理,负载均衡);
5、熟悉MySQL数据库的部署配置和优化(读写分析,负载均衡,分布式数据库);
6、熟悉任意一种自动化管理工具的使用(如:SaltStack、Puppet或Ansible等);
7、熟悉任意一种常见监控系统的使用(如:Zabbix、Nagions、Ganglia);
8、了解基本的网络知识;
9、对常见对云服务有一定了解,有过阿里云、亚马逊等云主机维护经验者
优先。
10、熟悉各种虚拟化技术,比如 KVM、XEN等。并有在虚拟化平台上面维护或开发的经验










本文转自 冰冻vs西瓜 51CTO博客,原文链接:http://blog.51cto.com/molewan/1936482,如需转载请自行联系原作者
上一篇:自助Linux之问题诊断工具strace


下一篇:Rackspace采用Splunk技术 下一步瞄准机器学习