运维
This is the content of my super blog post.
论运维工作
运维自动化发展的几个过程
第一:环境统一化
有的时候运维出了问题会出现手忙脚乱的情况,这大部分是由于业务环境杂乱导致,当然,由你一手缔造的环境你可能清楚,可大部分运维都是接手别人的工作,这时候环境杂乱无章,无疑会给新入职的运维人员很大的困扰,运维入职第一点基本都是先梳理线上环境,其实可以用新入职运维上手时间来衡量你的环境是否统一
- web项目家目录
- 数据目录
- 程序目录
- 日志目录
- 机器信息目录
- 脚本工具目录
- pid目录
- 登录方式
- 软件包目录
第二:业务脚本化,文档化
- 系统安全:通过脚本修改或打开机器的防火墙,进行快速的安全部署,批量更改机器密码,key
- 数据备份:通过脚本实现程序,数据的定时备份
- 过期数据,日志清理:脚本清理机器的废物数据,过期日志
- 处理事故记录:每次大大小小的事故处理完后进行文档记录,提交git、svn,提高下次问题出现处理速度,文档要求,其他运维看着文档可以完成一次故障处理
- 通过脚本来完成线上代码快速更新,避免人工操作失误
- 服务搭建记录:搭建服务记录文档,保证下次搭建统一化,快速化
第三:页面化
其实当你的环境统一,文档规范,脚本高效的情况下,页面化就呼之欲出了,无论是采用开源工具,亦或是自己开发,都是来调用自己的脚本,读自己的数据中心,运维的管理工具鉴于运维人员并不是人人都具有开发功底,并且业务多变,脚本多变的原因所在,应该尽量的避免运维工具掺杂业务逻辑,只处理连接机器,发送处理请求即可,而业务逻辑都是通过页面快速添加修改脚本来完成。
第四:服务化
当你完成以上三点的时候,相信你已经不再满足每次去帮开发准备nginx,mysql机器了,哪怕仅仅是通过页面进行点击,这时候我们需要做到业务服务化,所有环境皆集群,我们需要做的仅仅是扩展并完善我们的集群,而不是搭建新的环境
运维部门发展
- 构造稳定的运维环境:做好监控,第一时间发现问题,自愈问题,构造高可用,高负载集群。(自我工作的完善)
- 写博客,写文档,做演示,展示我们的劳动成果(劳动成果的展示)
- 权限申请自动化, 线上环境规则制定,公司统一的基础信息库等(运维产出)
- 做日志采集平台,运维自动化平台,监控平台(监控电子屏)等(运维产出)
- 工具开源化(运维产出)
未完待续