1. 运维工程师 职责
岗位职责
1. 负责IDC机房Linux业务服务器的配置,维护,监控,调优,故障排除等;
2. 大用户量下高性能服务器系统部署方案的制定及实施;
3. 保障服务器与数据库安全,检查并消除安全漏洞;
4. 数据备份、数据监控、应急响应、故障排除、编写数据分析报告等;
任职要求
1. 2年以上大中型在线系统运维工作经验、精通Linux系统及常见服务的安装配置,熟悉常见的负载均衡实现方案并有实际实施经验;
2. 精通Linux系统如Redhat、Gentoo、精通Apache、NginX、MySQL、FTP、DNS、Squid等常用服务的安装、配置和维护;
3. 精通和灵活运用1种以上的脚本语言,包括:Shell、PERL、PHP、Python等;
4. 能够熟练排查运维过程中出现的服务故障、系统故障、网络故障;
5. 高度的责任感,较强的故障分析及排除能力,善于在工作中学习,能够承受工作压力;
6. 优先考虑:精通LAMP架构,熟悉PHP,有相关大中型在线系统开发及维护经验;
2. 运维工程师的工作内容
在软件产品的整个生命周期中运维工程师都需要适时地参与并发挥不同得作用,因此运维工程师的工作内容和方向非常多: 事件管理:目标是在服务出现异常时尽可能快速的恢复服务,从而保障服务的可用性;同时深入分析故障产生的原因,推动并修复服务存在的问题,同时设计并开发相关的预案以确保服务出现故障时可以高效的止损。在这方面主要工作内容有: 问题发现:设计并开发高效的监控平台和告警平台,使用机器学习、大数据分析等方法对系统中的大量监控数据进行汇总分析,以期在系统出现异常的时候可以快速的发现问题和判断故障的影响。 问题处理:设计并开发高效的问题处理平台和工具,在系统出现异常的时候可以快速/自动决策并触发相关止损预案,快速恢复服务。 问题跟踪:通过分析问题发生时系统的各种表现(日志、变更、监控)确定问题发生的根本原因,制定并开发预案工具。 变更管理:以可控的方式,尽可能高效的完成产品功能的迭代的变更工作。在这方面运主要工作内容有: 配置管理:通过配置管理平台(自研、开源)管理服务涉及到的多个模块、多个版本的关系以及配置的准确性。 发布管理:通过构建自动化的平台确保每一次版本变更可以安全可控地发布到生产环境。 容量管理:在服务运行维护阶段,为了确保服务架构部署的合理性同时掌握服务整体的冗余,需要不断评估系统的承载能力,并不断优化之。在这方面主要工作内容有: 容量评估:通过技术手段模拟实际的用户请求,测试整个系统所能承担的最大吞吐;通过建立容量评估模型分析压力测试过程中的数据以评估整个服务的容量。 容量优化:基于容量评估数据,判断系统的瓶颈并提供容量优化的解决方案。比如通过调整系统参数、优化服务部署架构等方法来高效的提升系统容量。 架构优化:为了支持产品的不断迭代,需要不断的进行架构优化调整。以确保整个产品能够在功能不断丰富和复杂的条件下,同时保持高可用性。
3. 运维工程师的工作内容有哪些
一: 运维工程师要保证线上系统地稳定,这是运维人员的核心价值 ,围绕这个展开,是一个非常大的话题,后面细化
二:基础建设:安全,质量,效率,成本 是运维人员可以展开运维工作的四大方面。围绕着这四个方面,我们需要制定规范,流程,建设对应的系统保证效率,标准化提升效率等等
质量: 立体化监控系统;测速,备份容灾等等
效率: 提升运维效率的系统建设,标准化机器初始化,软件安装标准化,监控标准化等等,提升效率,批量部署脚本等等
安全:互联网安全,系统支持,cgi扫描等等
成本:预算制定等等,合理优化部署,平衡成本与体验
三:基础建设升华:一切以用户价值为依归
1:异地部署 ,异地容灾
2:柔性可用 ,柔性可损
3:全网调度 ,实现成本与 用户体验的平衡
4:优化用户体验:提升速度
四:从一个项目上看运维人员的工作分解
1:项目初期介入,提对应运维需求,需要运维工程师预计运营时可能需要的数据,可以从两个方向考虑:A监控;B评估系统好坏的运维指标,如接口调用数据,用户访问速度等等,提出对应需求,开发在设计时实现,方便上线后运维采集这些数据做系统评估。 这个阶段要了解系统架构,评估运维上是否合理。是否方便部署,运维风险有哪些,从哪些层面可以避免,做好容灾,cache数据丢数,db down掉等的评估以及应对方案设计,全网调度方案等。
2:项目开发阶段,这个阶段运维也要参与其中,了解对应运维需求开发的完成情况
3:项目测试发布: 运维负责运营环境的搭建,发布上线,并监控线上系统稳定
4:项目发布后:保证对应监控,备份,容灾等对应工作完成
5:项目运营阶段:及时对告警进行处理,对系统发展趋势做好评估,扩容等,预估可能的运营风向,并做好对应的应对措施
6:相关演习
7:做好系统优化,提升用户体验
五:从运维人员面对的周边角色做 运维人员的工作分解
1:上游战略依从:理解公司发展方向,调整运营战略
2;开发
3:测试
4:QA
5:老板等
4. 基础运维工程师的岗位职责有哪些
一:运维工程师岗位职责
1、参与设计、审核、优化公司IT系统以及各应用系统的体系架构;
2、全面负责公司运维项目的系统升级、扩容需求与资源落实,配合开发需求,测试、调整运维平台;
3、负责网络以及服务器的网络设置、维护和优化、网络的安全监控、系统性能管理和优化、网络性能管理和优化;
4、建立面向开发部门,业务部门的服务流程和服务标准;
5、负责IT运维相关流程的规划、设计、推行、实施和持续改进;
6、负责内部分派下发,对实施结果负责。
7、负责日常网络及各子系统管理维护。
8、负责设计并部署相关应用平台,并提出平台的实施、运行报告。
9、负责配合开发搭建测试平台,协助开发设计、推行、实施和持续改进。
10、负责相关故障、疑难问题排查处理,编制汇总故障、问题,定期提交汇总报告。
11、负责网络监控和应急反应,以确保网络系统有7*24小时的持续运作能力。
12、负责日常系统维护,及监控,提供IT软硬件方面的服务和支持,保证系统的稳定。
二:运维工程师岗位职责
1、负责数据中心日常巡检工作,并根据要求形成相关统计报告。
2、每周按照要求制作机房运行参数等的统计分析。
3、能够部署相关的操作系统(windows、linux)以及一些基本服务,例如AD、DNS、DHCP、AAA、IIS、文件系统等。
4、能够配置交换机的基础配置(MSTP、RSTP、主从VLAN、动态VLAN等基础配置)
5、路由协议(静态、RIP、ospf路由)。
6、了解防火墙的工作原理,能够进行简单的策略下发。