1. 運維工程師 職責
崗位職責
1. 負責IDC機房Linux業務伺服器的配置,維護,監控,調優,故障排除等;
2. 大用戶量下高性能伺服器系統部署方案的制定及實施;
3. 保障伺服器與資料庫安全,檢查並消除安全漏洞;
4. 數據備份、數據監控、應急響應、故障排除、編寫數據分析報告等;
任職要求
1. 2年以上大中型在線系統運維工作經驗、精通Linux系統及常見服務的安裝配置,熟悉常見的負載均衡實現方案並有實際實施經驗;
2. 精通Linux系統如Redhat、Gentoo、精通Apache、NginX、MySQL、FTP、DNS、Squid等常用服務的安裝、配置和維護;
3. 精通和靈活運用1種以上的腳本語言,包括:Shell、PERL、PHP、Python等;
4. 能夠熟練排查運維過程中出現的服務故障、系統故障、網路故障;
5. 高度的責任感,較強的故障分析及排除能力,善於在工作中學習,能夠承受工作壓力;
6. 優先考慮:精通LAMP架構,熟悉PHP,有相關大中型在線系統開發及維護經驗;
2. 運維工程師的工作內容
在軟體產品的整個生命周期中運維工程師都需要適時地參與並發揮不同得作用,因此運維工程師的工作內容和方向非常多: 事件管理:目標是在服務出現異常時盡可能快速的恢復服務,從而保障服務的可用性;同時深入分析故障產生的原因,推動並修復服務存在的問題,同時設計並開發相關的預案以確保服務出現故障時可以高效的止損。在這方面主要工作內容有: 問題發現:設計並開發高效的監控平台和告警平台,使用機器學習、大數據分析等方法對系統中的大量監控數據進行匯總分析,以期在系統出現異常的時候可以快速的發現問題和判斷故障的影響。 問題處理:設計並開發高效的問題處理平台和工具,在系統出現異常的時候可以快速/自動決策並觸發相關止損預案,快速恢復服務。 問題跟蹤:通過分析問題發生時系統的各種表現(日誌、變更、監控)確定問題發生的根本原因,制定並開發預案工具。 變更管理:以可控的方式,盡可能高效的完成產品功能的迭代的變更工作。在這方面運主要工作內容有: 配置管理:通過配置管理平台(自研、開源)管理服務涉及到的多個模塊、多個版本的關系以及配置的准確性。 發布管理:通過構建自動化的平台確保每一次版本變更可以安全可控地發布到生產環境。 容量管理:在服務運行維護階段,為了確保服務架構部署的合理性同時掌握服務整體的冗餘,需要不斷評估系統的承載能力,並不斷優化之。在這方面主要工作內容有: 容量評估:通過技術手段模擬實際的用戶請求,測試整個系統所能承擔的最大吞吐;通過建立容量評估模型分析壓力測試過程中的數據以評估整個服務的容量。 容量優化:基於容量評估數據,判斷系統的瓶頸並提供容量優化的解決方案。比如通過調整系統參數、優化服務部署架構等方法來高效的提升系統容量。 架構優化:為了支持產品的不斷迭代,需要不斷的進行架構優化調整。以確保整個產品能夠在功能不斷豐富和復雜的條件下,同時保持高可用性。
3. 運維工程師的工作內容有哪些
一: 運維工程師要保證線上系統地穩定,這是運維人員的核心價值 ,圍繞這個展開,是一個非常大的話題,後面細化
二:基礎建設:安全,質量,效率,成本 是運維人員可以展開運維工作的四大方面。圍繞著這四個方面,我們需要制定規范,流程,建設對應的系統保證效率,標准化提升效率等等
質量: 立體化監控系統;測速,備份容災等等
效率: 提升運維效率的系統建設,標准化機器初始化,軟體安裝標准化,監控標准化等等,提升效率,批量部署腳本等等
安全:互聯網安全,系統支持,cgi掃描等等
成本:預算制定等等,合理優化部署,平衡成本與體驗
三:基礎建設升華:一切以用戶價值為依歸
1:異地部署 ,異地容災
2:柔性可用 ,柔性可損
3:全網調度 ,實現成本與 用戶體驗的平衡
4:優化用戶體驗:提升速度
四:從一個項目上看運維人員的工作分解
1:項目初期介入,提對應運維需求,需要運維工程師預計運營時可能需要的數據,可以從兩個方向考慮:A監控;B評估系統好壞的運維指標,如介面調用數據,用戶訪問速度等等,提出對應需求,開發在設計時實現,方便上線後運維採集這些數據做系統評估。 這個階段要了解系統架構,評估運維上是否合理。是否方便部署,運維風險有哪些,從哪些層面可以避免,做好容災,cache數據丟數,db down掉等的評估以及應對方案設計,全網調度方案等。
2:項目開發階段,這個階段運維也要參與其中,了解對應運維需求開發的完成情況
3:項目測試發布: 運維負責運營環境的搭建,發布上線,並監控線上系統穩定
4:項目發布後:保證對應監控,備份,容災等對應工作完成
5:項目運營階段:及時對告警進行處理,對系統發展趨勢做好評估,擴容等,預估可能的運營風向,並做好對應的應對措施
6:相關演習
7:做好系統優化,提升用戶體驗
五:從運維人員面對的周邊角色做 運維人員的工作分解
1:上游戰略依從:理解公司發展方向,調整運營戰略
2;開發
3:測試
4:QA
5:老闆等
4. 基礎運維工程師的崗位職責有哪些
一:運維工程師崗位職責
1、參與設計、審核、優化公司IT系統以及各應用系統的體系架構;
2、全面負責公司運維項目的系統升級、擴容需求與資源落實,配合開發需求,測試、調整運維平台;
3、負責網路以及伺服器的網路設置、維護和優化、網路的安全監控、系統性能管理和優化、網路性能管理和優化;
4、建立面向開發部門,業務部門的服務流程和服務標准;
5、負責IT運維相關流程的規劃、設計、推行、實施和持續改進;
6、負責內部分派下發,對實施結果負責。
7、負責日常網路及各子系統管理維護。
8、負責設計並部署相關應用平台,並提出平台的實施、運行報告。
9、負責配合開發搭建測試平台,協助開發設計、推行、實施和持續改進。
10、負責相關故障、疑難問題排查處理,編制匯總故障、問題,定期提交匯總報告。
11、負責網路監控和應急反應,以確保網路系統有7*24小時的持續運作能力。
12、負責日常系統維護,及監控,提供IT軟硬體方面的服務和支持,保證系統的穩定。
二:運維工程師崗位職責
1、負責數據中心日常巡檢工作,並根據要求形成相關統計報告。
2、每周按照要求製作機房運行參數等的統計分析。
3、能夠部署相關的操作系統(windows、linux)以及一些基本服務,例如AD、DNS、DHCP、AAA、IIS、文件系統等。
4、能夠配置交換機的基礎配置(MSTP、RSTP、主從VLAN、動態VLAN等基礎配置)
5、路由協議(靜態、RIP、ospf路由)。
6、了解防火牆的工作原理,能夠進行簡單的策略下發。