崗位職責:
大數據平臺運維管理:負責云端數據中心底層鏈路規劃、部署建設,確保數據中心的基礎設施穩定可靠。
數據鏈路和服務監控:負責數據鏈路、服務監視運維,進行性能調優和故障排查,同時撰寫相關資料輸出。
監控治理與用戶對接:負責云端數據中心監視治理、高級功能業務運維,保證系統的高可用性,及時處理用戶反饋和需求。
數據處理與調度管理:維護和優化大數據產品的ETL流程、數據調度任務,保證數據處理任務的高效執行。
系統自動化管理:編寫和維護自動化運維腳本,提升系統管理效率。
資源調配與容量規劃:根據業務需求進行資源規劃和調配,合理利用集群資源,保證系統性能。
問題解決與故障恢復:及時發現并解決系統運行中的問題,快速響應緊急故障并提供恢復方案。
日志分析與性能優化:通過日志分析、監控數據等手段,對系統進行性能分析和優化。
協作與技術支持:與開發團隊和數據分析團隊協作,提供技術支持,推動產品迭代和改進。
文檔編寫與知識管理:編寫和維護運維相關文檔,整理技術方案與常見問題處理方法。
招聘條件:
工作經驗:兩年以上大數據產品(數據庫、大數據等)運維工作經驗。
技術能力:
熟練掌握主流數據庫產品、大數據產品的運行原理。
熟悉相關編程語言,熟悉至少一種Linux操作系統版本,能夠看懂簡單的Shell或Python腳本。
熟悉至少一種大數據產品(如Hadoop、Spark等)的部署、調優、升級擴容、性能監控等。
運維技能:
熟練掌握大數據產品整體監視鏈路及運維流程,能夠進行熟練部署。
能夠對故障類問題進行快速定位排查并解決。
客戶需求優化:根據客戶的具體業務需求,配合完成相關數據產品的優化工作。
軟技能:具備責任心、良好的溝通能力、學習能力及團隊合作能力,具有很好的客戶服務意識。