《数据中心典型运维组织架构及职责.docx》由会员分享,可在线阅读,更多相关《数据中心典型运维组织架构及职责.docx(7页珍藏版)》请在第壹文秘上搜索。
1、数据中心典型运维组织架构及职责专家远程技术支撑为现场运维团体提供技术支撑顾问服务,专家团队应涵盖暖通、电气、弱电及网络等相关专业人员。厂家支持数据中心与各相关重要厂家签订原厂维保合同,厂家提供维保及质保服务,按提供厂家产品技术服务热线,故障发生后在规定时效内到达现场。驻场运维团队提供日常巡检、故障处理、应急处理、机柜上下电、安全管理、设备管理、容量管理、工程随工、技术支撑、停送电操作、设备抢修、设备间设备设施除尘清洁等服务。通过值守维护服务保障数据中心安全稳定运行,实现客户服务水平SLA要求、提升能源利用效率。1、运维经理技能分类工作内容技能要求相关知识设备运维现场巡检1、指导现场巡检工作,编
2、制巡检班组要求。1、精通设备原理;2、具备管理能力;3、日常维护规程。业务支持1、审定各专业主管提出的改进方案;2、精通各专业工作流程和操作技术;3、审核各专业操作手册及各种方案;4、技术总负责。1、各业务流程;2、相关专业知识。定期维护1、审核各专业维护作业计划,监督维护及测试;1、精通设备原理;2、日常维护规程;3、仪器仪表的使用。性能分析与质量评估1、能够根据设备运行情况组织归总及分析运行质量,并进行评估改进;2、能够熟练掌握设备及系统性能参数统计分析方法。1、专业设备原理;2、相关维护流程。故障处理故障处理1、能够全面掌握故障处理流程,进行重大故障的处理;2、能够判断故障性质,并启动相
3、应预案;3、故障处理时管理运维各岗位人员协调工作。1、故障处理流程;2、专业设备原理;3、相关维护流程。故障分析1、能够掌握故障各项细节及参数并进行分析,形成故障报告;2、针对故障情况提出后期改进预案;3、监督故障处理后,后续的故隙分析、风险应对、方案跟进等工作。1、故障处理流程;2、系统原理;3、维护流程。预案管理1、监督预案的演练;2、能够根据系统运行情况,不断提出预案改进建议;3、能够对预案的实施进行跟踪评估。1、设备工作原理;2、各项预案。配置管理资源管理1、评估资源的使用情况;统筹制定资源调度方案。1、相关维护规程;2、资源调度流程。设备配置1、能够掌握专业设备的配置情况和性能、常用
4、及较复杂操作;2、根据实际情况能够熟练分派调度资源,调配相应资源;1、相关设备原理;2、仪器仪表的使用;3、设备维护规程。安全管理1、能够掌握机房安全常识并及时发现安全事故隐患;2、能够掌握通信保密常识。1、电气规章制度等;2、消防知识;3、安全生产知识。技术指导1、指导下级运维人员的日常维护工作;2、组织进行培训工作。1、沟通表达能力;2、其他专业知识。备品备件1、备品、备件及仪表的集中管理。2、分析备品备件及仪表使用情况,提出合理配置方案。1、专业硬件知识;2、相关系统知识。文档管理1、能够基本掌握备品备件及仪表的资料情况;2、能够了解机房布线情况,设备位置及通信设备系统的具体设置;3、能
5、够基本掌握机房原始资料,开放资料,日常维护资料;4、能够对各专业资源的基础资料定期审核。1、维护规程;2、相关设备知识;3、写作知识。2、技术主管技能分类工作内容技能要求相关知识设备运维现场巡检1、能够组织并监督设备定期巡检工作,完成设备定期巡检工作,发现并处理问题;2、熟悉专业设备运行环境,能完成专业设备消耗类备件的更换工作。1、精通设备原理;2、日常维护规程。业务支持1、精通专业所涉及设备相关指标和测试方法,提出测试改进方案;2、精通本专业工作流程和操作技术;3、能编写和审定专业操作手册及各种方案。4、带领运维值班人员进行相应维护工作。5、能够按照前端、监控等部门要求,制定分析各类报表。1
6、、各业务流程;2、相关专业知识。定期维护1、定制维护作业计划,能带领运维人员进行专业维护测试;2、精通所维护设备的维护技术指标要求;3、精通常用仪器仪表的使用。1、精通设备原理;2、日常维护规程;3、仪器仪表的使用。性能分析与质量评估1、能够根据设备运行情况组织调研并能够针对共性问题意见;2、能够熟练掌握设备及系统性能参数统计分析方法:3、精通本专业系统的核心技术,并能对相关系统功能的提级、改造提出合理的建议和有效的系统优化方案。1、专业设备原理;2、相关维护流程。故障处理故障处理1、能够掌握故隙处理流程,进行重大故障的处理;2、能够判断故障性质,并启动相应预案;3、能够对故障处理情况进行跟踪
7、分析,不断提出改进建议。1、故障处理流程;2、专业设备原理;3、相关维护流程。故障分析1、能够掌握故障各项细节及参数并进行分析,形成故障报告;2、针对故障情况提出后期改进预案。1、故障处理流程;2、网络及设备原理;3、维护流程。预案管理1、能够组织制定预案;2、能够根据系统运行情况,不断优化预案;1、设备工作原理;2、各项预案。3、能够对预案的实施进行跟踪评估。配置管理资源管理1、能够熟悉自身专业整个系统、设备资源使用情况;掌握系统构架;2、能够掌握各项资源的情况;在本专业范围内制定设备资源调度方案。1、相关维护规程;2、资源调度流程。设备配置1、能够掌握专业设备的配置情况和性能、常用及较复杂
8、操作;2、根据实际情况能够熟练分派调度资源,调配相应资源。1、相关设备原理;2、仪器仪表的使用;3、设备维护规程。安全及备件管理工程管理1、及时掌握工程内容和要求,配合工程实施、监督工程质量;1、工程实施流程;2、机房管理规定;安全管理1、能够掌握机房安全常识并及时发现安全事故隐患;2、能够做到安全操作并及时处理一般安全故障;3、能够做到安全用电,注意防火;4、能够正确使用消防器材;5、能够掌握通信保密常识。1、电气规章制度等:2、消防知识;3、安全生产知识。技术指导1、指导下级运维人员的日常维护和故障处理;2、对下级运维人员进行维护和故障处理培训。1、沟通表达能力;2、其他专业知识。备品备件
9、1、备品、备件及仪表的集中管理。2、分析备品备件及仪表使用情况,提出合理配置方案。1、专业硬件知识;2、相关系统知识。文档管理1、能够基本掌握备品备件及仪表的资料情况;2、能够基本掌握机房原始资料,开放资料,日常维护资料;3、能够对相关专业资源的基础资料定期更新和审核。1、维护规程;2、相关设备知识;3、写作知识。3、运维工程师技能分类工作内容技能要求相关知识设备运维现场巡检1、能够完成定期巡检工作,能发现问题并做简单处理或按流程汇报;2、能够对基本监控记录软件进行操作。1、专业知识;2、规章制度;3、维护规程。业务支持1、熟悉监控系统的设置、使用,能够根据监控系统报警提示定位故障位置;2、能
10、够在专业主管指导下,对基础设施设备进行维护操作。1、专业知识;2、监控系统使用;3、业务流程。定期维护1、了解设备定期维护的操作流程;2、了解设备的工作原理及简单结构;3、能依照维护作业计划执行并配合完成各种维护测试。1、专业知识;2、日常维护规程;3、规章制度。性能分析与质量评估1、在专业主管指导下,能够利用常用的仪器仪表对设备进行测试;1、专业知识;2、仪表使用。故障处理故障处理1、能够定位常见故障;2、能够操作设备简单的应急操作(开关机等);3、在专业主管指导下能够更换简单备件。1、故障处理流程;2、分析方法;3、相关维护流程。故障分析1、能够根据监控系统的告警信息判断简单故障等级和类别
11、;1、专业知识;2、分析方法;3、仪表使用。预案管理1、发生重大突发事件时,能够按照应急预案进行故障处置。1、故障处理流程;2、各专业维护规程;3、应急流程。配置管理资源管理1、及时登记基础设施、设备,纳入资源管理系统。1、相关维护规程;2、资源记录。设备配置1、能够查找和定位设备位置;2、能够配合专业工程师工作。1、设备维护规程;2、相关设备知识。安全及备件管理工程配合1、能配合工程实施工作;2、反馈工程质量;1、专业知识;2、机房管理规定;3、验收规范。安全生产1、掌握安全常识、能够及时发现安全事故隐患,并能及时处理;2、能够做到安全操作、安全用电,注意防火、防潮;3、能够正确使用消防器材;4、掌握保密常识、遵守相关规定。1、电气规章制度等:2、消防知识;3、安全生产知识。备品备件1、熟悉现场的备品备件的管理。1、硬件知识;2、相关系统知识。文档管理1、能够了解数据中心原始资料,开放资料,日常维护资料;2、准确填写值班日志、故障记录并归档。1、维护规程;2、相关设备知识;3、写作知识。