《运维分析报告.pptx》由会员分享,可在线阅读,更多相关《运维分析报告.pptx(16页珍藏版)》请在第壹文秘上搜索。
1、运维报告运维报告CONT ENTS背景介绍分析流程数据分析归纳总结背景介绍项目信息及意义运维岗位及分工目前台内音频制作与播出系统已由原来单一的音频制作播出网,转变为涵盖音频制作、录播播出、直播播出、备份播出等4大功能网的综合业务系统,范围涉及音频节目制播网络、节目制作终端、制作/播出服务器等核心技术环节及系统,其维护流程复杂,关键节点众多。此项目为完善系统运维机制,增强音频制播系统技术运维的综合保障能力,为传播技术支撑系统建设提供坚实、优质、可靠的技术保障。项目信息及意义4运维岗位及分工5目前应急维护值班采用12724的方式进行,其中12代表12个月,7代表每周一至周日,24代表每日24小时;
2、维护人员按照每日2班(白班:8点30分20点30分,晚班:20点30分次日8点30分),每班次1人,共5个班组进行轮换值班。分析流程分析流程7从故障区域方面着手,进行数据分析故障区域从故障类型方面进行分析,找出运维重点故障类型从故障点方面分析,定位具体故障及运维方法故障点数据分析故障区域统计故障类型统计故障点统计数据分析故障区域统计9 由图可知,故障频发的区域主要分布在节目制作终端方面。数据分析故障类型统计10 由下图可见,播出应急与恢复和终端与服务器两种事件类型所成比例在整体运维工作可控的良好范围内。数据分析故障点统计11 由数据可见,后台服务器运行基本稳定,故障问题多发于终端以及编辑使用终
3、端的操作上,还有一些日常的网络问题比较频发。归纳总结问题发现解决办法未来规划问 题发现13 问题 受疫情影响,系统运行中不确定因素变多 问题 部分在线服务器运行时间较长,硬盘故障频发,硬件出现老化影响系统性能 问题 个别工程师处理问题的效率较低,问题中重复性工作较多解决 方法14 方法及时发现隐患,积极主动的去排除风险,有效的控制和避免不良事故的发生 方法加强员工素质的培养,多进行应急演练及模拟故障训练 方法采购新硬件,对老旧设备进行有序的替换 方法对客户进行针对有效的培训,减少运维工作中的重复性工作未来规划15 建议在系统中引进部分自动化运维工具,解放人力,更专注于管理和思考上,减少重复性工作,进而提高运维工作效率,减少人为因素的干预,可以有效的控制和避免不良事故的发生。 计划谢谢观看!