





关键词:浦东机场;标准化;配置管理数据库;自动运维
为了提升旅客在浦东机场使用相关服务时的体验,保障机场的安全稳定运营,在机场内部布设了大量的监控设备,来支撑一切突发事件的处理和解决,有助于旅客享受更加舒适的机场服务[1-3]。一旦出现监控平台运行故障或者存在运行效果不佳,则会极大地影响机场的安全运营和高效服务。然而,随着监控需求的增多,监控设备种类也从最开始的安全监控护大至服务监控等,现有监控系统目前已有超过1000个前端监控设备,基本覆盖了航站楼区域的出发、到达、行李、中转等重要区域,且仍有扩大的趋势。众所周知,监控系统平台连接的设备数量越多、种类越繁杂,出现故障的概率就会增高。据浦东机场监控设备维护维修记录显示,在现有设备量的前提下,监控设备日均出现故障频次约10次,严重影响了机场的高效运转。
1浦东机场IT运维监控平台
IT运维平台是配置管理数据库自建的综合监控运维管理平台,其运行目标是实现业务系统的集中监控、统一运维,规范和优化运维流程,进而获得最佳秩序和效益。值班主任负责查看并处理告警、派发故障工单、告警消除后现场确认。系统管理员负责添加、修改监控节点、日常系统巡检和维护。
运维的管理实践中充斥着大量重复性事务,人工处理报修流程繁杂漫长,一般需要经历故障发生、用户报修、SOCC接报、故障定位、故障排除和用户确认等环节,耗时费力,严重影响了机场的运行效率和服务效果[4-5]。IT运维平台可以实现运维的标准化,提高团队效率和快速梳理运维杂乱问题,如图1所示。
2IT运维监控平台建设目标
(1)以自動化的方式实现所有设备从5分钟级提升至秒级的轮询能力,极大地提升了基础设施运维监控的时间粒度,为监控预警精细化、故障告警及时性、运行态势感知能力奠定基础。
(2)通过自动识别、解析网络结构拓扑图,实现基于物理链路关系的网络故障关联分析,实现对网络设备运行故障的影响度分析和呈现,按设备所处层级、设备故障影响的下联设备的数量来分组展现故障节点,为运维值班人员和网络管理人员直接呈现设备的故障态势,快速判断故障的影响度,提升故障识别和定位的效率。
(3)通过视频监控系统自动化巡检功能定期巡检摄像机点位的工作状态,再由值班人员对巡检结果进行二次复核判断,作出相应的故障处理。该功能的实现,一方面大幅提升巡检效率(如发生大面积断电或者区域故障,便于事后进行整体检查,确保系统完好率),另一方面通过程序每日巡检再结合人工巡检互补即可形成有效监督,提升了前端设备的运行完好率,最终实现提升浦东机场视频监控系统的运维服务质量和效率。
(4)建设一体化、标准化的运维管理体系,实现统一运维平台的底层数据源建设,厘清数据源格式类型、运维数据量级、配置项关系信息。做好向四期延伸的准备,为四期新系统的建设提供开放和标准的API接口。
3IT运维监控平台存在的主要问题和优化方向
3.1监控平台存在的主要问题
随着平安城市、雪亮工程的持续推进,城市视频监控的数量越来越多,机场作为重点防控区域,安装监测设备的数量和密度均远高于其他区域。




