文本描述
文档编号
XX_3_SYS_系统部日常安全监控管理规范
版 本 号
V1.
密 级
内部公开
系统部日常安全监控管理规范
XXX信息技术有限公司
文档信息
发布版本:V1.
最后发布时间:XX
编写人:XX
审核人:XX
版本控制
编号
修订人
修订时间
版本号
修订内容说明
目 录
第一章 目的
第二章 适用范围
第三章 职责与分工
第四章 监控分类
第五章 监控策略原则
第六章 机房环境监控策略
第七章 设备硬件监控策略
第八章 程序及进程监控策略
第九章 网络及线路监控策略 1
第十章 监控策略的实施 1
第十一章 维护与解释 1
目的
为有效保障XXX关键信息系统运行安全,及早发现事故隐患并处理,规范信息系统监控管理,特制定本程序。
适用范围
监控点是指各系统有可能出现故障的隐患点,包括硬件、软件、以及支持系统运行的基础环境。
本程序适用于本公司总部的硬件设备、应用程序,还包括机房环境、网络线路等的日常监控管理。
职责与分工
职责与分工
运营副总裁
负责批准本程序。
信息安全部
负责组织编制、审核本程序,检查并监督本程序执行情况,协调解决相关问题。
系统部:
网络工程师负责对公司硬件设备包括网络出口设备、核心交换机、路由器进行监控与日常维护;
系统工程师与数据库工程师负责对服务器、存储等情况进行监控和维护,同时,还包括对应用程序、机房环境、网络线路等的日常监控管理。
监控分类
关键系统监控对象可进行如下分类:
机房环境监控:包括机房温度监控、机房湿度监控、机房红外监控、机房烟雾监控、机房地面水浸监控、机房出入门禁监控、机房市电输入监控、空调运行情况、UPS运行情况等。
备注:本公司核心机房托管于世纪互联,机房环境监测由世纪互联的维护人员负责相关内容的日常监控,具体由IDC托管机房完善此项工作。
涉及到对XXX生产应用服务器、数据库服务器以及存储等设备,涵盖如下的重哟啊监控信息指标:设备硬件监控:包括服务器的负载情况、CPU利用率、内存使用率、交换空间的空闲率、硬盘使用率,以及涵盖了对硬件之间的I/O吞吐情况等。
涉及到XXX核心的应用程序需要完成如下的实际监控内容与性能指标:根据应用的等级进行划分,大致分为应用服务器JBOSS/CDN服务器/DB服务器等;其中,应用服务器监控需要涵括对应用组JBOSS以下重要指标:HTTP可用数监控、FreeMemory可用内存监控、ThreadBusy现成繁忙情况监控、ActiveThreadCount当前活动线程数监控、maxThreads最大线程数监控、Established建立连接数监控、Time_WAIT等待连接数监控等;包括前端应用程序、DB与后台服务程序需要记录当前DB2DS/DBSTATE的状态,完成数据库系统以及中间件程序的正常工作等。具体本文末尾的附件内部——《XXX运维监控管理列表》
网络通信和安全系统监控:包括局域网络、广域网络及互联网的监控,以及广域网线路和互联网接入线路的监控和安全系统监控等。
根据监控系统所发挥的监控作用可进行如下分类:
状态监控:指对监控点是否运行在正常状态的监控;
性能监控:指对监控点的性能和容量是否满足设定指标要求的