文本描述
一、总则
(一)、基本原则:明确责任、分级负责。按照“谁主管谁负责”的原则,建立和完善责任制度、协调管理机制和联动工作机制。根据部门职能,各司其职,落实到人,加强部门间的协调与配合,形成合力,共同履行应急处置工作的管理职责。
(二)、适用范围:本预案适用于史丹利化肥有限公司网络与信息系统故障的应急响应工作。
二、日常准备工作
(一)、软资源备用:对重要信息资源需要有足够备份,并将备份存放于攻击和灾害不能及的地方。
(二)、设备备用:在工作现场有主板、硬盘、光驱、网线等备件,以及备用的外部设备。
(三)、电源备用:配置不间断UPS电源。不间断电源可在断电后维持工作3小时以上。
(四)、重要或大型系统中的关键设备和信息安全产品采用双机热备份。
三、应急处理流程
信息管理科人员在监控过程中发现或收到其他部门反馈不能正常使用办公或业务应用系统等故障事件,相关软件、硬件的技术人员立即行动,初步查明原因(电力、服务器、存储、网络、应用系统软件等),并向科室、部门相关领导汇报。
部门领导在听取情况汇报后,根据事件的范围、影响和紧急程度启动相应的专题预案。如果没有相应的专题预案,要根据情况迅速采取措施抑制事件的扩散,恢复系统运行。
信息管理科尽快通过OA、电话、短信平台、网上销售系统网站等方式向各科室、各分厂下发《应用系统暂停通知》或公告。各部门、各分厂要做好信息系统出现故障后的应急安排,尽力减小对公司正常业务的影响。
信息管理科人员进一步落实故障原因,根据事件的范围、影响程度,采取应急措施,尽快恢复系统运行。
信息管理科在对系统完成修复后,在完成测试的基础上,经请示相关领导进行系统的启用,同时通过OA、网上销售系统网站、电话等向各部门、各分厂发布系统恢复公告。
四、事件分类
事件类型按照各种突发紧急事件的影响范围,将史丹利网络与信息系统事件分成全局事件(总公司核心信息系统因电力、网络、软硬件等故障原因,导致全厂信息系统无法正常工作)和区域事件(SAP、网上销售系统、OA、BO、用友等系统故障,导致局部范围内的业务工作无法正常进行)。
五、全局事件处理
(一)、总公司核心信息系统的外部电力中断、UPS故障等导致的大面积停电事件处理流程:
(二)、网络线路或网络设备故障导致的内外网中断故障处理流程:
(三)、服务器或其他机房设备发生的软硬件故障处理流程:
1、信息管理科人员立即到达事故现场,观察故障现象(操作系统情况、日志信息、硬件报警信息等),如果问题简单,则尝试恢复(对单机系统,尝试使用备用设备恢复)。
2、如果不能自行恢复,则进行电话报修,向厂家对故障情况等信息进行描述,请求厂家现场技术支持。
3、确定向厂家报修的受理回复,以及厂家工程师和故障备件到场时间。
4、信息管理科有关人员做好相关系统和数据备份及安全关机准备。
5、如果设备故障不能及时修复,应向各级相关领导汇报,并采取相应措施。
六、区域事件处理
(一)、SAP系统故障
1、信息管理科人员立即到达机房,检查服务器运转是否正常,初步分析故障原因,如果问题简单,则尝试恢复。
2、若故障短时间内无法排除,立即向部门领导汇报情况,同时在OA上发布SAP停机公告。
3、对受SAP影响的BO和网上销售系统同时停机维护,在网上销售系统网站上发布停机维护公告。
4、若只有一台服务器发生故障,则立即启用双机热备,将故障服务器上的服务切换至另一台服务器上,然后尽快对故障服务器进行检修。
5、若无法排除故障,及时联系外部顾问对服务器进行远程调试,在最短的时间内恢复服务器的正常运行。
6、系统故障排除测试无误后,重新开启服务,同时通过OA、网上销售系统网站、手机短信等途径发布系统恢复公告,告知各部门SAP、BO、网上销售系统可正常使用。
(二)、OA系统或短信平台故障
1、信息管理科人员立即到达机房,检查10.4服务器运转是否正常,初步分析故障原因,及时向领导汇报,如果问题简单,则尝试恢复。
2、若OA故障则通过电话、短信平台等发布停机公告,同时通知各部门使用电话、飞秋、QQ等通讯工具暂时替代OA进行业务联系。
3、若短信平台故障则通过OA、电话等通讯工具给业务员进行联系。
4、信息管理科技术人员尽快查找故障原因,排除故障。
5、故障排除后及时发布系统恢复公告。
(三)、网上销售系统故障
1、信息管理科人员立即到达机房,检查9.19和9.16服务器运转是否正常,初步分析故障原因,及时向领导汇报,如果问题简单,则尝试恢复。
2、若只有一台服务器出现故障,则通过OA和短信平台通知各销售公司和业务员通过另一台服务器进行登录。
3、若两台服务器同时出现故障,则通