集团数据中心运维管理建设立项报告.docx
- 文档编号:10023367
- 上传时间:2023-05-23
- 格式:DOCX
- 页数:11
- 大小:95.61KB
集团数据中心运维管理建设立项报告.docx
《集团数据中心运维管理建设立项报告.docx》由会员分享,可在线阅读,更多相关《集团数据中心运维管理建设立项报告.docx(11页珍藏版)》请在冰点文库上搜索。
集团数据中心运维管理建设立项报告
数据中心运维管理建设立项报告
编写单位:
万数据服务有限公司
1项目背景
根据集团公司(以下简称)十二五规划中云计算建设的规划,在北京朝阳建立一个以系统大集中为目标的国际化先进水平的高等级大型数据中心,将的主要业务系统都集中部署在该数据中心,同时还将与石化数据中心、北京院数据中心互为灾备,主要承担ERP、加油站等系统的生产任务以及其他业务系统的异地灾备。
根据规划,数据中心建筑面积5万平方米,总计22个模块机房模块,4000个机柜规模。
计划在2013年7月投产使用,先期将投产12个模块3000个机柜,将各个业务支撑部门的IT系统迁入到朝阳数据中心。
2基本需求
数据中心运维管理当前的基本需求如下:
❒筹建数据中心运维团队,在2013年数据中心投产时能实现对数据中心基础设施的接管和运维;
❒建立基本的运维管理流程,实现服务台、事件管理、发布管理、变更管理、资产管理;
❒建立标准化的操作管理规范和专业作业流程,实现对数据中心基础设施安全稳定运维管理;
❒建立质量控制机制,降低管理和操作风险,保障朝阳数据中心稳定运行;
❒建立基础监控系统,实现对电力、空调、消防、安保、通信网络的监视和控制管理;
❒建立应急管理机制,实现对突发事件(电力中断、操作失误等)的应急处置和管理。
3必要性及紧迫性
近年来,一些国有大型企业和金融企业因数据中心的突发事件和故障导致业务受影响以至于停顿的事件时有发生,严重的甚至引起了社会的广泛关注,造成了较坏的影响。
其中很大一部分是由于运维操作不规范所造成的,如电力操作未按照操作流程导致部分设备电力中断,空调系统维护不当造成温度升高导致IT系统关停,设施巡检不到位造成故障隐患等等。
往往是这些看似偶然事件都是由于日常运维工作细节疏忽和失误造成,细致分析剖析其实是数据中心管理上的问题,管理体系虽然建立,但是其中流程只是停留在文档上,并没有在操作管理上进行落地,真正落地可行的操作规范的缺乏,流程的质量控制管理没有做到切实有效。
“千里之堤,溃于蚁穴”,正是因为这些细节决定了数据中心运维管理的成败。
十二五期间坚持“以科学发展观为指导,加快实施资源、市场和国际化”的发展战略,着力加快转变增长方式,着力提高自主创新能力,着力建立安全环保节能长效机制,着力建设和谐企业,建成具有较强竞争力的国际能源公司。
和化工行业两化深度融合的推进,信息化在有效促进和化工产品和产业结构调整中的起到重要作用,提升企业技术、资源利用、商业模式方面的工作效率,有效降低生产成本,实现生产可持续、低碳化、绿色化发展。
因此,作为运行着信息化核心的朝阳数据中心,一旦因为运维管理事件出现安全生产问题而影响业务的运作,将会影响整个集团的业务运作和发展,将带来极大的负面影响。
根据数据中心的当前情况,为保障数据中心投产后的安全生产,有必要进行规范切实可行的数据中心运维管理建设。
4项目建设目标和范围
朝阳数据中心建设标准、采用技术和基础设施等级都是处于国内外最先进的水平,数据中心运维管理建设是集团信息化的基础性工作,是保障数据中心安全平稳运作以及对业务信息系统保障支撑的必要手段。
数据中心运维管理的建设目标:
❒拥有专业完整的数据中心运维组织架构,保障数据中心的稳定运营;
❒拥有完整的运维管理体系,实现运维管理的流程化、体系化和可控性;
❒规范化、专业化和标准化的安全操作管理和质量控制管理,降低管理风险,保障朝阳数据中心稳定运行;
❒专业的技术工具实现对数据中心的集中高效管理。
数据中心运维管理建设成功实现以上目标,将提升信息化管理水平和能力,确保集团核心业务系统的数据安全和作业持续性,避免因为运维管理过程中流程的缺失、操作不规范、管理不到位导致数据中心运转的中断而影响业务信息系统,保障集团核心业务的持续稳定运行。
具体项目内容如下:
❒专业的人员组织建设:
通过科学合理规划组织架构,持续不断的制度和技能培训,建立专业化的运维团队,实现数据中心的接收和运维,对数据中心的强电、弱电、安防、消防、空调制冷、通信网络和建筑物设施的管理,有效保障数据中心稳定运行。
❒完整的流程管理体系:
建立数据中心运维管理、安全管理和应急响应管理的制度和流程,让日常运维管理工作遵循制订的制度和流程,遵从标准化和体系化的管理。
❒规范的操作管理规范:
建立切实可行的操作管理规范,编制落实到实际操作的标准作业程序,实现操作管理的标准化和规范化落地,结合质量控制手段,降低操作风险,提升数据中心管理安全,避免因为数据中心操作失误造成的对业务系统的影响,从而减少造成的经济损失和社会影响。
❒集中的管控服务中心:
利用技术工具实现对数据中心管理和技术领域的监控和管理服务,包括建筑物设施、电力系统、空调制冷系统、安防系统、消防系统、通信网络,以及流程管理、操作管理、安全管理、文档管理、质量控制,实现可视化、自动化和流程化的高效数据中心运维管理。
5建设方案
5.1项目总体建设路径和策略
由于数据中心运维建设涉及管理流程和技术领域比较多,考虑到循序渐进可持续发展战略,数据中心运维管理建设项目本着统一规划、逐步实施的策略,将分成三个阶段进行建设:
❒初步接收阶段:
2013年实现数据中心的平稳接收,建立基础运维管理流程和质控管理体系,建立基础设施操作管理规范和集中管控中心,建立应急响应机制,保证数据中心正常运营。
❒稳固基础阶段:
2014年在第一阶段的基础上,实现从基础设施到IT系统的服务扩展,对运维管理流程和质控管理体系进行平滑扩展和集中管控平台功能的完善,建立灾备管理体系,实现安全稳定的数据中心运维保障管理。
❒稳步前进阶段:
2015年实现对前两阶段工作的完善和优化,建立综合服务管理平台(服务门户)实现对管理的可视化、自动化、标准化和集中化,进行业务连续性管理体系规划,进行ISO20000、ISO27001的认证,大幅提升数据中心运维管理综合水平。
5.22013年项目建设过程
5.2.1数据中心接收
进行数据中心的资产接收和能力接收,包括数据中心的建筑物设施、机电设备、文档的接收,进行改进和优化,进行设备使用和维护操作培训,完成设备测试和数据中心系统试运行。
5.2.2人员组织建设
进行运维组织架构设计、对组织架构内各岗位进行职责设计、建立组织架构内各服务团队的沟通机制、建立组织架构内各服务团队的绩效考核机制。
对运维团队人员进行数据中心实际上岗培训,培训科目包括强电、弱电、空调、消防中控、安保、监控值班操作、物业保洁。
5.2.3服务管理流程和质控建设
根据当前朝阳数据中心现状,进行运维管理制度开发、流程管理规划设计、质控管理设计和工具平台建设。
包括服务台、事件管理、发布管理、变更管理、资产管理流程,管理评审、内部审核、文件及记录管理、服务商管理、业务关系管理等运维管理制度。
5.2.4监控管理建设
进行监控管理体系规划,包括需求定义、监控管理和技术要求、体系建设和工具平台框架和要求。
包括监控对象,监控范围,监控指标(如温度、湿度、功率、电压、水患、火险等)、监控渠道、监控频率、报警等级等监控需求和具体的监控设备、软硬件平台方案、建设步骤和方法、工作规程、基础设施巡检操作手册、巡检问题记录汇报表单开发等。
相关人员的培训、监控平台和流程试运行测试、监控系统参数调整优化、评审验收,评估最终实现结果与设计目标的符合度。
5.2.5安全管理建设
进行监控数据中心安全管理框架规划、安全管理制度和操作规范和安全管理工具平台建设的建设,包括访问安全管理、环境安全管理、操作安全管理、人员安全管理、网络安全管理,以及工具平台的招标、实施、调整优化和评审验收。
5.2.6操作管理建设
完成操作管理体系规划和制订各技术领域操作规范,技术领域包括数据中心的电力设施、空调设施、消防设施、安防设施、环境设施、管控、施工管理、建筑设施,以及工具平台的招标、实施、调整优化和评审验收。
5.2.7文档管理建设
规划文档管理体系、文档管理制度和操作规范,包括文档管理制度、流程、文档管理工具需求等,完成文档管理工具的采购和使用。
5.2.8应急响应管理建设
针对数据中心运维过程涉及的场景编写应急预案,确定应急响应组织架构,建立必要的沟通协调及通知通报机制、责任到人分工明确、确定合适的损害评估标准及处置流程,进行应急演练以检验应急组织架构、通知通报流程、团队的应急响应能力。
5.3项目时间计划
5.4项目建设组织
5.4.1项目组织架构
5.4.2项目建设机构
项目承担单位在项目启动阶段的主要职责分工:
❒项目领导小组
项目组织管理机构设在数据中心项目部,xxx同志担任项目组长,xxx同志担任项目副组长,负责项目的重大问题的决策、项目实施过程中的监督指导、作为项目的问题最终升级点。
(具体详细内容由提供)。
❒项目经理
负责本项目人、财、物的计划、组织、领导和控制,包括:
进行项目评估与策划,组织编写《项目开发计划》;总体控制项目进度、成本和质量;评审各阶段的成果,决定需要采取的措施;管理项目组成员的工作;负责项目文档的编写;负责主持项目例会;负责汇报项目进展情况。
❒项目实施组
负责本项目的技术和咨询工作,包括方案中的数据中心接收、运维团队建设、服务管理流程体系、安全管理、质控管理、操作管理、监控管理、文档管理和应急响应管理内容。
负责组织项目的技术工作;负责编写相关技术文档;参与技术及方案评审;负责项目的技术实施。
❒质量控制管理(项目督办人和项目文档负责人)
负责项目质量的监督管理工作,监督内容包括:
项目质量目标和项目开发计划的制定、考核和监督;项目总结和解散安排。
负责组织项目文件资料的撰写。
负责协助项目经理协调各方面的关系。
5.5投入估算
5.5.12013年咨询项目内容及费用概算
工作领域
主要工作内容
概算
(万元)
咨询服务合计(含工具平台实施管理费用,未包含培训)
运维接收
辅助甲方开展运维接收工作
组织管理
规划组织体系架构、职责分工,协助人员的选拔招聘
流程管理
规划服务流程体系,定义服务职责和分工,协助流程管理工具的采购和使用。
0
操作管理
制定操作管理要求,协助制定操作标准和规程,协助操作管理工具的采购和使用。
0
监控管理
规划监控体系,包括监控管理要求、监控范围、对象、指标、监控数据来源等,协助监控管理工具的采购和使用
0
安全管理
规划安全管理体系,包括制定安全管理制度、规范及规划安全管理技术体系方案
0
文档管理
规划文档管理体系,包括文档管理制度、流程、文档管理工具需求等,协助文档管理工具的采购和使用
40
业务连续性
建立应急响应体系,包括组织、流程、预案等,并协助组织一次应急演练。
0
小计
0万元
人员培训
基础培训和数据中心实习培训
提供人员教育和训练的师资和场地;与人员数量相关;以165人为基数,10天课堂培训,20天现场试运行培训,另外需约1万考试认证费用(含食宿差旅费用,差旅标准按每人天200元的最低标准,30天共约10万元)
小计
0万元
合计
10万元
5.5.22014年咨询项目内容及费用概算
工作领域
主要工作内容
概算
(万元)
咨询服务合计(含工具平台实施管理费用,未包含培训)
组织管理
调整组织体系规划,协助新增人员的选拔招聘,提供新增人员教育和训练的师资和场地。
30
流程管理
调整服务流程体系规划,增加管理对象并进行适应性调整。
操作管理
制定IT系统操作管理要求,协助制定操作标准和规程,协助操作管理工具的采购和使用。
监控管理
规划IT系统监控体系,包括监控管理要求、监控范围、对象、指标、监控数据来源等,协助监控管理工具的采购和使用。
安全管理
规划信息系统安全管理体系,包括制定安全管理制度、规范及规划安全管理技术体系方案。
文档管理
调整文档管理体系,增加信息系统支持相关文档体系架构。
业务连续性
初步建立信息系统灾难恢复体系技术架构和恢复执行能力。
小计
人员培训
基础培训和数据中心实习培训
与人员数量相关;以65人为基数,10天课堂培训,20天现场试运行培训,另外需约0万考试认证费用(含食宿差旅费用,差旅标准按每人天200元的最低标准,30天共约4万元))
小计
5万元
合计
5万元
5.5.32015年咨询项目内容及费用概算
工作领域
主要工作内容
概算
(万元)
咨询服务合计(含工具平台实施管理费用,未包含培训)
组织管理
优化岗位职责,提升人员能力和效率,初步建立完整的绩效考核机制。
流程管理
优化管理流程,建立起面向服务的,符合国际IT服务管理标准(ISO20000)的流程体系,整合各工具平台,建立面向服务、面向用户的服务门户。
操作管理
提升操作稳定性和熟练度,提升操作效率,缩短操作时间。
监控管理
扩大监控覆盖范围,提升监控自动化水平,减少差错率。
安全管理
实施主动安全管理战略,初步建立主动预警和反击联动机制。
文档管理
整合文档管理需求,建立文档标准,并推动文档的有效利用。
业务连续性
建设完整灾难恢复的能力,初步建立业务连续性管理框架。
小计
合计
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 集团 数据中心 管理 建设 立项 报告
![提示](https://static.bingdoc.com/images/bang_tan.gif)