智慧IT运维管理体系总体方案文档格式.docx
- 文档编号:4501845
- 上传时间:2023-05-03
- 格式:DOCX
- 页数:27
- 大小:551.70KB
智慧IT运维管理体系总体方案文档格式.docx
《智慧IT运维管理体系总体方案文档格式.docx》由会员分享,可在线阅读,更多相关《智慧IT运维管理体系总体方案文档格式.docx(27页珍藏版)》请在冰点文库上搜索。
2体系及制度建设16
2.1参考标准与方法论16
2.1.1运维体系参考标准规范16
2.1.2IT运维管理成熟度分析17
2.1.3运维体系建设方法论20
2.2运维管理体系规划23
2.2.1运维管理规划目标23
2.2.2运维管理总体规划24
2.3运维管理管理制度建设25
2.3.1运维流程管理规范26
2.3.2IT运维操作管理规范26
2.3.3进行运维服务提升评估26
3技术方案28
3.1总体设计方案28
3.1.1总体设计技术路线28
3.1.2系统总体功能架构29
4合理化建议32
4.1配套流程规范制度是IT服务平台有效运转的基石32
4.2面向最终用户的对外运维门户实现IT服务能力的延伸及自助服务模式的培养33
4.3基于知识库实现运维工作的自助化与智能化35
1项目需求分析
1.1项目预期与目标
通过本次项目建设,将实现以下建设目标与成果:
(1)体系及制度建设
协助用户建立公司信息化建设的运维管理体系,基于云南财政信息化的具体情况,结合国家的相关标准,制定行之有效的管理规范和制度,并与运维管理系统相结合,落实IT运维管理的信息化系统建设,实现运维管理工作的规范化、体系化。
(2)设备及网络监控
确保公司数据中心IT基础设施和应用系统正常、安全、高效运行,方便科技信息处随时了解各个系统的运行情况,从应用角度实现对各个关键系统的实时监测,在系统发生故障时能够迅速反应,相关人员能够及时获取相关的预警信息,定位异常发生的位置和可能的原因,以便快速响应和处置;
(3)业务系统监控
实现公司业务系统运维管理的主动化和体系化,以预防为主,通过实时的监测和分析发现系统潜在的问题和风险,实现主动式运维管理,最大程度减少事故的发生,为实现运维管理的流程化奠定基础;
通过定制化接口开发,实现对系统稳定性、性能、数据准确性的实时监控,并将运维管理的监控数据、流程数据导出到财政数据仓库;
基于堡垒机完成运维审计;
(4)标准化运维服务
为保障公司一体化系统对财政业务的支撑,需要建立标准的系统运维的日常管理流程,借助运维服务系统,提升一体化系统运维管理的有效性、及时性、可跟踪性,满足财政、预算单位、银行等一体化系统用户的日常服务要求,并满足未来扩展到其他业务系统的管理要求;
通过集成方式,实现客户端机器的远程托管服务,通过在线分析客户端系统环境与操作表现,快速定位、解决用户提交的问题;
(5)厅内信息化事务管理
科技信息处人员编制偏少,需要通过实现部分日常服务工作信息化建设,提升工作质量与工作效率,最急迫的工作事项包括电子设备资产管理以及信息化建设项目的全流程管理。
(6)呼叫中心建设
针对当前固定客服电话呼损率比较高的情况,需建立标准化的呼叫中心,在前端完成对用户日常服务请求呼入的响应、记录、处理及转发工作。
呼叫中心暂时仅需支持一体化系统的服务请求,需要满足未来的扩展要求。
1.2对项目的解读与理解
结合信息化建设现状,借鉴科学的运维体系建设方法论,通过建立基本符合ITIL规范的事件管理流程和问题管理流程提升运维过程的故障申告、处理的质量和效率,增强故障处理的透明性和可控性,实现运维过程中的事件管理和问题管理的流程化、可视化,提高整体运行维护水平。
树立面向业务服务的IT服务管理理念,实行集中统一的IT服务管理模式,由分散管理向集中管理转变;
建立统一高效灵敏的综合运维管理平台,由无序服务向有序服务转变;
建立规范标准的IT服务管理流程,由职能管理向流程管理转变;
应用先进、实用、高效的IT服务管理工具,由被动管理向主动管理转变;
建立科学合理的绩效考核指标,由粗放管理向精细管理转变。
因此项目的核心需求包括:
1.2.1强化主动监控,实现集中管理
将根据现状和需求进行统筹规划,本着“从实际需要出发,保护已有投资”的原则,将目前已有的、针对网络、服务器、安全、数据库、中间件的分散式监控管理系统,以及数据处理中心的动力与设备环境监控系统、视频监控系统整合、集中到一个统一的监控系统平台进行监控、告警、性能、展现管理,实现网络、业务资源、业务应用的全面集中监控,构建统一集成的系统资源监控平台,主动、及时地发现问题,解决被动服务的局面。
1.2.2快速定位故障,减少维护成本
通过统一事件处理平台,收集全部的监控和状态信息,建立集中的告警分析处理机制和故障预警机制,提供自动化的事件处理能力,当故障产生时,可以快速定位故障,很快发现问题根源并找到相应的解决方案,从而缩短故障解决时间,减少维护成本。
另外,通过可灵活设置各事件的关联和互动关系,按照应用系统进行划分处理,建立“五位一体”的综合监控平台。
1.2.3提升主动管理、辅助分析决策
利用IT系统集中监控管理平台综合监控管理系统全面主动反映信息系统的运行健康情况,通过多种分析手段为合理有效地分配各运维人员和值班人员的人员调度,利用各类性能分析报表、资源统计报表和运维分析报表,从各个侧面、各个角度反映系统的运行情况、性能情况和人员工作情况,为系统升级、改造、扩容提供科学依据;
也为员工的绩效考核提供电子依据。
1.2.4直观运行展现,快速指挥调度
通过IT系统集中监控管理平台展示系统对业务核心数据进行分析和实时监控,丰富、科学、美观的展示IT资源运行情况、性能状况、服务工单情况等,使领导、管理者、技术人员能迅速了解自己关心的问题。
对于IT运行的故障处理过程中,能够通过直观的运行展现,进行快速指挥调度。
1.2.5规范日常流程,有序高效协作
参照ITIL规范,树立面向业务服务的IT服务理念,进一步理顺信息战信息中心内部各组关系,明确职责分工。
梳理当前的服务目录和服务级别协议,规范提供服务的内容。
建立集中的服务台,统一管理IT服务资源。
建立服务台、事件管理、问题管理、变更管理、配置管理等IT服务管理流程,初步实现面向流程的运维和服务管理模式,使运维人员具备更高的工作效率。
1.3主要问题、重点及难点的阐述
根据对本项目的需求的理解,项目建设的主要问题、重点及难点主要包括:
1.3.1实现统一监控、处置及展现
面向网络及数据中心的各类IT资源实现统一监控,以资源配置信息、监控指标信息、告警信息等相关运维管理信息的全面采集、整合、抽取,并按照特定规则进行格式和内容等方面的处理,并按照特定规则进行格式和内容方面的整合处理,以便形成统一的监控信息、预/告警信息、展示信息。
在监控信息的展现方面,采用统一门户来规划展示的框架、风格及内容,通过灵活的可定制界面,实现各种监控和分析的需求,进一步提高监控工作的有效性和一致性;
通过引入先进的技术分析手段,建立监控有效性分析评估机制,进一步保障应用系统安全、高效、持续、稳定的运行。
1.3.2完整、有效、统一的配置管理库
在资源层面,将系统、网络、基础设施以及其他IT环境中存在的实体和虚拟资源进行统一、集中的管理,是实现统一运维的基础,在权限控制框架内,运维人员可以快速查询和调取资源的信息,能够快速实现事件、问题和变更的处理工作,极大的增加运维效率,并降低风险。
该需求关键要解决配置库管理中所管理的配置项及其关联关系的信息完整性、及时性及正确性,以为运维管理相关工作提供可靠有效的信息依据。
为了收集管理各配置项,真实地反映应用项目和IT资源的关联关系,首先要全面详细地了解应用系统和IT基础设施的安装部署和配置情况。
在此基础上,通过配置发现工具,有必要时结合人工审核确认,并辅以配置审计等工具,对基础设施、网络线路和设备、主机、存储、数据库系统、应用中间件、业务应用系统等IT资源和应用系统运维配置信息的采集、维护和管理,并使该模块与其他功能模块保持良好的集成接口关系。
同时,配置管理库应支持图形化的配置项、配置关系展现。
支持基于配置项之间的关联和影响关系,自动快速地确定、分析并展示告警事件、变更对其他IT资源或业务系统的影响范围和程度,从而将技术和业务有效的结合起来,转变传统的IT监控手段,不仅能及时发现故障,更能够快速分析故障的影响范围和程度,保障重要业务稳定运行。
1.3.3符合ITIL规范的基础服务流程
符合ITIL的运维流程建设是本次项目的重点之一,通过建立标准、规范且灵活的管理历程,并在省厅层面进行部署应用,将能够在省厅这一层面实现运维工作的流程化化,通过流程的合理设置,真正实现省厅层面的各部门联动运维模式,各部门将依托省厅作为一个整体集中对外提供IT服务、对服务进行监督和改进、提升服务质量和水平。
此需求的实现,首先需要对省厅各部门现有管理流程进行重新梳理,我们了解到运行省厅下各部门已经建设并实施了事件管理、变更管理、问题管理、配置管理等流程。
经过多年的宣贯及应用,这些流程的应用已经成为省厅各部门运维工作中非常重要的一部分。
因此,需要结合当前管理需要,结合本次项目的建设目标,在现有流程的基础上,进行优化、完善。
在实现事件、问题、变更等管理流程的基础上,还需建立各流程之间的联动,实现相关流程之间的有机结合,为故障分析、变更评估等提供有效方法及可靠依据。
此外,还需要增加服务目录、服务级别和服务请求管理等流程的建设,进一步完善和优化流程体系,使省厅整个IT服务过程,包括服务请求、服务接受、服务处理、服务交付、服务质量控制整个过程均具备良好的流程化处理和控制手段,从而保障服务质量并持续提升。
1.3.4可灵活定制的运维流程引擎
运维管理流程的建设除咨询设计外,还需要将设计好的流程落到实处,通过一个敏捷、可灵活定义的运维流程引擎进行运维流程的快速落地和电子化,是保障流程得以成功实施的重要手段。
该需求要求运维工作流程可采用客户化定制方式,按照用户的实际工作需要,方便的进行定制生成。
因此,运维管理平台需要提供一个专业流程引擎,能够根据管理需要定制出各类流程服务。
同时,运维流程引擎还需提供业务目录管理功能,通过业务目录可设置各业务的默认责任人、责任组和关联的工作流程,在流程处理过程中通过业务目录的选择自动进行责任人、责任组和处理工作流的设置,最终实现业务和责任人绑定的目的。
1.3.5通过服务目录、服务级别管理提升运维服务质量
服务质量的把控是IT服务管理的目标之一,如何来衡量、监督并促进服务质量不断提升,是本次项目需要考虑的重要需求。
该需求需要进一步理清运维服务工作的内容,明确服务时效性、服务方式、服务质量的服务标准。
在本次业务服务管理系统建设中,将通过服务目录梳理省厅所提供的服务,并能够按照工作目标和需求规范这些服务(如服务的时效性、质量等),通过服务协议来约束和监督服务交付的质量,从而为规范服务行为、解决服务争议提供有效手段。
主要表现为监督每项服务的执行情况,以保障每一服务都能够在规定时效内得到有效处理,进而提升客户满意度。
1.3.6简单易用的报表设计器
如何对运维工作的好坏进行评估和分析,如何对事件、问题、变更等情况进行统计和趋势分析,如何从大量繁杂的数据中找到价值,从而找出当前IT环境中可能存在的隐患的需要改进之处,是管理层面重点关注的内容,也是IT服务管理平台需要实现的功能。
该需要主要为解决目前运维信息的利用程度不高,信息价值挖掘应用不足的情况。
通过简单易用的报表设计其,使用户采取所见即所得的方式即可建立或调整统计分析报表,满足运维分析和运维规划支撑要求。
针对此需求,平台需支持灵活的报表定制功能,提供拖拽式的、所见即所得的、Excel风格的全中文、可视化报表设计器,能根据实际和用户要求自定义数据和参数,能对各类资源的运行状况、性能数据、故障维护数据等自动生成相应的周期性报表或定制报表,并能够结合系统权限管理将报告授权给不同的人,用户登录系统后只能查看自身权限范围内的统计报表。
报表平台需灵活、易使用,采用类Excel的操作界面,简单易用,只需通过简单的鼠标拖放,便可利用精巧的数据绑定功能,完成报表模板制作,并支持HTML、PDF、EXCEL、WORD各种样式呈现。
1.3.7统一的运维服务门户
统一运维服务门户要求整合现有的运维服务资源,构建统一的人机交互界面,统一对外提供服务。
我们知道,运维服务的最终目标是实现“以客户为中心”的优质服务。
因此,需要建立统一的门户,以用统一的窗口向用户提供全方位、一体化的服务,进而提升客户体验。
统一服务门户的建设关键在于运维服务的“可视化”方面:
其一,需通过门户与用户保持良好的沟通交互,使服务更加便捷、透明;
其二,需要通过统一服务门户来规范整合服务运作的各方面,使推出的服务在用户感受等方面具有一致性和统一性。
用户也可根据需要定制个人页面,收藏或预订信息及报表,方便用户操作,提升用户体验。
1.3.8面向不同运维视角的个人工作台
考虑到目前用户已存在部门运维管理系统,出于利旧和保护投资的原则,这些系统将继续使用,这就带来一个问题,运维人员如何才能够高效的在多个系统之间来回切换?
本需求主要为解决目前运维工作人员需牢记各工作平台(运维相关工作)的入口,往返于多个平台处理工作任务的现状。
IT服务管理平台通过整合、优化现有各运维相关平台的功能,使其成为个人运维工作的唯一平台。
个人工作台是个人办公的“桌面”,平台提供所有工作的入口,通过个人工作台可完成所有待办事项,查看所有已办事项或权限范围内的运维相关工作。
平台提供个人工作台定制功能,用户通过简单的拖拽即可根据需要定义个人桌面,并可预定、收藏个人关注的相关信息。
1.3.9完善、严格的权限和认证管理
IT服务平台的建设涉及多个部门、多类资源、多个系统,如何保障在整合人员、资源和系统的过程中,确保人员、资源和系统能够严格按照行政权限操作,加强资源和系统的安全性,需要有一套完善而严格的权限和认证机制。
本需求主要为解决平台的统一用户管理、统一授权及统一认证,满足本次统一IT服务平台项目建设的统一要求。
通过自然人、角色、权限和授权机制,确保每个用户登陆后只能在权限范围内进行查看和操作;
通过域管理能够根据行政架构的划分,将人员、资源、流程等信息划分为多个管理域,既在省厅层面实现统一运维,又充分考虑各部门的差异化,实现个性的运维管理;
通过完善而严格的用户权限管理,能够确保平台以及相关信息的安全性。
1.3.10标准、灵活的开放接口和扩展需求
IT服务管理平台的建设,除了需要贴合实际管理需要、功能完善等需求外,还剩下最后一个问题,现有运维系统的数据如何利用?
未来平台如何扩展?
是否有一个灵活、高效的接口体系来实现和其他系统的对接以及未来管理功能、管理范围和管理性能的扩展?
该需求主要解决两方面问题,首先是和第三方系统的对接问题,通过定义标准接口和标准的数据格式,来实现和现有以及第三方系统的对接,实现运维数据和管理功能的集成,构建统一的IT服务管理平台。
其次,需要解决未来信息化不断发展过程中对IT服务管理提出新的要求时,平台是否能够很好的进行扩展,包括管理功能、管理范围和管理性能的快速扩展和平滑升级,这就需要平台采用一种先进、松散耦合的架构设计方式,来确保平台能够满足未来扩展的需求。
2体系及制度建设
2.1参考标准与方法论
本技术方案的制定,注重同类项目建设的经验及成果吸收,依据ITIL’、ISO20000、ITSS等标准规范,同时注重云南财政用户的实际业务需求。
2.1.1运维体系参考标准规范
下列文件中的条款通过本规范的引用而成为本规范的条款。
凡是注日期的引用文件,其随后所有的修改单(不包括勘误的内容)或修订版均不适用于本规范,然而,鼓励根据本规范达成协议的各方研究是否可使用这些文件的最新版本。
凡是不注日期的引用文件,其最新版本适用于本规范。
1)IT运维管理国际最佳实践方法,ITIL最佳实践V3版本
2)ISO/IEC20000-1:
2011信息技术—服务管理第一部分:
服务管理体系要求
3)ISO/IEC20000-2:
2012信息技术—服务管理第二部分:
服务管理体系应用指南
4)GB/T24405.1-2009信息技术服务管理第1部分:
规范
5)GB/T24405.2-2010信息技术服务管理第2部分:
实践规则
6)GB/T29264-2012信息技术服务分类与代码
7)GB/T28827.1-2012信息技术服务运行维护第1部分:
通用要求
8)GBT_22080-2008_信息技术_安全技术_信息安全管理体系_要求
9)ISO/IEC27001:
2005信息技术安全技术信息安全管理体系要求
2.1.2IT运维管理成熟度分析
客观、准确地评估IT服务管理管理现状,进行差距分析,明确流程成熟度是改善IT服务管理的基础。
本次项目将依据Gartner的信息技术成熟度模型对云南财政当前的情况进行评估。
Gartner的信息技术成熟度模型如下图:
附图1.成熟度模型
Gartner将一个企业与组织的信息技术成熟度分为五个阶段:
1、救火式
在此阶段,企业与组织的信息技术管理还处于最原始的阶段,整个信息技术的服务,处于极为被动的状况。
2、被动式
远比第一阶段好,在此阶段,因为对信息技术的持续使用和管理,已有适当的人员和流程来支持所需的服务;
各类信息技术与安全相关事件也得到基本的追踪、监控和管理。
3、主动式
企业与组织内部的信息技术服务与管理单位,能够进一步化被动为主动,朝向主动提升效能、主动根据企业与组织的需求去规划所需的信息技术、需求变更管理、主动分析和解决问题,各项信息技术相关服务工作自动开展。
4、服务式
企业与组织内部的信息技术服务与管理单位,已经将自己提升为企业内的服务提供者,此时,各式服务水平的监控和管理均被合理制定,也只有如此才能保障企业与组织在使用信息技术服务的流畅性,进而确保竞争力。
到达此阶段时,企业与组织的信息技术服务使用与管理已经达到一个极佳的状态,所欠缺的仅是没有进一步将信息技术战略与企业发展战略结合在一起。
5、价值式
本阶段所强调的是,如何进一步提升信息技术的价值,通过与企业战略相结合,进而协助企业与组织对所需导入的信息技术的利用,具备量化的决策能力。
通过调研和评估,目前云南财政运维管理具有以下问题:
1、没有建立一个统一的运维组织,各单位、各条线相互独立负责各自的运维服务工作;
2、没有建立一个统一、明确、完善且覆盖全面的流程体系,部分服务过程有管理流程,部分没有;
3、大部分服务还处于被动处理,较少有主动分析和解决问题的情况;
4、事件的解决没有硬性的记录和追踪要求,基本依靠个人习惯;
5、有面向用户的客户服务中心,但不满足当前管理要求,需要进行改造;
根据Gartner关于企业与组织的信息技术成熟度模型,结合云南财政当前管理实情,可以认为,目前云南财政处于第二阶段到第三阶段的过度阶段,即被动式服务向主动式服务过度阶段。
本次项目建设的目标是采取有效措施,构建运维管理体系,实施运维管理平台,使云南财政的运维管理成熟能够达到第四级,也就是服务阶段,并通过统计、分析和持续改进,加强服务水平管理,量化服务质量,逐渐逼近并达服务阶段;
长远目标是通过整个运维体系的不断改进,将信息技术服务的目标和云南财政整体战略目标结合,以信息技术支撑云南财政持续发展,最终达到价值链阶段,实现面向业务的IT运维服务管理。
具体来说,需要达到如下要求:
1、统一的运维管理体系在云南财政得到应用,对整体的运维管理进行统一的规划和管理,并能够持续改进;
2、统一的管理制度、管理流程在运维过程中得到完整的使用、监控和度量;
2、对运维流程的表现,如效率、用户满意度等方面进行全面、持续的记录、跟踪、量化评估;
3、统一的运维支撑平台得到建设,对运维过程提供集中、强力的支撑,实现运维过程基本自动化;
4、建立完善内部沟通和外部沟通机制;
5、IT管理人员初步掌握IT管理流程的维护概念和方法。
2.1.3运维体系建设方法论
整体运维服务管理体系的设计需要考虑和运维管理相关的四大主要因素,即人员、流程、技术(产品)和合作伙伴,在IT服务设计过程中,上述四个关键因素被称为IT运维服务设计的四要素,即4P方法论:
附图2.IT运维服务设计
1、人员:
在整体规划设计中,人员作为运维主体,是决定性因素,需要明确在整个云南财政运维工作中,各条线、单位和人员的岗位、责任,建立严格、合理的量化指标和考核体系,督促员工有效执行并持续改进,在这过程中,需要获取领导的支持:
✓运维组织的确定
✓运维模式的确定
✓岗位、角色和责任的细化
✓建立细化的量化指标库
✓建立严格的督促和考核管理办法
2、流程:
流程是规范化运维过程,对运维过程进行合规化、标准化、统一化的有效手段和方法,需要根据云南财政实际情况,通过调研、分析,了解决策层、管理层、执行层和用户对运维管理过程的要求和期望,逐步完善相关管理政策,设计架构合理、应用灵活、能够持续改进的运维管理流程。
✓流程完善化设计:
在现有运维建设基础上,通过运维流程制度的制定、流程操作规范的制定、权限和角色的划分以及流程改进来实现对现有流程的完善,并在次基础上建立服务级别管理,梳理服务目录。
✓流程规范化设计:
流程的设计应具备架构清晰、权限/角色划分合理、无冗余节点等特点,流程设计应做到规范、合理。
✓流程透明化设计:
整体流程的建设应实现运维工作的可控化和透明化,能够实时跟踪和监督流程的运转过程,实现运维全过程的可视、可控、可追踪、可查询。
✓流程改进性设计:
建立持续改进机制,所建设流程应能够根据实际管理需要进行合理调整和优化,实现流程的不断改进。
3、技术:
通过利用完善、成熟的信息化工具,作为运维工作的有效支撑,帮助和推进运维工作的有效开展,持续提升运维能力和水平,一个高效的运维工具将是运维工作执行好坏的最大推动力:
✓数据一致性设计:
支撑应充分考虑现有各管理模块的数据结构,设计能够满足存储各管理系统数据结构且能灵活编辑的数据存储库,实现各种异构数据的集中化管理。
✓数据共享设计:
各管理模块之间应能够实现数据共享和利用,建立与现有管理系统的数据接口,获取各系统的数据,存储或临时存储在资产配置库中,为下一步处理提供数据来源。
✓数据集中处理设计:
将分散的数据同步到系统后进行集中统一的处理分析生成有价值的管理信息。
✓数据可视化设计:
将分析得到的有价值的管理数据,通过集中的展现界面进行直观的呈现出来,同时也能够根据设置将其他系统相关数据进行展现。
✓统一交互界面设计:
构建统一的人机交互界面,将其他管理系统通过数据集成、界面集成等方式集成到本管理平台上,管理人员只需一次登录即可跳转相应的系统功能界面,避免各系统来回切换。
4、合作伙伴:
寻找有丰富的运维管理项目经验的合作伙伴支持,是本项目的关键因素之一,
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 智慧 IT 管理体系 总体方案