XXX数据中心项目aCloud企业级云技术建议书.docx
- 文档编号:5029387
- 上传时间:2023-05-07
- 格式:DOCX
- 页数:67
- 大小:6.05MB
XXX数据中心项目aCloud企业级云技术建议书.docx
《XXX数据中心项目aCloud企业级云技术建议书.docx》由会员分享,可在线阅读,更多相关《XXX数据中心项目aCloud企业级云技术建议书.docx(67页珍藏版)》请在冰点文库上搜索。
XXX数据中心项目aCloud企业级云技术建议书
XXX数据中心项目
企业级云技术建议书
1.项目需求分析
1.1背景概述
XXX近年在信息化建设方案取得了较大发展,多个业务系统已经在现有基础设施平稳运行多年,但当前信息技术的发展可谓一日千里,云计算、超融合、分布式集群等新的技术、架构、体系都给业务业务系统带来巨大的发展空间。
如何更好的把这些新技术引入各个业务系统,是XXX云平台建设过程中所面临的挑战和机遇。
在此过程中,我们认为XXX数据中心面临以下挑战:
✓数据中心基础设施需要自然更替
数据中心基础设施部分已经运行了10年以上,部分设备已经老化而进入了故障多发期,例如BOSS平台的部分服务器、存储设备已经运行8~10年。
即使当前已经稳定运行的3-5年的设备,大多数设备原厂商已经对销售3年以上的产品停止生产。
因此一旦这些设备出现故障则面临着无法维修或者无法更换合适的配件,设备停用的风险较大。
✓基础资源需进行整合
核心应用业务已经在中间件、数据库等层次进行了融合,并将部分应用部署于小型机中。
其他大量的业务应用系统运行在独立的x86物理平台上,没有进行虚拟化整合,导致服务器、存储等资源利用不充分,存在忙闲不均的情况,并且普遍资源利用率较低。
✓基础资源严重不足
XXX希望建设统一的互联网平台,面向业务规划和多变的用户需求,业务系统上线要求愈发紧急迫切,但受以前的基础设施规划约束,目前数据中心可使用设备资源不足,已使用设备利用率不高,新的业务系统上线将面临无资源使用局面,无法满足不断更新的业务需求。
✓服务能力提升乏力
根据信息化发展的需要,数据中心的运维理念正在由面向技术的被动运维模式向面向服务的主动运维模式转变,力求在软硬件资源上提供“定制服务”,保证新应用快速上线运行和良好运行。
同时围绕具体互联网应用,提供信息资源服务、软件开发、信息安全服务等服务功能。
很显然,目前数据中心架构在环境支撑和功能设计上都严贡制约了数据中心服务能力的提升。
近年来随着应用系统的逐步深化和推广应用,现有数据中心无论是规模还是架构很难支持现有业务的增长和后续新业务应用系统的部署实施。
随着设备逐步进入老旧期,数据中心相关业务的服务器、存储、网络等设备需要新旧更替,因此新的数据中心服务模式的建设是迫在眉睫的任务。
1.2建设目标
本项目着眼XXX信息化的长远发展,以向全公司提供灵活定制的资源服务、弹性的计算能力、完全可信的安全保障服务为基本要求,引进成熟先进的技术,调整优化数据中心建设整体框架。
力争在“十三五”期间逐步建立以云计算为核心的信息化整体架构,实现从以业务应用为核心的被动建设方式向以服务为核心的主动建设方式的转型。
本次项目主要在打好云计算的基础,故项目的建设目标为:
✓基础设施面向资源池化转型
通过构建云计算资源池、存储资源池、网络资源池、安全资源池等方式,将原有的烟囡式系统建设模式打破,通过资源池统一对外提供资源,实现基础设施建设的技术转型。
✓通过云计算统一提供计算能力
基于超融合技术实现以虚拟化为核心的软件定义数据中心的技术架构,使用云计算技术对资源池进行统一的调度管理,实现高效融合的信息化架构,对全公司业务系统建设提供弹性、敏捷、可靠的云计算服务。
✓构建整体运维保障监控能力。
实现对云平台内基础设施进行监管,改变对自有设备现状不清、监管不严的运维现状,全面提升在云计算环境下对大型信息化数据中心的运维保障能力。
✓提供云计算环境的安全保障。
通过对选择安全、可靠、具备核心技术自研能力的云计算平台实现在云计算层的安全。
通过构建和规划数据中心灾备模式以提供数据层的安全保障。
1.3建设任务
✓构建符合业务需求的云计算超融合资源池。
云计算超融合资源池由网络、服务器等基础硬件设备构建,通过对已有设备的有效整合和新增设备的采购,结合虚拟化技术实现对计算资源、网络资源、存储资源、安全资源的定义,构建符合业务发展需求的资源池,使满足业务发展不断增长的基础设施需求。
✓搭建功能全面的云计算平台
云计算平台是项目的核心平台,通过云计算平台的构建.在计算资源服务层面,实现资源池化能力、虚拟资源管控能力、按需弹性计算能力、流程化业务管理能力、异构虚拟化能力;在安全管控方面,实现全面的安全保障能力、全面的运维监控能力,在平台性能方面,衙提供企业级高可用能力,确保平台的运行稳定。
✓为云计算环境提供运维保障平台
本项目要强化相应云计算平台的运行维护管理体系建设。
云计算平台的各功能组件要成熟、稳定、产品化、易维护,方便运维人员进行资源管理、日常巡检和故障检测。
实现对服务交付和运行悄况进行监管,发生故障时能够根据云计算平台的智能提示及时诊断并进行正确处置,保证云计算中心软硬件系统的正常运行。
提供数据中心的数据备份和异地数据中心间的数据同步能力,规划多数据中心灾备能力。
1.4需求分析
1.4.1业务需求分析
1.4.1.1云计算资源池需求分析
由于数据中心未来主要承担互联网业务,新产品和服务的快速投产对基础设施的灵活响应、快速的部署响应及支持能力都有新的和更高的要求,并需要降低对现有应用带来冲击。
与此同时业务快速发展带来的大量数据和用户,要求具有高扩展性基础设施架构架构,灵活支持不同类型的数据,同时需要平衡功能和成本,以求能够在成本有效的前提下,满足突发业务的传输与用户访问的需求
云计算资源池包括计算资源池、存储资源池、网络资源池三个部分,需能够满足XXX集团对计算资源、存储资源、网络资源的需求。
同时,考虑到数据中心管理扁平化,未来数据中心扩容、运维的便捷性,以及有效利用服务器资源,云计算资源池建设应充分考虑超融合技术和高性能设备的选择,以及对现有设备进行整合。
为实现资源的弹性伸缩和按需分配,有效降低单位资源成本,需要新购一批高性能大容量的服务器用于超融合基础架构构建,同时利旧一部分高性能的服务器、存储等设备,共同组建资源池。
云计算中心机房所需计算资源、存储资源、网络资源包括:
1、计算资源:
为支撑所有具备条件的应用系统的云化迁移和升级、新系统的建设、大数据平台的接入,需新增和利旧一批x86架构服务器和其他高性能服务器,进行虚拟化,构建计算资源池。
2、存储资源:
为支撑所有具备条件的应用系统的云化迁移和升级、新系统的建设、虚拟机运行所需的存储以及广电各类数据的存储,需将资源池内部署了虚拟化系统的x86标准服务器。
在提供虚拟计算资源的同时,服务器上的空闲磁盘空间被组织起来形成一个统一的虚拟共享存储:
虚拟存储系统。
虚拟化存储在功能上与独立共享存储完全一致;同时由于存储与计算完全融合在一个硬件平台上,无需象以往那样购买连接计算服务器和存储设备的专用SAN网络设备
3、网络资源:
为满足计算资源池、存储资源池及云计算中心的建设需要,需综合考虑网络资源池的规模、性能和容量。
若当前已有的网络设备不能满足云计算的需求,则需对网络进行扩容。
同时,服务器虚拟化技术的出现使得计算服务提供不再以主机为基础,而是以云主机为单位来提供,同时为了满足同一物理服务器内云主机之间的数据交换需求,因此需要在在虚拟机和物理网络之间,提供一整套完整的逻辑网络设备、连接和服务,包括分布式虚拟交换机、虚拟路由器、虚拟下一代防火墙、虚拟应用交付、等虚拟网络、安全设备,并且需要和物理网络的无缝对接,简化网络的配置管理。
1.4.1.2云计算管理平台需求分析
需要通过云计算实现对底厚物理资源(计算、存储、网络)的虚拟融合、按需分配与局效管理,支持与现有设备和虚拟化软件的集成。
需要能够将IT物理资源,抽象成按需提供的弹性虚拟资源池包括虚拟机、存储、网络、网络安全,以消费单元(即组织或虚拟数据中心)的形式对外提供服务,IT部门能够通过完全自动化的自助服务访问,为用户提供这些消费单元以及其它包括虚拟机和操作系统镜像等在内的基础架构和应用服务模板。
真正实现了业务的敏捷性和高效性,提高业务的快速创新能力。
需要提供简单易用的自动化运维手段,通过管理平台提供故障定位分析手段,能够快速分析出问题节点,并能够指出具体的原因和修复的指导。
通过平台提供的一键健康检测,能够快速分析出平台潜在的业务风险,包括各种和资源性能或者容量风险,平台管理管理和租户管理员,可以根据系统建议,可以选择手动或者自动的方式,实现业务的故障排除和资源优化。
1.4.1.3容灾备份需求分析
目前广电已经建设了两个机房,桐城南路机房和金寨南路机房,因此本期项目建设在规划建设桐城南路机房的同时,需要考虑如何基于这两个机房统一规划数据中心的灾备建设。
提供统一的灾备管理平台,实现两个机房的灾备管理。
本次项目建设需要金寨南路机房提供部分存储空间用以桐城南路机房的ERP系统数据备份。
1.4.1.4性能需求分析
1、计算性能需求
本次项目重点建设桐城南路机房,对数据中心已有设备摸底调查,考虑计算虚拟化的利旧原则,原则上计算资源池原则上需要提供每核2.2GHZ(物理CPU)以上的计算能力,并可支持实际使用需求将物理CPU进行虚拟化,梳理出可以利旧的设备列表如下:
设备型号
配置描述
系统描述
网卡及电源
数量
IBMX3650M4
Intel(R)Xeon(R)CPUE5-2650v2@2.60GHz8Core16G8*1TBSAS盘
Windowsserver2008R2
6口千兆网卡,双冗余电源
5
DELLPowerEdgeR720
Intel(R)Xeon(R)CPUE5-2670v2@2.50GHz2*10Core16G5*500GBSAS盘
CentOS6.5
4口千兆网卡,双冗余电源
11
DELLPowerEdgeR720
Intel(R)Xeon(R)CPUE5-2609v3@1.90GHz2*6Core16G4*1TBSAS盘
CentOS6.5
4口千兆网卡,单电源
3
DellPowerEdgeR720XD
Intel(R)Xeon(R)CPUE5-2650v2@2.60GHz8Core64G,2*256GSSD盘,12*480GSSD盘
CentOS6.5
4口千兆网卡、2光口,双冗余电源
3
DellPowerEdgeR720XD
Intel(R)Xeon(R)CPUE5-2650v2@2.60GHz8Core64G
CentOS6.5
4口千兆网卡、2光口,双冗余电源
1
DELLPowerEdge
R630
Intel(R)Xeon(R)CPUE5-2697v3@2.60GHz2*14Core128G,2*480GBSSD盘
CentOS7.1
6口千兆网卡,双冗余电源
3
DellPowerEdge
R720
Intel(R)Xeon(R)CPUE5-2670v2@2.50GHz2*10Core16G,3*300GBSAS盘
ubuntu14.04
4口千兆网卡,双冗余电源
1
同时,考虑互联网推流、时移回看推流、时移回看编转码等三个系统要求性能、IO较高、使用专用设备,建议保留物理机部署方式,这3个业务占用设备情况如下:
业务名称
设备类型
设备数量
互联网推流
DellPowerEdgeR720XD
1
DellPowerEdgeR720XD
1
时移回看推流
DellPowerEdgeR720XD
2
时移回看编转码
DELLPowerEdgeR630
3
根据对未来业务增长情况的预估,本次项目建设计算资源在原有设备利旧资源基础上,新增计算资源池配置性能≥250GHzCPU主频、≥600G内存。
2、存储性能需求
目前数据中心可利旧存储情况:
设备型号
设备描述
容量(T)
数量
HPP2000
离线存储磁盘阵列
除系统冗余后,可用剩余为60T
1
HUAWEIS5600T
核心存储磁盘阵列
除系统冗余后,可用剩余为74T
1
OceanStor9000
分布式文件系统
除系统冗余后,可用剩余为78T
1
根据对未来业务增长情况的预估,本次项目建设计算资源在原有设备利旧资源基础上,新增存储资源可用容量300T。
2.整体方案规划
2.1.整体架构设计
2.1.1.设计原则
根据XXX数据中心发展的现状,结合成熟可落地的新兴IT技术,本次力生信息科技云数据中心的总体建设原则如下:
1、稳定性
应采取各种必要技术措施,保证信息化云服务平台具备有优秀的稳定性,在保证性能的前提下,为主要业务提供持续的支撑服务。
2、安全性
平台系统应能充分考虑用户数据的安全,避免用户受到异常攻击或敏感数据窃取。
应能主动评估业务系统的安全状况及提供弥补措施,并提供各种操作行为的可回溯能力。
3、可扩展性
平台应具备良好的扩展能力,满足数据中心长期发展的要求。
根据业务的发展预测,平台系统定期按照适度预留的原则进行建设,能在规定时间内快速响应新的用户,新的业务的新增要求。
4、灵活的IT基础架构
满足资源的随时随地按需分配,需要建立一个灵活的硬件基础架构。
硬件基础架构通常由虚拟的服务器池、共享的存储系统、网络和硬件管理软件组成。
5、自动化资源部署
云计算运行管理平台的核心功能是自动为用户提供服务器、存储以及相关的系统软件和应用软件。
用户、管理员和其他人员能通过Web界面使用该功能。
自动化的部署流程不仅能做到“随需应变”,适应用户的需求,而且能够带来以下好处:
引入技术和创新的时间缩短,设计、采购和构建硬件和软件平台的人力成本降低,以及通过提高现有资源的利用率和复用率节省成本。
6、端服务请求管理
云计算运行管理平台提供一个统一的管理平台来实现端到端的流程管理,协调各个部门的合作,提高管理效率。
同时该管理平台负责全部的人工交互界面,权限控制和用户管理等功能。
7、完善的资源监控及故障处理手段
云计算服务管理平台提供资源和服务的各种运维能力,可以监控资源的使用情况,对于平台故障提供及时地预警报警,保证云计算平台的稳定运行。
8、有助于建立IT管理规则
为了实现数据中心的规范管理,需要以云计算运行管理平台为基础,有助于为数据中心制定一套完整的管理规则。
9、开放性
要求各类系统设计、产品及网络构建都要满足相关的国际标准和国家标准,提供标准结构及接口。
2.1.2.总体技术架构
伴随着数据与业务的集中,传统数据中心的硬件架构已经无法满足业务的快速上线和灵活的业务部署。
本次云数据中心建设项目推荐使用深信服企业级云方案,即通过“云管平台+超融合架构”方案,基于分布式云数据中心架构,通过软件定义的方式实现全新的IT基础架构,通过服务器虚拟化将所有X86的计算资源池化、通过网络虚拟化构建出适合虚拟机迁移的大二层环境、最后通过存储虚拟化实现存储空间的融合。
基于VDC实现多组织/多业务共享资源,按需服务,通过云管平台实现多个数据中心资源的统一管理,同时提供完整的安全和灾备方案。
2.1.3.逻辑架构设计
2.1.3.1.逻辑架构视图
XXX数据中心总体架构包括基础架构层、超融合架构层、云服务层和云管层。
XXX数据中心总体架构
云服务和管理运营层主要由aCMP组件提供,具体功能如下:
1、自主服务门户
单点登录的自服务门户,管理员和用户在各自的门户视图上完成全部操作。
用户发起资源申请,各级管理员按照流程做出响应。
支持管理员自定义流程。
2、异构虚拟化管理
能够统一管理异构的虚拟化资源,管理员可在统一的界面中操作资源申请与分配、资源监控和运维管理。
3、数据库即服务
针对Oracle、SQLServer、MySQL做专门的性能优化和可靠性优化。
用户在云平台上通过向导自助申请数据库服务,实现数据库的快速交付和简化配置管理工作。
4、资源监控
具有丰富的监控功能,可监控CPU、内存、网络流量、磁盘IO等各项性能指标,帮助管理随时掌握资源使用动态。
5、多租户管理
具有三级管理权限,每个租户含租户管理员和租户的用户,避免租户网络安全威胁,支持租户资源配额。
6、快速备份
具有丰富的自动备份策略,能够实现分钟级的增量备份。
超融合架构层包括的主要组件有服务器虚拟化aSV、存储虚拟化aSAN、网络虚拟化aNET、安全虚拟化aSEC。
超融合架构层主要组件及其功能
模块
主要功能描述
服务器虚拟化aSV
●虚拟机管理
提供虚拟机的全生命周期管理,包含创建、删除、更新配置、备份、挂起、重启等,并能全面监控虚拟机状态,确保虚拟机正常运行。
●虚拟机HA
当主机、网络、虚拟机自身等出现故障时,能将此虚拟机切换到其他的主机上重新启动运行,保障虚拟机上的业务正常使用。
●虚拟机热迁移
支持虚拟机从一台服务器迁移到另一台物理服务器,业务不中断,数据不丢失。
降低宕机带来的风险、减少业务中断的时间。
●动态资源调度
能够对资源持续监测,通过负载均衡机制,持续执行资源动态平衡,将虚拟机迁移到有更多可用资源的主机上,确保每个虚拟机在任何节点都能及时地调用相应的资源,降低出现资源抢占的风险。
●动态资源扩展
系统能够监控业务虚拟机资源使用率,当虚拟机业务资源使用率过高时,可以自动给虚拟机添加CPU、内存,以保障业务的正常运行。
存储虚拟化aSAN
●存储多副本技术
通过对虚拟机文件在多台物理服务器实时写入,实现多副本保存,提高了存储的高可靠性。
●数据保障机制
在主机或者磁盘故障后,超过了设置的超时时间依然没有人工介入处理,aSAN将会自动进行数据重建,以保证数据副本数完备,确保数据可靠性。
●存储自动精简配置
通过该技术只需要提供给虚拟机实际使用的存储空间,而不是配置的,并且未来可以随时扩展。
可以显著减少已分配但是未使用的存储空间,提高了资源利用率。
●高性能存储
通过I/O本地化、混合磁盘模式、读写优化算法、存储分层等多项自研存储技术,为业务提供高IO、大容量的共享存储资源。
●在线扩容
提供在线添加磁盘或主机功能,在扩容过程中业务不中断,能够解决业务增长带来的资源不足问题。
网络虚拟化aNet
●分布式虚拟交换机
能够在多台主机中逻辑上组成一个分布式交换机,实现虚拟机的网络管理和实时化网络监控,并能保证虚拟机在主机之间迁移时网络配置的一致性。
●虚拟路由器
提供自带HA的虚拟路由器,可解决虚拟化后不同网络间路由问题,并能够实现VLAN子网口、NAT规则、ACL策略、DHCP地址池、DNS代理等传统路由器的功能。
●分布式虚拟防火墙
集成的分布式防火墙,能够为每一个虚拟主机提供防火墙保护,实现虚拟化主机间的微隔离,虚拟机迁移到任何的主机上,依然保留原有的防火墙策略。
并且管理员通过简单的配置管理,即可实现对防火墙策略的统一下发。
●网络探测功能
通过发送带有标签的icmp报文并跟踪记录该报文在转发平面经过的每一跳的信息,经过汇总后统一分析,最终得出故障点和故障原因。
●业务逻辑拓扑所画即所得
管理员可以通过管理平面从资源池中调取相应的资源,并通过拖拉连线等方式,描绘出不同的拓扑架构。
后台会自动根据业务逻辑拓扑进行底层真实的环境创建,从而屏蔽了底层的复杂性。
●全网流量可视
通过实时记录每一个虚拟网络设备的任何端口的流量,从而在业务拓扑上形成全网流量可视,帮助管理员随时掌握网络资源使用动态。
安全虚拟化aSEC
●vAF
vAF是深信服的下一代防火墙NFV功能,能够提供L2-L7层安全可视的全面防护,通过双向检测网络流量,有效识别来自网络层和应用层的内容风险。
●vAD
vAD是深信服的应用交付NFV功能,集服务器、链路、数据中心负载均衡和应用性能优化功能于一体,是构建高可靠、高效率业务架构的绝佳选择。
●vSSL
vSSL是可以部署在虚拟化环境的IPsec/SSL二合一VPN,具有部署简单、维护成本低、云端适应能力强等特点,具备将云端业务轻松完成对外安全发布的能力,为用户提供在任何时候、任何场所,使用任何主流设备快速接入云端网络、运行内部应用的服务。
●vAC
vAC是深信服上网行为管理NFV功能,以用户识别、终端识别、应用识别为基础,结合封堵、流控、审计等管理手段,全面应对互联网给组织带来的工作效率下降、带宽效率下降、泄密风险、法律风险及上网安全风险等挑战。
●vWOC
vWOC是深信服广域网优化NFV功能,具有协议优化、缓存、流压缩、流量整形、链路质量优化等多种技术,能够帮助用户加快关键应用的响应速度,为用户带来更高的投资回报比。
2.1.4.平台总体布局
//数据中心网络分区原则:
1、安全性原则
按照安全等级丌同,划分为不同分区
例如,为互联网用户,合作伙伴服务的服务器单独分区
信息敏感服务器单独分区
2、高可用布局原则
业务关联度高的服务器部署在同一个区域
业务关联度低的服务器拆分成多个区域
可用性要求高的业务拆分成两个对等区域。
3、容量适度原则
根据运维管理经验,控制单个区域内的服务数量,例如,500台以内未来服务器数量增加、区域间流量增长后可考虑进一步拆分
4、独立运维管理原则
业务流量、安全控制、组网协议方面有特殊要求的服务器单独分区。
XXX数据中心根据功能分区,划分为xx专网接入区、互联网接入区、第三方接入区、核心交换区、数据库业务区、内部生产业务区、传统架构业务区、开发测试业务区。
专网接入区,作为xx专网网访问系统资源的入口,承载直接面向xx专网用的业务接入资源。
第三方接入区,负责银行、监管机构、第三方机构与数据中心互联,例如使用专线来连接政府、银行等社会机构实现数据互联。
互联网业务区承载租户直接面向互联网用户的业务系统,包括但不限门户网站、网上服务大厅等,通过互联网接入区实现与互联网网络互通。
核心交换区,用于各区域数据的交互、隔离以及负载均衡。
安全管理区,用户管理员登陆认证、纪录操作行为,以及系统和应用的状态、日志监控等,承担统一的安全、运营运维、灾备等管理系统。
数据库区,为保障性能和可靠性,采用高性能集群部署,利用数据库自身集群技术(如OracleRAC,MSSQLAlwaysOn等),实现数据库高可用性。
考虑到数据库安全性,部署数据库审计产品,确保合法的数据读取访问,非法的请求可以做阻断。
内部生产业务区,所有的服务器均在云平台下实现服务器虚拟化、网络虚拟化、存储虚拟化和整体集群的冗余,主要承担内部生产办公系统,例如BOSS系统、ERP系统等。
传统架构业务区,为保障性能,主要基于传统服务器存储架构部署,主要承担互联网平台业务中需要采用传统架构部署的业务,例如推流、转码业务,该区域主要利旧原有服务器和存储设备。
开发测试业务区,负责前期业务系统的测试、开发、验证等工作。
集成虚拟防火墙功能,确保测试区域与生产环境做到安全隔离,测试验证过程中不影响到生产环境。
2.1.5.部署架构设计
2.1.5.1.一期部署
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- XXX 数据中心 项目 aCloud 企业级 技术 建议书