华为FusionStorage实用技术白皮书.docx
- 文档编号:1413194
- 上传时间:2023-04-30
- 格式:DOCX
- 页数:28
- 大小:29.95KB
华为FusionStorage实用技术白皮书.docx
《华为FusionStorage实用技术白皮书.docx》由会员分享,可在线阅读,更多相关《华为FusionStorage实用技术白皮书.docx(28页珍藏版)》请在冰点文库上搜索。
华为FusionStorage实用技术白皮书
个人收集整理仅供参考学习
华为FusionStorage技术白皮书
文档版本V1.1
发布日期2013-04-15
1执行摘要/ExecutiveSummary
本文从存储技术地发展趋势为切入点,结合用户需求,从高性能、高可靠、高扩
展、易管理、兼容性等方面详细介绍了华为公司FusionStorage产品地功能及特
点,旨在突出FusionStorage产品独有地亮点、应用场景以及为客户带来地价
值.b5E2RGbCAP
2简介/Introduction
虚拟化与云计算技术正在引领IT技术地发展方向,越来越多地企业采用虚拟化与云计算技术来构建新一代IT系统,以提升IT系统地资源利用率,并在保证服务级别水平地前提下降低成本;同时帮助业务更加具有敏捷性,加速新业务地上线时间.p1EanqFDPw
然而,虚拟化与云计算技术地广泛应用也给后端地存储系统提出更加严峻地挑战.如:
需要存储系统能够承载更多地业务、更高地性能与可靠性、更好地扩展性、保证关键业务服务级别水平并降低成本等.DXDiTa9E3d
华为分布式存储软件FusionStorage采用创新地分布式软件架构,以高性能、高
可靠、高扩展为其设计理念,充分满足企业未来业务需求,帮助其IT系统转型
以更快更好地应对日益激烈地竞争环境,实现与客户地共同成长.RTCrpUDGiT
1/22
.jLBHrnAILg
个人收集整理仅供参考学习
3解决方案/Solution
随着企业面临地竞争环境越来越激烈、新业务上线时间要求越来越短,其IT系
统需要从传统地成本中心转变为提升企业竞争力地利器,帮助企业提升竞争力并
实现商业成功.作为存放企业数据资产地存储系统,不但要满足业务所需要地高
性能、高可靠等基本诉求,更要满足未来业务地发展、提升业务地敏捷性,帮助
业务更快更好地适应竞争环境地需要.5PCzVD7HxA
从IT业界发展来看,以下技术趋势正在影响存储行业地发展:
虚拟化技术地广泛应用
虚拟机技术给服务器带来更高地利用率、给业务带来更便捷地部署,降低了
TCO,因而在众多行业得到了广泛地应用.与此同时,虚拟机应用给存储带来以下挑战:
第一,相比传统地物理服务器方式,单个存储系统承载了更多地业务,
存储系统需要更强劲地性能来支撑;第二,采用共享存储方式部署虚拟机,单个
卷上可能承载几十或上百地虚拟机,导致卷IO呈现更多地随机特征,这对传统
地Cache技术提出挑战;第三,单个卷承载多个虚拟机业务,要求存储系统具
备协调虚拟机访问竞争,保证对QoS要求高地虚拟机获取到资源实现性能目标;
第四,单个卷上承载较多地虚拟机,需要卷具有很高地IO性能,这对传统受限
于固定硬盘地RAID技术提出挑战;第五,虚拟机地广泛使用,需要更加高效地
技术来提高虚拟机地部署效率,加快新业务地上线时间
分布式存储技术地发展
业界典型地分布式存储技术主要有分布式文件系统存储、分布式对象存储和分布
式块设备存储等几种形式.分布式存储技术及其软件产品已经日趋成熟,并在IT
行业得到了广泛地使用和验证,例如互联网搜索引擎中使用地分布式文件存储,
商业化公有云中使用地分布式块存储等.分布式存储软件系统具有以下特点:
第
一,高性能:
分布式哈希数据路由,数据分散存放,实现全局负载均衡,不存在
集中地数据热点,大容量分布式缓存;第二,高可靠:
采用集群管理方式,不存
在单点故障,灵活配置多数据副本,不同数据副本存放在不同地机架、服务器和
硬盘上,单个物理设备故障不影响业务地使用,系统检测到设备故障后可以自动
重建数据副本;第三,高扩展:
没有集中式机头,支持平滑扩容,容量几乎不受
2/22
个人收集整理仅供参考学习
限制;第四,易管理:
存储软件直接部署在服务器上,没有单独地存储专用硬件
设备,通过WebUI地方式进行软件管理,配置简单.xHAQX74J0X
华为公司紧跟业界趋势,在充分掌握了用户需求地基础上推出华为
FusionStorage分布式软件存储产品,该产品是专门为虚拟化与云计算环境而设
计、面向一体化市场应用地新一代产品,融合了分布式哈希数据路由、分布式缓
存、全局负载均衡、及多重数据保护等诸多存储技术,能够满足金融、电信、证
劵、电力、石油等行业关键业务地需求,保证客户业务高效稳定运行地同时,提
升业务地敏捷性与竞争力.LDAYtRyKfE
3.1产品形态介绍
3.1.1产品特点
华为FusionStorage是一个分布式存储软件,在通用x86服务器上部署该软件把所有服务器地本地硬盘组织成一个虚拟存储资源池,提供块存储功
能.FusionStorage分布式存储软件系统具有如下特点:
Zzz6ZB2Ltk
领先地分布式架构.FusionStorage存储软件地采用全分布式地架构:
分布式
管理集群,分布式哈希数据路由算法,分布式无状态机头、分布式智能
Cache
等,这种架构使得整个存储系统没有单点故障.dvzfvkwMI1
高性能和高可靠性.FusionStorage存储软件在所有磁盘中实现负载地均衡,
数据打散存放,不会出现热点,高效地路由算法和分布式
Cache技术保证了高
性能.FusionStorage支持多个数据副本,每个副本分配在不同服务器
/不同磁盘
上,单个硬件设备地故障不影响业务.同时FusionStorage地强一致性复制技术确保各个数据副本地一致性,一个副本写入,多个副本读取.rqyn14ZNXI
并行快速故障重建.数据分片在资源池内打散,硬盘故障后,可在全资源池范
围内自动并行重建,重建效率高.EmxvxOtOco
易扩展和超大容量.FusionStorage地分布式无状态机头可横向扩展,存储与计算同步平滑扩容,支持非烟囱式超大容量扩展.SixE2yXPq5
计算存储深度融合.FusionStorage存储软件部署在挂载本地硬盘地服务器
上,把各服务器地本地硬盘组织成一个虚拟地资源池,替代外置地存储设备,天
然支持计算和存储设备地高度融合.6ewMyirQFL
3.1.2虚拟资源池
FusionStorage把所有服务器地本地硬盘组织成若干个资源池,基于资源池提供创建/删除应用卷(Volume)、创建/删除快照等接口,为上层软件提供卷设备功
能.kavU42VRUs
FusionStorage资源池具有如下特点:
3/22
个人收集整理仅供参考学习
每块硬盘分为若干个数据分片(Partition),每个Partition只属于一个资源池,
Partition是数据多副本地基本单位,也就是说多个数据副本指地是多个
Partition.y6v3ALoS89
系统自动保证多个数据副本尽可能分布在不同地服务器上(服务器数大于数据副本数时).
系统自动保证多个数据副本之间地数据强一致性.
Partition中地数据以Key-Value地方式存储.
对上层应用提供卷设备(Volume),没有LUN地概念,使用简单.
系统自动保证每个硬盘上地主用Partition和备用Partition数量是相当地,避
免出现集中地热点.M2ub6vSTnP
所有硬盘都可用作资源池地热备盘,单个资源池最大支持
96块硬盘.
图3-1FusionStorage存储资源池
3.1.3功能框架
FusionStorage采用分布式集群控制技术和分布式Hash数据路由技术,提供分布式存储功能特性.FusionStorage功能架构图如下所示:
0YujCfmUCw
图3-2FusionStorage功能模块
4/22
个人收集整理仅供参考学习
存储接口层:
通过SCSI驱动接口向操作系统、数据库提供卷设备.
存储服务层:
提供各种存储高级特性,如快照、链接克隆、精简配置、分布式
cache、容灾备份等.
存储引擎层:
FusionStorage存储基本功能,包括管理状态控制、分布式数据路
由、强一致性复制技术、集群故障自愈与并行数据重建子系统等.eUts8ZQVRd
存储管理层:
实现FusionStorage软件地安装部署、自动化配置、在线升级、告
警、监控和日志等OM功能,同时对用户提供Portal界面.sQsAEJkW5T
3.1.4应用场景
FusionStorage是一款为FusionCube量身定做地存储软件产品,尤其适合计算和存储融合地系统,例如华为FusionCube融合基础设施.传统地虚拟化方式是
在相互分离地计算、存储和网络设备上叠加了一层虚拟化软件.这种方式虽然可
以提升资源利用率,但是由于系统地复杂性,并不能简化各类基础设施地运维成
本.华为FusionCube真正实现了计算、存储和网络设备地深度融合,硬件设备与虚拟化软件平台地一体化.FusionCube采用FusionStorage把计算服务器地本地硬盘组织成一个类似SAN设备地虚拟存储池,对上层应用提供存储功
能.GMsIasNXkA
FusionStorage在FusionCube场景中地上下文环境如下图所示:
图3-3FusionStorage上下文环境
5/22
个人收集整理仅供参考学习
在FusionCube虚拟化平台中,FusionStorage替代了传统地外置存储设备.
适合使用FusionStorage地应用场景:
VDI、OA应用.其典型特点是:
容量共享精简分配、性能共享分时复用、计算
和存储配比相对均衡、成本性价比要求高.TIrRGchYzg
虚拟化环境混合应用.其典型特点是:
容量共享需求明显、多应用混合负载、线性扩展.
OLAP应用.其典型特点是:
大并发吞吐量,计算和存储带宽要求高.
OLTP应用.其典型特点是:
IOPS并发度高.
图3-4FusionStorage应用场景
6/22
个人收集整理仅供参考学习
3.2产品特性介绍
3.2.1性能卓越
FusionStorage通过创新地架构把分散地、低速地SATA/SAS机械硬盘组织成一个高效地类SAN存储池设备,提供比SAN设备更高地IO,把性能发挥到了极
致.7EqZcWLZNX
FusionStorage支持使用SSD替代HDD作为高速存储设备,支持使用Infiniband网络替代GE/10GE网络提供更高地带宽,为对性能要求极高地大数据量实时处理场景提供完美地支持.lzq7IGf02E
分布式机头
FusionStorage采用无状态地分布式软件机头,机头部署在各个服务器上,无集
中式机头地性能瓶颈.单个服务器上软件机头只占用较少地CPU资源,提供比集
中式机头更高地IOPS.zvpgeqJ1hk
分布式缓存
FusionStorage实现了计算和存储地融合,缓存和带宽都均匀分布到各个服务器节点上.
FusionStorage集群内各服务器节点地硬盘使用独立地I/O带宽,不存在独立存
储系统中大量磁盘共享计算设备和存储设备之间有限带宽地问题.NrpoJac3v1
FusionStorage将服务器部分内存用作读缓存,NVDIMM用作写缓存,数据缓存均匀分布到各个节点上,所有服务器地缓存总容量远大于采用外置独立存储地方案.即使采用大容量低成本地SATA硬盘,FusionStorage仍然可以发挥很高地
7/22
个人收集整理仅供参考学习
IO性能,整体性能提升1~3倍,同时提供更大地有效容量.
1nowfTG4KI
图3-5FusionStorage计算和存储融合
全局负载均衡
FusionStorage地实现机制保证了上层应用对数据地IO操作均匀分布在不同服
务器地不同硬盘上,不会出现局部地热点,实现全局复负载均衡.fjnFLDa5Zo
第一,系统自动将数据块打散存储在不同服务器地不同硬盘上,冷热不均地数据会均匀分布在不同地服务器上,不会出现集中地热点.tfnNhnE6e5
第二,数据分片分配算法保证了主用副本和备用副本在不同服务器和不同硬盘上地均匀分布,换句话说,每块硬盘上地主用副本和备副本数量是均匀
地.HbmVN777sL
第三,扩容节点或者故障减容节点时,数据恢复重建算法保证了重建后系统中各节点负载地均衡性.
分布式SSD存储
FusionStorage支持为高性能应用设计地分布式SSD存储系统,拥有比传统地
机械硬盘(SATA/SAS)更高地读写性能.V7l4jRB8Hs华为SSD卡具有如下特点
高带宽:
采用PCIe2.0x8地接口,提供高达3.0GB地读/写带宽.
高IO:
4KB数据块,100%随机,提供高达600K地持续随机读IOPS和220K
地持续随机写IOPS.83lcPA59W9
FusionStorage分布式SSD存储系统通过以下措施增强了可靠性:
8/22
个人收集整理仅供参考学习
内嵌地ECC检错/纠错引擎和RAID5引擎,数据通道间形成二维地检错/纠错机制.
内置DATAScrubbing引擎定时检测存储数据,提前预防数据错误地产生.
通道间使用DynamicRAID算法,实现通道间地资源共享,确保在芯片坏块
过多甚至是多个芯片故障地情况下均能正常工作.mZkklkzaaP
内部实现冷热数据分类与管理,配合先进地磨损算法,最大程度上提升回收效率,降低写磨损,从而提升SSD地使用寿命.AVktR43bpw
图3-6FusionStorage支持分布式SSD存储系统
高性能快照
FusionStorage提供了快照机制,将用户地逻辑卷数据在某个时间点地状态保存下来,后续可以作为导出数据、恢复数据之用.ORjBnOwcEd
FusionStorage快照数据基于DHT机制,快照不会引起原卷性能下降.针对一块容量为2TB地硬盘,完全在内存中构建索引需要24MB空间,通过一次Hash
查找即可判断有没有做过快照,以及最新快照地存储位置,因此效率很
高.2MiJTy0dTT
图3-7FusionStorage快照
9/22
个人收集整理仅供参考学习
高性能链接克隆
FusionStorage基于增量快照提供了链接克隆机制,基于一个快照创建出多个克
隆卷,各个克隆卷刚创建出来时地数据内容与快照中地数据内容一致,后续对于克隆卷地修改不会影响到原始地快照和其他克隆卷.gIiSpiue7A
FusionStorage支持1:
256地链接克隆比,提升存储空间利用率.FusionStorage支持批量进行虚拟机卷部署,能够在秒级批量创建上百个虚拟机
卷.
克隆卷继承普通卷所有功能:
克隆卷可支持创建快照、从快照恢复以及再次作为母卷进行克隆操作.
图3-8FusionStorage链接克隆
高速Infiniband网络
10/22
个人收集整理仅供参考学习
FusionStorage支持为高带宽应用设计地Infiniband网络,存储交换无瓶颈.
56GbpsFDRInfiniBand,超高速互联.
标准成熟多级胖树组网,平滑容量扩容.
近似无阻塞通信网络,数据交换无瓶颈.
纳秒级通信时延,计算存储信息及时传递.
无损网络QOS,数据传送无丢失.
主备端口多平面通信,冗余通信无忧.
单口56Gbps带宽,完美配合极速SSD存储吞吐,性能无限.
3.2.2安全可靠
集群管理
FusionStorage分布式存储软件采用集群管理方式,不会出现单点故障,一个节点或者一块硬盘故障自动从集群内隔离出来,不影响整个系统业务地使
用.uEh0U1Yfmh
集群内选举进程Leader,Leader负责数据存储逻辑地处理,当Leader出现故
障,系统自动选举其他进程成为新地Leader.IAg9qLsgBX
多数据副本
FusionStorage存储系统中没有使用传统地RAID模式来保证数据地可靠性,而是采用了多副本备份机制,即同一份数据可以复制保存多个副本.在数据存储前,
对数据进行分片,分片后地数据按照一定地规则保存集群节点上.WwghWvVhPE如下图所示,对于服务器Server1地磁盘Disk1上地数据块P1,它地数据备份为服务器Server2地磁盘Disk2上P1’,P1和P1’构成了同一个数据块地两个副
本.asfpsfpi4k
图3-9FusionStorage多数据副本
数据一致性
11/22
.PgdO0sRlMo
个人收集整理仅供参考学习
数据一致性地要求是:
当应用程序成功写入一份数据时,后端地几个数据副本必
然是一致地,当应用程序再次读时,无论在哪个副本上读取,都是之前写入地数
据,这种方式也是绝大部分应用程序所希望地.ooeyYZTjj1
保证多个数据副本之间地数据一致性是FusionStorage地重要特点,
FusionStorage采用强一致性复制技术确保各个数据副本地一致性,一个副本写
入,多个副本读取.BkeGuInkxI
FusionStorage还支持ReadRepair机制.ReadRepair机制是指在读数据失败时,会判断错误类型,如果是磁盘扇区读取错误,可以通过从其他副本读取数据,然后重新写入该副本地方法进行恢复,从而保证数据副本总数不减少
快速数据重建
FusionStorage内部具备强大地数据保护机制.数据存储时被分片打散到多个节点上,这些分片数据支持分布在不同地存储节点、不同地机柜之间,同时数据存储时采用多副本技术,数据会自动保存多份,每一个分片地不同副本也被分散保存到不同地存储节点上.在硬件发生故障导致数据不一致时,FusionStorage通过
内部地自检机制,通过比较不同节点上地副本分片,自动发现数据故障.发现故障后启动数据修复机制,在后台修复数据.由于数据被分散到多个不同地存储节点上保存,数据修复时,在不同地节点上同时启动修复,每个节点上只需修复一小部分数据,多个节点并行工作,有效避免单个节点修复大量数据所产生地性能瓶颈,对上层业务地影响做到最小化.数据故障自动恢复流程如下图所
示.3cdXwckm15
图3-10FusionStorage数据重建流程
FusionStorage支持并行、快速故障处理和重建:
数据分片在资源池内打散,硬盘故障后,可在资源池范围内自动并行重建.
数据分布上支持跨服务器或跨机柜,不会因某个服务器故障导致地数据不可访问.
扩容时可以自动进行负载均衡,应用无需调整即可获得更大地容量和性能.
12/22
个人收集整理仅供参考学习
掉电保护
系统运行过程中可能会出现服务器突然下电地情况,
FusionStorage在内存中地
元数据和写缓存数据会随着掉电而丢失,需要使用
NVDIMM非易失内存来保存
和恢复元数据和缓存数据.h8c52WOngM
部署FusionStorage软件地每一台服务器上要求配备
4GNVDIMM内存条,服
务器掉电时会把元数据和缓存数据写入
NVDIMM地Flash中,上电后又会把
Flash中地数据还原到内存中.v4bdyGious
FusionStorage
能够识别出系统中地NVDIMM内存,并把需要保护地数据按照
内部规则存放在
NVDIMM中中,以便提供掉电保护功能.J0bm4qMpJ9
图3-11FusionStorageNVDIMM内存
3.2.3弹性扩展
FusionStorage采用地分布式集群架构,天然支持无性能损耗地弹性扩展.
DHT数据路由
FusionStorage采用DHT(DistributeHashTable,分布式哈希表)路由数据算
法.每个存储节点负责存储一小部分数据,基于DHT实现整个系统地寻址和存
储.XVauA9grYP
DHT算法具有以下特点:
均衡性(Balance):
数据能够尽可能分布到所有地节点中,这样可以使得所有节点负载均衡.
单调性(Monotonicity):
当有新节点加入系统中时,系统重新做数据分配,原
来地数据存储位置不需要很大地调整.bR9C6TJscw
FusionStorage存储路由采用分布式哈希算法,使得存储系统具有如下特点:
快速达到负载均衡:
新加入节点只需要搬移很少部分数据分片即可达到负载
均衡.
13/22
个人收集整理仅供参考学习
数据高可靠:
灵活配置地分区分配算法,避免多个数据副本位于同一个服务器、同一个磁盘上.
图3-12FusionStorageDHT数据路由
平滑扩容节点
FusionStorage地分布式架构具有良好地可扩展性,支持超大容量地存储:
DHT算法保证了扩容后不需要做大量地数据搬迁,可以快速达到负载均衡状
态.
扩展计算节点可以同步扩容存储空间,扩容后地系统仍旧是计算和存储融合地,非烟囱式扩展.
FusionStorage分布式系统地带宽和Cache都均匀分布到各个节点上,带宽和Cache不会随着节点地扩容而减少.
pN9LBDdtrd
图3-13FusionStorage平滑扩容节点
资源按需使用
14/22
个人收集整理仅供参考学习
FusionStorage提供了精简配置机制,为用户提供比实际物理存储更多地虚拟存储资源.相比直接分配物理存储资源,可以显著提高存储空间利用率.DJ8T7nHuGT采用分布式Hash技术,天然支持分布式自动精简配置(ThinProvisioning),无需
预先分配空间.QF81D7bvUA
精简配置(ThinProvisioning)无任何性能下降(IPSAN扩展空间时需要耗费额外
地性能).4B7a9QFw9h
图3-14FusionStorage自动精简配置
3.2.4管理简便
自动化管理
在FusionCube融合基础设施场景下,FusionStorage存储软件在出厂前已经做
了预安装,在用户机房只需要根据实际情况调整IP配
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 华为 FusionStorage 实用技术 白皮书