第1讲高性能计算与高性能计算机.ppt
- 文档编号:18627797
- 上传时间:2023-08-21
- 格式:PPT
- 页数:75
- 大小:9.57MB
第1讲高性能计算与高性能计算机.ppt
《第1讲高性能计算与高性能计算机.ppt》由会员分享,可在线阅读,更多相关《第1讲高性能计算与高性能计算机.ppt(75页珍藏版)》请在冰点文库上搜索。
本PPT部分内容来源于国家高性能计算中心(合肥),1,2023/8/21,2023/8/21,计算机学院计算机科学与技术系主讲:
陈蕾博士/副教授E-mail:
高性能计算与并行程序设计,本PPT部分内容来源于国家高性能计算中心(合肥),2,2023/8/21,2023/8/21,为什么要开设这门课程,本课程主要涉及高性能计算和并行程序设计,其核心是并行技术并行技术与当今计算机研究和应用的热点紧密相连:
1、多核技术(INTEL、AMD、IBM、SONY、SUN、NVIDIA)。
当你有了16个核的处理器怎么有效利用?
2、集群技术。
集群系统如今随处可见,如何有效使用它?
并行是唯一途径。
3、超级计算机。
超级计算机用于求解富有挑战性的计算问题.有效的大规模并行软件是发挥其性能的关键4、云计算、网格计算、服务计算、高性能计算、物联网技术5、大数据6、,本PPT部分内容来源于国家高性能计算中心(合肥),3,2023/8/21,2023/8/21,为什么要并行计算?
有限时间内解决复杂计算问题汽车碰撞实验:
32CPU4小时(一个工况)药物筛选:
64CPU,500万化合物,一年蛋白质折叠,256CPU、2个月只能算一个纳秒过程宇宙大尺度结构模拟:
256CPU,6个月,过去:
大量应用需求的驱动,需求驱动和技术推动,本PPT部分内容来源于国家高性能计算中心(合肥),4,2023/8/21,2023/8/21,为什么要并行计算?
今天:
计算机技术发展的推动,芯片上晶体管数目每18个月增长一倍,?
工艺:
90nm65nm32nm,逼近极限主频:
从3.0GHz到4.0GHz,步履艰难功耗:
单芯片百瓦功耗,mini型“核反应堆”,本PPT部分内容来源于国家高性能计算中心(合肥),5,2023/8/21,2023/8/21,并行计算平民化的到来!
每个程序员面临的多核并行计算时代,在单个芯片上内置多个处理单元“核”每个处理器视为小型的并行计算机双核四核多核,并行计算已经成为必然!
本PPT部分内容来源于国家高性能计算中心(合肥),6,2023/8/21,2023/8/21,如何进行并行(多核)计算?
思路最关键,并行思想,并行算法新的工具和实现方法MPI/OpenMP,GoggleHadoop,IntelC+,WindowsHPC等好的编程方法针对硬件结构,重视程序性能,本PPT部分内容来源于国家高性能计算中心(合肥),7,2023/8/21,2023/8/21,现实的情况1、需要通过显式并行的硬件系统走向普及:
集群计算机、多核处理器2、然而大家对于并行计算方法和工具了解和认识不足。
为此,开设这门课程希望把并行计算作为一种通用计算技术介绍给大家,本PPT部分内容来源于国家高性能计算中心(合肥),8,2023/8/21,2023/8/21,课程目的,澄清对并行计算的认识:
不是少数人的专利高性能计算随着机群系统、多核处理器的出现将逐渐普及到桌面系统了解高性能计算的前沿技术发展情况锻炼基本的资料检索、文献阅读、归纳整理和口头报告的能力实实在在体验并行软件开发并行编程语言实现并行程序性能与优化分析并行算法设计设计并行程序开发流程独立开展,本PPT部分内容来源于国家高性能计算中心(合肥),9,2023/8/21,2023/8/21,教材和主要参考书,教材:
暂无(提供电子教案)参考书:
1并行计算导论,张林波等,北京:
清华大学出版社,20062并行计算:
结构、算法、编程(修订版),陈国良等,北京:
高教出版社,20033并行程序设计(第二版),BarryWilkinson等,陆鑫达等译,北京:
机械工业出版社,20054MPI并行程序设计实例教程,张武生等,北京:
清华大学出版社,20095多核程序设计,陈天洲等,北京:
清华大学出版社,20076并行计算应用与实战,王鹏等,北京:
机械工业出版社,2009,本PPT部分内容来源于国家高性能计算中心(合肥),10,2023/8/21,2023/8/21,课程安排,理论并行计算机系统及其结构模型(当代对称多处理机、大规模并行处理机、机群系统)并行计算机系统的性能评测以及并行算法的设计基础、一般设计策略和一般设计过程介绍几种常见的分布式并行算法实践典型并行计算机系统PC机群的搭建消息传递(MessagePassingInterface,MPI)并行程序设计具体内容安排第一讲高性能计算与高性能计算机第二讲并行计算机系统及其结构模型第三讲PC机群的搭建(自学)第四讲并行算法设计的关键技术第五讲MPI并行程序设计语言第六讲并行算法设计实例,本PPT部分内容来源于国家高性能计算中心(合肥),11,2023/8/21,2023/8/21,第一讲高性能计算与高性能计算机,1.高性能计算的意义2.高性能计算的发展与现状3.高性能计算的典型应用4.高性能计算的挑战与机遇,本PPT部分内容来源于国家高性能计算中心(合肥),12,2023/8/21,2023/8/21,1.高性能计算的意义
(1),1.1高性能计算的内在含义1.2高性能计算的应用需求1.3高性能计算的战略地位,本PPT部分内容来源于国家高性能计算中心(合肥),13,2023/8/21,2023/8/21,1.高性能计算的意义
(2),1.1高性能计算的内在含义计算和计算科学所有的学科都转向定量化和精确化三大科学:
理论科学、实验科学和计算科学计算科学是一个交叉学科,用计算的方法来解决应用问题。
适用于理论模型复杂或尚未建立、实验费用昂贵或无法进行。
计算物理、计算化学、计算生物学、计算地质学、计算气象学。
并行计算是跟上摩尔定律的重要手段。
本PPT部分内容来源于国家高性能计算中心(合肥),14,2023/8/21,2023/8/21,1.高性能计算的意义(3),高性能计算的含义高性能计算简称HPC(HighPerformanceComputing),泛指量大、快速、高效的运算。
高性能计算主要包括:
向量计算并行计算分布式计算网格计算.,本PPT部分内容来源于国家高性能计算中心(合肥),15,2023/8/21,2023/8/21,1.高性能计算的意义(4),高性能计算的量纲,本PPT部分内容来源于国家高性能计算中心(合肥),16,2023/8/21,2023/8/21,1.高性能计算的意义(5),1.2高性能计算的应用需求应用需求计算密集型应用(Computing-intensive):
大型科学工程计算,数值模拟等。
应用领域:
石油、气象、CAD、核能、制药、环境监测分析、系统仿真等。
数据密集型应用(Data-intensive):
数字图书馆,数据仓库,数据挖掘,计算可视化等。
应用领域:
图书馆、银行、证券、税务、决策支持系统等。
通信密集型应用(Network-intensive):
协同工作,网格计算,遥控和远程诊断等。
应用领域:
网站、信息中心、搜索引擎、电信、流媒体等。
本PPT部分内容来源于国家高性能计算中心(合肥),17,2023/8/21,2023/8/21,1.高性能计算的意义(6),千万亿次超级计算机的应用需求,本PPT部分内容来源于国家高性能计算中心(合肥),18,2023/8/21,2023/8/21,1.高性能计算的意义(7),1.3高性能计算的战略地位从战略高度上讲高性能计算技术是一个国家综合国力的体现。
高性能高计算是支撑国家实力持续发展的关键技术之一。
高性能计算国防安全、高科技发展和国民经济建设中占有重要的战略地位。
重大挑战问题:
飞机设计、药物设计、全球气候预测、人类基因、海洋环流新材料、生物分子结构、半导体建模、超导建模等。
本PPT部分内容来源于国家高性能计算中心(合肥),19,2023/8/21,2023/8/21,1.高性能计算的意义(8),高性能计算在发达国家的战略地位
(1)美国有关发展高性能计算的建议报告从1982年到2005年,美国国防部、能源部、国家科学院、国家科学基金委以及美国总统信息技术顾问委员会、美国信息技术咨询委员会、美国国家竞争力委员会等提出的有关信息技术和计算机的建议报告中,大都涉及到了高性能超级计算机的内容。
本PPT部分内容来源于国家高性能计算中心(合肥),20,2023/8/21,2023/8/21,1.高性能计算的意义(9),高性能计算在发达国家的战略地位
(2)清单(按年代排序)1982年,美国国家科学院:
关于科学研究及工程中的大规模计算1993年,美国国家科学院:
从台式计算机到万亿次计算机:
充分发挥美国在高性能计算领域领导权1995年,美国国家科学院:
特别工作组关于未来国家科学基金委超级计算中心计划报告1996年,美国总统信息技术顾问委员会:
信息技术研究:
为了未来2000年,美国国家科学院:
促使信息技术更好2001年,美国国家科学院:
无处不在2002年,美国国防部:
适用于国家安全部门的高性能计算2003年,美国能源部:
基于科学的大规模模拟2003年,美国国家科学基金委:
通过计算机基础结构变革科学与工程2003年,美国国家科学基金委:
信息时代的知识丢失2004年,美国国家竞争力委员会:
促使美国变革并提高竞争力2004年,美国跨机构:
联邦高端计算计划高端计算复兴特别工作组2005年,美国国家科学院:
超级计算机未来2005年,美国总统信息技术顾问委员会:
计算科学:
确保美国竞争力,本PPT部分内容来源于国家高性能计算中心(合肥),21,2023/8/21,2023/8/21,1.高性能计算的意义(10),高性能计算在发达国家的战略地位(3)美国发展有关高性能计算的行动计划1993年,美国科学工程技术联邦协调理事会:
HPCC(HighperformanceComputing&Communication)GrandChallenge计划,提出发展万亿次(Tera=1012)计算机计划。
1996年,美国能源部和LawrenceLivermore、LosAlamos、Sandia三大核武器国家实验室:
ASIC(AcceleratedStrategicComputingInitiative)计划,提出发展千万亿次(Pera=1015)计算机的目标。
1997年,HPCC包括了HECC(HighEndComputing&Communication),被扩展为CIC(Computing,Information,Communication)计划。
1998年度的CIC蓝皮书,将千万亿次计算机硬件和软件研制列入了计划中。
2002年启动HPCS计划,希望确定未来10到20年超级计算机的体系结构。
本PPT部分内容来源于国家高性能计算中心(合肥),22,2023/8/21,2023/8/21,1.高性能计算的意义(11),高性能计算在发达国家的战略地位(4)美国1996年提出的ASCI(AcceleratedStrategicComputingInitiative)计划。
通过数值模拟,评估核武器的性能、安全性、可靠性等。
高分辨率、高逼真度、三维、全物理、全系统的规模和能力。
计划研制5代计算平台,目前,前四代已完成,第五代平台正在研制。
随着第一个十年研究结束,已经开始为下一个十年发展制订规划。
本PPT部分内容来源于国家高性能计算中心(合肥),23,2023/8/21,2023/8/21,1.高性能计算的意义(12),高性能计算在发达国家的战略地位(5)ASCI高性能计算机,本PPT部分内容来源于国家高性能计算中心(合肥),24,2023/8/21,2023/8/21,1.高性能计算的意义(13),高性能计算在发达国家的战略地位(6)美国2002年启动的千万亿次超级计算机研究HPCS计划从2002年起的两年多时间里,ES占据TOP1位置Cluster并不是HPC的最终体系结构美国DARPA于2002年启动高生产率计算系统(HighProductivityComputingSystems)HPCS计划希望确定未来10年甚至20年的高性能计算机体系结构高生产率而非峰值计算能力作为评价指标高性能计算的一个新的创新时代的开始,本PPT部分内容来源于国家高性能计算中心(合肥),25,2023/8/21,2023/8/21,1.高性能计算的意义(14),高性能计算在我国的战略地位
(1)2006年2月,国务院发布国家中长期科学和技术发展规划纲要(20062020年)指出加速发展高性能计算对提高我国国防建设与国家安全、国家经济建设、国家重大工程和基础科学研究等尖端科技领域的核心支撑能力,具有十分重要的战略意义。
提出要全面提升我国的自主创新能力,以期将我国在2020年前建设成为一个创新型国家。
本PPT部分内容来源于国家高性能计算中心(合肥),26,2023/8/21,2023/8/21,1.高性能计算的意义(15),高性能计算在我国的战略地位
(2)中国高性能计算发展大事记1983年,由国防科技大学研制的银河I型亿次巨型机系统的成功问世,标志着我国具备了研制高端计算机系统的能力。
1992年,曙光投入200万元研制曙光一号。
随后,曙光一号、曙光1000、曙光2000、曙光3000、曙光4000相继问世。
1994年,银河I的换代产品银河II在国家气象局正式投入运行,其系统性能达每秒10亿次,大大缩短了我国与先进国家的差距。
1997年,银河III并行巨型计算机在北京通过国家鉴定,峰值性能为每秒130亿浮点运算。
1999年,首台“神威I”计算机通过了国家级验收,并在国家气象中心投入运行。
2000年,由1024个CPU组成的银河超级计算机系统问世,峰值性能达到每秒1.0647万亿次浮点运算。
2002年,世界上第一个万亿次机群系统联想深腾1800出世,获得2004年国家科技进步二等奖。
2003年,联想深腾6800问世把世界机群计算推向新的高峰。
2004年,曙光4000A成功研制,使中国成为继美国、日本之后第三个能研制10万亿次商品化高性能计算机的国家(进入TOP500前10位)。
2005年,中国高性能计算机性能TOP100排行榜揭晓,曙光位居第一。
天梭荣获国家科学技术进步二等奖。
2006年,曙光高性能计算机被胡锦涛总书记点评为“中国七大标志性自主创新成果之一”,曙光4000系列高性能计算机荣获国家科学技术进步二等奖。
2007年12月,中国首台采用国产高性能通用处理器芯片“龙芯2F”的万亿次高性能计算机“KD-50-I”研制成功。
2008年6月24日,中国科学院计算技术研究所、曙光公司和上海超级计算中心在中科院计算所联合举行了曙光5000落户上海超级计算中心的签约仪式。
本PPT部分内容来源于国家高性能计算中心(合肥),27,2023/8/21,2023/8/21,1.高性能计算的意义(16),高性能计算在我国的战略地位(3)国产高性能计算平台,神威-I,银河-II,曙光-5000,联想-6800,本PPT部分内容来源于国家高性能计算中心(合肥),28,2023/8/21,2023/8/21,2.高性能计算的发展与现状
(1),2.1高性能计算机的发展2.2高性能计算机的现状2.3高性能计算面临的主要问题,本PPT部分内容来源于国家高性能计算中心(合肥),29,2023/8/21,2023/8/21,2.高性能计算的发展与现状
(2),2.1高性能计算机的发展历史回顾,本PPT部分内容来源于国家高性能计算中心(合肥),30,2023/8/21,2023/8/21,2.高性能计算的发展与现状(3),发展过程中的主流技术,本PPT部分内容来源于国家高性能计算中心(合肥),31,2023/8/21,2023/8/21,2.高性能计算的发展与现状(4),两类构造高性能计算机的方式,采用定制部件价格较高(小于1B$市场)对大规模或通信密集的任务进行了优化设计并行向量机,采用商用部件利用每年80B$的市场优势对一些计算密集任务有很好的性能MPP/机群,本PPT部分内容来源于国家高性能计算中心(合肥),32,2023/8/21,2023/8/21,2.高性能计算的发展与现状(5),并行向量机构造方式PVP采用全定制部件定制的高性能向量处理器(Gflops)节点内多体交叉共享存储(GB)定制的高带宽低延迟互连(交叉开关),本PPT部分内容来源于国家高性能计算中心(合肥),33,2023/8/21,2023/8/21,2.高性能计算的发展与现状(6),机群构造方式机群是一组独立的计算机(节点)的集合体:
机群的各节点都是一个完整的系统:
工作站,PC机或SMP互连通常使用高速互连网络,如Myrinet、Infiniband等各节点可以协同工作并表现为一个单一的、集中的计算资源,本PPT部分内容来源于国家高性能计算中心(合肥),34,2023/8/21,2023/8/21,2.高性能计算的发展与现状(7),2006年TOP500预测:
达到Petascale,本PPT部分内容来源于国家高性能计算中心(合肥),35,2023/8/21,2023/8/21,2.高性能计算的发展与现状(8),2.2高性能计算机的现状从Top500看高性能计算机现状(2009年)最快的高性能计算机:
1.105Pflops最普遍的高性能计算机:
机群(410台)安装高性能计算机最多的国家:
美国(291台),亚洲(49台,日本15台,中国21台,印度6台),欧洲(145台)生产高性能计算机的企业:
HP(212台),IBM(188台)高性能计算机中使用最多的微处理器:
Intel系列(399台),IBM(55台),AMD(43台)高性能计算机使用最广泛的领域:
企业与研究结构进入500强的最低性能:
17.1Tflops,半年前为12.64Tflops500强的总性能为:
22.6Pflops,半年前为16.95Pflops,本PPT部分内容来源于国家高性能计算中心(合肥),36,2023/8/21,2023/8/21,2.高性能计算的发展与现状(9),2.2高性能计算机的现状从Top500看高性能计算机现状(2013年)最快的高性能计算机:
33.86Pflops,前十名中:
美国5台,中国2台,德国2台,日本1台;已经有26套系统的最大性能迈入了PFlops(每秒千万亿次)级别;中国上榜超算66套,之前两次分别为72套、68套,基本保持稳定,而且始终仅次于美国位列世界第二(日本30套/-2)。
有了天河2,中国不但在数量上,性能上也超越日本,成为世界第二。
Intel处理器还是绝对主流,份额高达80.4。
88的系统所用处理器拥有六个或更多核心,67的不少于八核心。
500套系统总性能223PFlops,比半年前的162PFlops增长了37.6,比一年前的123PFlops则增长了81.3。
天河2一套就占了总性能的24.6,几乎五分之一!
美国252套占了一半还多,比上次有多了2套。
欧洲112套,比上次增加7套,还是不如亚洲119套(少了4套)。
英国、法国、德国分别有29、23、19套。
本PPT部分内容来源于国家高性能计算中心(合肥),37,2023/8/21,2023/8/21,2.高性能计算的发展与现状(10),近几年来Top1机器2001年,为IBMASCIWHITE,LINPACK峰值为12TFLOPS,处理器数目为8192。
2002年2004年上半年,为NECEarth-Simulator,LINPACK峰值为40TFLOPS,处理器数目为5120。
2004年下半年2007年11月,为IBMBlueGene,LINPACK峰值为478TFLOPS,处理器数目为212992。
2008年6月,Top1为IBMRoadrunner(走鹃),LINPACK峰值为1.026PFLOPS,处理器核数目为122400。
2009年6月,Top1为IBMRoadrunner(走鹃),LINPACK峰值为1.105PFLOPS,处理器核数目为129600。
本PPT部分内容来源于国家高性能计算中心(合肥),38,2023/8/21,2023/8/21,本PPT部分内容来源于国家高性能计算中心(合肥),39,2023/8/21,2023/8/21,2.高性能计算的发展与现状(New),天河2号,本PPT部分内容来源于国家高性能计算中心(合肥),40,2023/8/21,2023/8/21,2.高性能计算的发展与现状(New),天河2号,本PPT部分内容来源于国家高性能计算中心(合肥),41,2023/8/21,2023/8/21,2.高性能计算的发展与现状(New),天河2号,本PPT部分内容来源于国家高性能计算中心(合肥),42,2023/8/21,2023/8/21,2.高性能计算的发展与现状(11),IBMRoadrunner走鹃
(1),本PPT部分内容来源于国家高性能计算中心(合肥),43,2023/8/21,2023/8/21,2.高性能计算的发展与现状(12),IBMRoadrunner
(2)基本参数(2008年6月)6,480AMDOpteron处理器,51.8TB内存(in3,240LS21刀片)12,960IBMCell处理器,51.8TB内存(in6,480QS22刀片)216Systemx3755I/O节点26288-portISR2012Infiniband4xDDRswitches296机架2.35MWpower1.026PFLOPS,本PPT部分内容来源于国家高性能计算中心(合肥),44,2023/8/21,2023/8/21,2.高性能计算的发展与现状(13),IBMRoadrunner(3)混合(Hybrid)设计(2008年6月)通用处理器+专用处理器采用两种不同架构的处理器:
1.8GAMDOpteron双核处理器(X86架构)6912个处理器(6480个用于计算节点,432个用于系统操作和通信节点)共13824个cores(12960+864)3.2GIBMPowerXCell8i异构多核处理器数学运算比Opteron快30倍1个通用核(PowerProcessingElement:
PPE),8个专用核(SynergisticProcessingElement:
SPE)(共有9个处理器核)12960个PPEcores和103680个SPEcores共116640个cores(12960+103680)系统共有130464个cores(13824+116640),本PPT部分内容来源于国家高性能计算中心(合肥),45,2023/8/21,2023/8/21,2.高性能计算的发展与现状(14),IBMRoadrunner(4)刀片式机群架构(2008年6月)每个Triblade包含4个刀片,一个LS21Opteron刀片,一个扩展连接刀片,两个QS22Cell刀片。
LS21包含2个1.8GHz双核Opterons,16GB内存。
QS22包含2个3.2GHzPowerXCell8i处理器,8GB内存。
本PPT部分内容来源于国家高性能计算中心(合肥),46,2023/8/21,2023/8/21,2.高性能计算的发展与现状(15),IBMRoadrunner(5)一个Triblade包含4个刀片一个BladeCenterH框包含3个Triblade一个机架(rack)包含4个BladeCenterH一个连接单元CU(ConnectedUnit)包含15个机架Roadbunner包含18个CU,通过两级Infiniband互连,本PPT部分内容来源于国家高性能计算中心(合肥),47,2023/8/21,2023/8/21,2.高性能计算的发展与现状(16),ASCIBlueGene/L设计特点采用专门的System-on-a-chip技术减少功耗、体积、复杂度和设计难度实现低延迟、高带宽存储系统MPP结构可扩展到100k处理器采用三种互连网络:
Gb
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 性能 计算 计算机
![提示](https://static.bingdoc.com/images/bang_tan.gif)