大型网站技术架构方案.ppt
- 文档编号:18717151
- 上传时间:2023-10-18
- 格式:PPT
- 页数:33
- 大小:3.13MB
大型网站技术架构方案.ppt
《大型网站技术架构方案.ppt》由会员分享,可在线阅读,更多相关《大型网站技术架构方案.ppt(33页珍藏版)》请在冰点文库上搜索。
“大型”网站技术架构探讨,大型网站架构的目标与挑战网站架构演变及其技术脉络架构设计理论与原则讨论及总结,大型网站架构的目标与挑战,何谓“大型”网站?
没有统一的判断标准,流量大小是一个重要指标,日均流量至少IP1,000,000才算大型网站,大型网站架构的目标与挑战,何谓“大型”网站?
网站内容是否“动态”才是关键,大型网站架构的目标与挑战,网站架构目标与挑战,每个目标背后面临着技术、设计、维护等诸多方面的挑战。
而目标本身的期望值也会根据实际情况进行调整,这也意味着网站架构建设是个不断调整的过程。
负载均衡数据备份异地容灾。
高速缓存并行计算异地镜像。
开发框架多层设计业务分割。
大型网站架构的目标与挑战网站架构演变及其技术脉络架构设计理论与原则讨论及总结,网站架构演变及其技术脉络,Step1Web动静态资源分离及其与DB物理分离,优点:
“简单”、安全性提高缺点:
存在单点,谈不上高可用性(highavailability架构目标)技术点:
应用设计要保证可扩展(framework很重要Spring/Beetle)、WebServer动/静态资源分离WebServer(ApacheNginxIISJBoss)、DatabaseServer(MysqlOracleRedis),Step1技术点Web动静态资源分离,img,doc,js,css等静态资源使用单独的WebHTTPServer处理请求动态页面静态化处理,网站架构演变及其技术脉络,Step2采取缓存处理,优点:
简单有效、维护方便缺点:
依然存在单点技术点:
客户端(浏览器)缓存、前端页面缓存、页面片段缓存、本地数据缓存/数据库缓存,网站架构演变及其技术脉络,减少对网站的访问,减少对Web应用服务器的请求,减少对数据库的查询,减少文件系统I/O操作,Step2技术点客户端(浏览器)缓存,能够让浏览器缓存的数据一定要缓存;浏览器能够处理的运算,决不放在服务器端来处理。
网站架构演变及其技术脉络,Step2技术点前端页面缓存,采用具备缓存功能的http反向代理服务器作前端页面缓存器,VarnishSquidNcacheAiCache(商业)【硬件F5】,网站架构演变及其技术脉络,Step2技术点页面片段缓存ESI(EdgeSideIncludes),ESI需要服务器端支持,常见apache(mod_esi)、WebLogic、JSP标签库(JESI)等。
网站架构演变及其技术脉络,Step2技术点本地数据缓存,需要从数据库系统和Web应用服务器两个层面考虑缓存优化,网站架构演变及其技术脉络,Step3增加机器做HA、数据库读写分离,网站架构演变及其技术脉络,优点:
增加服务器和HA机制,系统性能及可用性得到保证缺点:
读写分离,增加程序难度,架构变复杂,维护难度增加技术点:
负载均衡、DAL、数据库读写分离,Step3技术点负载均衡,网站架构演变及其技术脉络,Step3技术点数据库读写分离及DAL,网站架构演变及其技术脉络,读写分离逻辑分批负载均衡失效转移(failover)数据库分区透明支持两大实现模式:
独立Proxy服务器;单独API库文件,各个数据库厂商都有自己复制方案常见通用方案:
ETL、GoldenGateTJS,Step4CDN、分布式缓存、分库,网站架构演变及其技术脉络,优点:
异地缓存有效解决不同地方用户访问过慢的问题;分库策略带来网站性能整体提升缺点:
成本大幅增加,架构进一步复杂化,也维护难度进一步增大,架构开始臃肿了技术点:
CDN、分布式缓存、Shard分库,Step4技术点CDN,网站架构演变及其技术脉络,CDN(ContentDeliveryNetwork)内容分发网络将网站的内容分发到最接近用户的网络“边缘”,使用户可以就近获取,从而解决互联网网络拥挤的状况,提高用户访问的响应速度。
适合静态内容很多(如:
静态页面、图片、视频等)及页面内容实时性要求不高的网站,如:
新闻类门户网站CDN构建可以做的很简单,也可以很复杂,主要根据自己网站实际情况而定,Step4技术点分布式缓存,网站架构演变及其技术脉络,本地缓存性能优秀,但容量有限,无伸缩性采用分布式缓存方案突破容量限制,具备良好伸缩性;但分布式涉及远程网络通信消耗其性能本地缓存来得优秀,并可涉及节点状态维护及数据复制问题,其稳定性和可靠性是个挑战。
目前流行分布式缓存方案:
memcached、membase、redis等,基本上当前的NoSQL方案都可以用来做分布式缓存方案,Step4技术点分库,网站架构演变及其技术脉络,读写分离(简单有效,前面已介绍),垂直分区,良好的松耦合的模块化设计是垂直分库的前提,Step4技术点分库,网站架构演变及其技术脉络,水平分区(Shard),分片Key识别(划分检索依据)是关键,是否还有其它招?
用NoSql数据库部分替换关系数据库,Step5多个数据中心,向分布式存储和计算的架构体系迈进,网站架构演变及其技术脉络,优点:
多数据中心,带来更高质量区域服务体验;分布式存储及计算架构有效解决pb级数据量存储、检索及计算性能问题缺点:
架构复杂、数据同步、一致性及系统维护、技能要求等成本十分高技术点:
分布式文件系统、Map/Reduce、Key-Value存储,Step5技术点向分布式存储计算解决方案DFS、Map/Reduce、Key-ValueDB,网站架构演变及其技术脉络,DFS分布式文件系统,如:
LustreHDFSGFSTFSFreeNas等Map/Reduce算法(计算框架),基本上现有NoSQL数据库中都支持此算法。
Key-ValueDB,也作为NoSQL解决方案,如:
BigTableTairHbaseHyperTable等提供完整解决方案:
Google(GFS|Map/Reduce|BigTable)ApacheHadoop(HDFS|Map/Reduce|HBase),大型网站架构的目标与挑战网站架构演变及其技术脉络架构设计理论与原则讨论及总结,架构设计理论与原则,网站架构设计的精神食粮,架构设计理论与原则,关于数据一致性ACIDvsBASE,ACID(Atomicity、Consistency、Isolation、Durability)是关系型数据库的最基本原则,遵循ACID原则强调一致性,对成本要求很高,对性能影响很大。
问题:
ACID原则适用于互联网应用吗?
可用性似乎比一致性重要些,BASE(BasicallyAvailable、Softstate、Eventuallyconsistent)策略,BASE策略与ACID不同,其基本思想就是通过牺牲强一致性,以获得更好的可用性或可靠性,基本可用数据能够保证80%一致性就够了,剩下20%就不要过于纠结了。
可参考八二定律,软状态在不过分追求数据一致性(强一致性)前提下可考虑软状态策略,例如把数据缓存(State)在客户端一段时间,过后若没有新请求的话,就清除此缓存(Soft),最终一致性在某一段短时间内允许数据不一致,但经过一段较长时间,等所有节点上数据的拷贝都整合在一起的时候,数据会最终达到完全一致,架构设计理论与原则,关于分布式系统CAP理论,一致性分布式系统中,数据一般会存储在不同节点,一致性就是要保证对数据操作的原子性,可用性确保客户访问数据时可得到响应。
不强调各个节点上数据要保持一致性。
分区容忍性数据分区存储后,即使部分分区组件不可用,其施加的操作也能够完成,CAP理论指出:
一个分布式系统不可能同时满足一致性、可用性和分区容忍性这三项需求,最多只能同时满足其中两个。
架构设计理论与原则,无共享架构(ShareNothingArchitecture),架构设计理论与原则,ED-SOA架构,ED-SOA,事件驱动,面向服务架构,SOA是系统组件化、模块化构建性理论;ED是系统组件之间同步通信,采取事件机制异步化,提高响应速度,基于ED-SOA构建松耦合系统可以显著改善网站可伸缩性,架构进化与退化-奥卡姆剃刀原理,进化寻找最适合的;退化简化不必要的,简单就好,慎防过渡设计,架构设计理论与原则,考量成本,先硬后软原则,大型网站架构的目标与挑战网站架构演变及其技术脉络架构设计理论与原则讨论及总结,讨论及总结,大型网站架构是怎么样子的?
存在万能的架构吗?
架构本质是什么?
网站架构如何选型?
开发语言重要吗?
架构只是浮云?
神马才是重要的?
。
Thankyou!
-Q&A,
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 大型 网站 技术 架构 方案