门户网站架构设计文档.docx
- 文档编号:14463937
- 上传时间:2023-06-23
- 格式:DOCX
- 页数:20
- 大小:38.71KB
门户网站架构设计文档.docx
《门户网站架构设计文档.docx》由会员分享,可在线阅读,更多相关《门户网站架构设计文档.docx(20页珍藏版)》请在冰点文库上搜索。
门户网站架构设计文档
门户网站架构设计文档
门户网站架构 网站架构前台门户网站架构 设计方案 门户网站架构 目录 123 设计思路........................................................................................................................................................3系统结构........................................................................................................................................................3网络规划及性能计算..................................................................................................错误!
未定义书签。
网络架构................................................................................................................................................8网络架构说明......................................................................................................错误!
未定义书签。
采用双防火墙双交换机做网络冗余,保障平台服务.................................................................8采用硬件设备负载均衡器,实现网络流量的负载均衡.............................................................8系统测算..............................................................................................................错误!
未定义书签。
系统处理能力要求......................................................................................................................34业务处理能力要求......................................................................................错误!
未定义书签。
系统话务模型..............................................................................................错误!
未定义书签。
配置核算..............................................................................................................错误!
未定义书签。
数据库服务器性能核算..............................................................................错误!
未定义书签。
WEB服务器集群性能核算..........................................................................错误!
未定义书签。
WEB服务器集群内存性能核算..................................................................错误!
未定义书签。
网络带宽......................................................................................................................................354 性能模拟测试及性能推算..........................................................................................错误!
未定义书签。
测试环境..............................................................................................................错误!
未定义书签。
测试结果..............................................................................................................错误!
未定义书签。
1个客户端模拟不同线和并发请求结果.....................................................错误!
未定义书签。
10个客户端请求..........................................................................................错误!
未定义书签。
结果分析..............................................................................................................错误!
未定义书签。
根据测试结果推算..............................................................................................错误!
未定义书签。
设备清单..............................................................................................................................................35硬件设备配置清单......................................................................................错误!
未定义书签。
设备技术规格..............................................................................................错误!
未定义书签。
平台扩容的建议..................................................................................................................................35 网站架构 门户网站架构 1网站的性能瓶颈分析 网站的性能影响因素很多,下面主要从如下4个方面进行分析说明:
1)网络负载 a)公网负载b)内网负载2)WEB应用服务器性能 a)CPU b)存储,I/O访问c)内存 d)并发TCP/IP连接数3)数据库服务器性能 a)数据库参数配置 b)服务器性能c)数据结构的合理性 4)不同WEB应用的处理方式而对不同的性能瓶颈 a)对于静态的网站:
静态的HTML页面严格地标准的HTML标示语言构成,并不需要服务器端即时运算生成。
这意味着,对一个静态HTML文档发出访问请求后,服务器端只是简单地将该文档传输到客户端。
从服务器运行的那个时间片来看,这个传输过程仅仅占用了很小的CPU资源。
对于静态HTML的访问瓶颈为:
网络带宽、磁盘I/O以及cache(高速缓冲存储器)。
b)对于动态页面 因为服务器解析动态页面必须在其传输到客户端前就通过服务器来进行解释,这样就会给应用服务器添加额外的性能消耗,如果进一步要访问数据库,则会增加数据库服务器的性能消耗,则动态页面还有额外的瓶颈:
应用服务器的性能,数据库服务器的性能。
2系统架构设计 总体思路 为提高网站的高并发性能,提高开发效率及运营效率,主要按如下几个思路进行规划设计:
负载均衡 1)四层交换负载均衡:
采用负载均衡器来实现硬件级的四层交换负载均衡,或采用LVS来实现软件的四层交换负载均 衡。
网站架构 门户网站架构 2)通过第三方软件来实现负载均衡,同时实现页面请求的缓存。
通过Nginx实现反向代理服务器集群,同时搭建squid集群以作为静态页面和图片的缓存。
3)通过web服务器的配置来实现负载均衡 即通过apache或是Nginx将客户请求均衡的分给tomcat1,tomcat2....去处理。
WEB应用开发架构思路 1)应用开发实现MVC架构三层架构进行web应用开发 2)页面尽可能静态化以减少动态数据访问,如果是资讯类的网站可以考虑采用第三方开源 的CMS系统来生成静态的内容页面。
3)采用Oscache实现页面缓存,采用Memcached实现数据缓存4)采用独立的图片服务器集群来实现图片资源的存储及WEB请求数据存储的设计思路 1)数据库拆分,把生产数据库和查询数据库分离,对生产数据库采用RAC实现数据库的集 群。
2)采用高效的网络文件共享策略,采用图片服务器来实现页面的图片存储。
不同网络用户访问考虑 1)通过引入CDN来解决不同网络服务商的接入速度问题,一般只能解决静态页面的访问问题。
2)在不同运营商机房部署服务器,通过镜像技术来实现不同网络服务商的接入速度问题。
网站架构 门户网站架构 总体架构 网站的系统分层架构 硬件四层交换软件四层交换负载均衡器LVSNginxproxySquidNginxcache负载均衡反向代理软件WEB服务SquidcacheApacheTomatControl...TomatWEB服务器架构MVC应用架构应用级缓存Model数据持久层(ibatis)页面缓存(OSCache)View数据缓存(Memcached)查询数据库数据存储文件共享NFSHDFS数据库生产数据库网站架构
门户网站架构 网站的物理架构 Internet用户浏览页面负载均衡器1...服务器1服务器2服务器3服务器2代理服务器集群服务器n服务器2...服务器1服务器2服务器1服务器2服务器1服务器2服务器1服务器n图片服务器集群Web服务器集群AWeb服务器集群BSquid服务器集群 网站架构 门户网站架构 网站的开发架构 通讯层消息中心业务层WEB服务器持久层数据层数据存储SMSMMSWAPPUSH基于struts的MVC框架ControlORMI/O文件存储HDFS数据库消息中心WEB容器请求ibatis数据ViewModelDB连接池生产数据库JDBC页面缓存ApacheTomat...Tomat短信群发器彩信群发器C3p0生产数据库业务支撑模块后台支撑模块HTML静态化模块统计支撑模块查询数据库 网站架构 门户网站架构 网络拓扑结构 Internet主防火墙备防火墙主交换机VRRP备交换机负载均衡器1负载均衡器2...服务器2服务器1服务器n服务器1服务器n服务器2服务器2服务器2...服务器2服务器1服务器n服务器1服务器n服务器1服务器n服务器1服务器2代理服务器集群网站服务器集群图片服务器集群应用服务器集群光纤交换机生产DB服务器集群查询DB服务器组管理终端光纤交换机磁盘阵列柜磁盘阵列柜备注:
1)采用双防火墙双交换机做网络冗余,保障平台服务 采用双防火墙通知接通2线路互联网接入,设备之间采用VRRP协议,在任何一个防火墙、互联网发生故障后均可自动将流量切换到另一端,保证网站的正运行,设备或网络恢复后,自动恢复。
采用双千兆交换机分别接在2台防火墙上,当某台设备或者网络链路发生故障后,好设备自动接管已坏设备的工作,不影响网站的整体运行,根据业务及真实服务器的数量,交换机可以随时增加。
2)采用硬件设备负载均衡器,实现网络流量的负载均衡 使用硬件设备负载均衡器,将网络流量均衡的分担到WEB服务器集群各节点服务器,保障平台服务器资源均衡的使用。
3)采用代理服务器,实现软件级的网络负载均衡。
4)数据库服务器分离成生产数据库集群和查询数据库集群,实现生产读写与后台查询统计 进行分离,同时生产数据库采用rac技术进行 网站架构 门户网站架构 架构涉及技术的详解 负载均衡 1.基于DNS的负载均衡--一个域名绑定多个IP DNS负载均衡技术是最早的负载均衡解决方案,它是通过DNS服务中的随机名字解析来实现的,在DNS服务器中,可以为多个不同的地址配置同一个名字,而最终查询这个名字的客户机将在解析这个名字时得到其中的一个地址。
因此,对于同一个名字,不同的客户机会得到不同的地址,它们也就访问不同地址上的Web服务器,从而达到负载均衡的目的。
这种技术的优点是,实现简单、实施容易、成本低、适用于大多数TCP/IP应用;但是,其缺点也非常明显,首先这种方案不是真正意义上的负载均衡,DNS服务器将Http请求平均地分配到后台的Web服务器上,而不考虑每个Web服务器当前的负载情况;如果后台的Web服务器的配置和处理能力不同,最慢的Web服务器将成为系统的瓶颈,处理能力强的服务器不能充分发挥作用;其次未考虑容错,如果后台的某台Web服务器出现故障,DNS服务器仍然会把DNS请求分配到这台故障服务器上,导致不能响应客户端。
最后一点是致命的,有可能造成相当一部分客户不能享受Web服务,并且于DNS缓存的原因,所造成的后果要持续相当长一段时间(一般DNS的刷新周期约为24小时)。
所以在国外最新的建设中心Web站点方案中,已经很少采用这种方案了。
2.通过硬件四层交换实现负载均衡 在硬件四层交换产品领域,有一些知名的产品可以选择,比如Alteon、F5等,这些产品很昂贵,但是物有所值,能够提供非常优秀的性能和很灵活的管理能力。
Yahoo中国当初接近2000台服务器使用了三四台Alteon就搞定了3.通过软件四层交换实现负载均衡 软件四层交换我们可以使用Linux上常用的LVS来解决,LVS就是LinuxVirtualServer,他提供了基于心跳线heartbeat的实时灾难应对解决方案,提高系统的鲁棒性,同时可供了灵活的虚拟VIP配置和管理功能,可以同时满足多种应用需求,这对于分布式的系统来说必不可少。
一个典型的使用负载均衡的策略就是,在软件或者硬件四层交换的基础上搭建squid集群,这种思路在很多大型网站包括搜索引擎上被采用,这样的架构低成本、高性能还有很强的扩张性。
4.通过反向代理服务器实现负载均衡 反向代理服务器又称为WEB加速服务器,它位于WEB服务器的前端,充当WEB服务器的内容缓存器,反向代理服务器是针对WEB服务器设置的,后台WEB服务器对互联网用户是透明的,用户只能看到反向代理服务器的地址,不清楚后台WEB服务器是如何组织架构的。
当互联网用户请求WEB服务时,DNS将请求的域名解析为反向代理服务器的IP地址,这样URL请求将被发送到反向代理服务器,反向代理服务器负责处理用户的请求与应答、与后台WEB服务器交互。
利用 网站架构 门户网站架构 反向代理服务器减轻了后台WEB服务器的负载,提高了访问速度,同时避免了因用户直接与WEB服务器通信带来的安全隐患。
目前有许多反向代理软件,比较有名的有Nginx和Squid。
Nginx是IgorSysoev为俄罗斯访问量第二的站点开发的,是一个高性能的HTTP和反向代理服务器,也是一个IMAP/POP3/SMTP代理服务器。
Squid是美国政府大力资助的一项研究计划,其目的为解决网络带宽不足的问题,支持HTTP,HTTPS,FTP等多种协议,是现在Unix系统上使用、最多功能也最完整的一套软体。
1)Squid Squid是一个开源的软件,利用它的反向代理技术可以提高网站系统的访问速度,下面将重点介绍Squid反向代理的实现原理和在提高网站性能方面的应用。
Squid反向代理服务器位于本地WEB服务器和Internet之间,组织架构如下图:
客户端请求访问WEB服务时,DNS将访问的域名解析为Squid反向代理服务器的IP地址,这样客户端的URL请求将被发送到反向代理服务器。
如果Squid反向代理服务器中缓存了该请求 网站架构
门户网站架构 的资源,则将该请求的资源直接返回给客户端,否则反向代理服务器将向后台的WEB服务器请求资源,然后将请求的应答返回给客户端,同时也将该应答缓存在本地,供下一个请求者使用。
Squid反向代理一般只缓存可缓冲的数据,而一些CGI脚本程序或者ASP、JSP之类的动态程序默认不缓存。
它根据从WEB服务器返回的HTTP头标记来缓冲静态页面,有四个最重要HTTP头标记:
?
?
?
?
Last-Modified:
告诉反向代理页面什么时间被修改Expires:
告诉反向代理页面什么时间应该从缓冲区中删除Cache-Control:
告诉反向代理页面是否应该被缓冲 Pragma:
用来包含实现特定的指令,最常用的是Pragma:
no-cache 注:
DNS的轮询机制将某一个域名解析为多个IP地址。
2)Nginx Nginx(“enginex”)是俄罗斯人IgorSysoev(塞索耶夫)编写的一款高性能的HTTP和反向代理服务器。
Nginx已经在俄罗斯最大的门户网站──RamblerMedia上运行了4年时间,同时俄罗斯超过20%的虚拟主机平台采用Nginx作为反向代理服务器。
在国内,已经有新浪博客、新浪播客、搜狐通行证、网易新闻、网易博客、金山逍遥网、金山爱词霸、校内网、YUPOO相册、豆瓣、迅雷看看等多家网站、频道使用Nginx服务器。
Nginx特点如下:
1)工作在OSI模型的第7层2)高并发连接 官方测试能够支撑5万并发连接,在实际生产环境中跑到2~3万并发连接数。
3)内存消耗少 在3万并发连接下,开启的10个Nginx进程才消耗150M内存。
4)配置文件非常简单 风格跟程序一样通俗易懂。
5)成本低廉 Nginx为开源软件,可以使用。
而购买F5BIG-IP、NetScaler等硬件负载均衡交换机则需要十多万至几十万人民币。
6)支持Rewrite重写规则 能够根据域名、URL的不同,将HTTP请求分到不同的后端服务器群组。
7)内置的健康检查功能 如果NginxProxy后端的某台Web服务器宕机了,不会影响前端访问。
8)节省带宽 支持GZIP压缩,可以添加浏览器本地缓存的Header头。
9)稳定性高 用于反向代理,宕机的概率微乎其微。
3)Nginx+squid页面缓存来实现反向代理负载均衡 通过Nginx反向代理和squid缓存实现动静分离的架构图如下所示:
网站架构 门户网站架构 5.Apache+tomcat集群实现负载均衡。
使用apache和多个tomcat配置一个可以应用的web网站,用Apache进行分流,把请求按照权重以及当时负荷分tomcat1,tomcat2...去处理,要达到以下要求:
网站架构 门户网站架构 1)Apache做为HttpServer,通过mod_jk连接器连接多个tomcat应用实例,并进行负载均衡。
2)同时还要配置session复制,也就是说其中任何一个tomcat的添加的session,是要同步复制 到其它tomcat,集群内的tomcat都有相同的session,并为系统设定Session超时时间。
缓存 1.系统架构方面的缓存1)Squid缓存 架构方面使用Squid进行缓存。
注:
SQUID使用了LM算法,LM就是页面Header里时间(Date)和Last-Modified时间的差。
Date一般是Squid从后面取页面的时间,Last-Modified一般是页面生成时间。
2)Nginx的缓存功能 Nginx从版本开始,支持了类似Squid的缓存功能;缓存把URL及相关组合当作Key,用md5编码哈希后保存; Nginx的Web缓存服务只能为指定URL或状态码设置过期时间,不支持类似Squid的PURGE指令,手动清除指定缓存页面; 采用MMAP实现,设置的缓存区大小不能超过物理内存+SWEB的值3)基于memcached的缓存 nginx对memcached有所支持,但是功能并不是特别之强,性能上还是非常之优秀。
location/mem/{ if($uri~\ { set$memcached_key\ memcached_pass :
11211; } expires70;} 这个配置会将/mem/abc指明到memcached的abc这个key去取数据。
Nginx目前没有写入memcached的任何机制,所以要往memcached里写入数据得用后台的动态语言完成,可以利用404定向到后端去写入数据。
Nginx传统缓存的缺点也是它和squid等缓存软件的不同之特色,所以也可看作其优点。
在生产应用中它常常用作和squid的搭档,squid对于带?
的链接往往无法阻挡,而nginx能将其访问拦住,例如:
/?
和/在squid上会被当做两个链接,所以会造成两次穿透;而nginx只会保存一次,无论链接变成网站架构 门户网站架构 /?
1还是/?
123,均不能透过nginx缓存,从而有效地保护了后端主机。
nginx会非常老实地将链接形式保存到文件系统中,这样对于一个链接,可以很方便地查阅它在缓存机器上的缓存状态和内容,也可以很方便地和别的文件管理器如rsync等配合使用,它完完全全就是一个文件系统结构。
2.应用程序方面的缓存1)OSCache OSCacheOpenSymphony设计,它是一种开创性的JSP定制标记应用,提供了在现有JSP页面
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 门户 网站 架构 设计 文档