基于Java技术的大型网站架构方案

本文介绍了基于Java技术的大型网站架构方案,涵盖Web层、Cache层、中间层、存储、部署、负载均衡等方面。采用Struts作为Web层框架,利用Memcache进行集群缓存,推荐MySQL作为数据库,并详细阐述了数据库的拆分策略。在负载均衡方面,推荐使用Ngnix与Resin结合,以提高并发处理能力。此外,还提到了网络拓扑设计、监控统计平台以及针对IE浏览器的优化等关键点。

摘要生成于 C知道 ,由 DeepSeek-R1 满血版支持, 前往体验 >

Web层

  • 主体架构可以基于 Struts 1.X/2.X,当然有很多更好的控制层框架供选择,以快速敏捷为准则吧。
  • 抽象出核心库封装 控制器和中间层 的操作。
  • 在大规模集群环境下,session复制会引起严重的性能问题。考虑用 集群缓存 + cookie验证 代替session实现权限控制吧。

Cache层

  • 配置 Memcache 组成集群缓存
  • 对 Memcache 客户端进行封装
  • Memcached 节点组成池,调用示意:opList (BizName, 策略 ...)

中间层

“中间层”可以理解为基于应用和数据之间的层次。它被设计用来为Web应用提供:数据缓存 和 对应用透明的数据访问——即应用不需要考虑数据表拆分的问题。以服务的方式提供对存储层的高性能调用以及分布式计算。可供选择的框架:

  • ICE
  • Hadoop
  • 直接基于Memcache开发(减少复杂度,推荐)

存储

推荐MySQL,理由:免费,经过实践检验,有大量成熟的案例、解决方案、技术支持。

  • 小规模:一个 data table 维护存储服务器阵列,内容 -> mount ……
  • 大规模:Master-Slave模式+MySQL Proxy,实现数据库读写分离。在中间层的包装下,可做如下扩展,以支持更大规模的数据存取:
    • 数据库/表水平拆分,例 User -> User33% + User33% + User34%
    • 数据库/表垂直拆分,例 User -> UserBaseInfo + UserAddrInfo

也可考虑使用 LongStore (龙存) 解决方案,由龙存管理存储阵列……

部署

  • 划分子域名,每个子域名一个Web应用包,互不干扰
  • 静态资源(css, js, image ...)使用专门的静态服务器

负载均衡

小规模:DNS轮询。
大规模:F5, 2*X 台F5服务器,F5是L4/L7层交换机,每台至少可处理200万连接(与服务器内存有关)。
Ngnix是L7层交换,LVS负载均衡也是一种方案

Web中间件选择

  • Tomcat - 最高400并发
  • Apache - 最高2000并发
  • Ngnix - 优于Apache
采用方案:Ngnix + Resin ,理由:
  1. Resin提供更为快速的servlet引擎 - 选择Resin。
  2. gzip问题 - Resin在单独处理gzip时存在内存溢出的隐患,因此要加一层 Ngnix。
  3. Ngnix 能减少单独使用Resin时的内存占用 - Resin建立1000个连接使用1000个线程;加Ngnix后,透过其“异步连接”、“建立长连接”机制使Resin内存压力大大减小。
  4. Ngnix 针对Linux系统有性能优化措施 - 0 Copy, send file ...
因此采用:1 Ngnix + 1 Resin,一对一。

静态服务器采用:Squid + Apache, why? because Squid has cache ability ...
新变化 - Nginx从0.7.48版本开始,支持了类似Squid的缓存功能。这个缓存是把URL及相关组合当作Key,用md5编码哈希后保存在硬盘上,所以它可以支持任意URL链接,同时也支持 404/301/302 这样的非200状态码。虽然目前官方的Nginx Web缓存服务只能为指定URL或状态码设置过期时间,不支持类似Squid的PURGE指令,手动清除指定缓存页面,但是,通过一个第三方的Nginx模块,可以清除指定URL的缓存。
Nginx的Web缓存服务主要由proxy_cache相关指令集和fastcgi_cache相关指令集构成,前者用于反向代理时,对后端内容源服务器进行缓存,后者主要用于对FastCGI的动态程序进行缓存。两者的功能基本上一样。
最新的Nginx 0.8.31版本,proxy_cache和fastcgi_cache已经比较完善,加上第三方的ngx_cache_purge模块(用于清除指定URL的缓存),已经可以完全取代Squid。有的网站已经在生产环境使用了 Nginx 的 proxy_cache 缓存功能超过两个月,十分稳定,速度不逊于 Squid。
在功能上,Nginx已经具备Squid所拥有的Web缓存加速功能、清除指定URL缓存的功能。而在性能上,Nginx对多核CPU的利用,胜过Squid不少。另外,在反向代理、负载均衡、健康检查、后端服务器故障转移、Rewrite重写、易用性上,Nginx也比Squid强大得多。这使得一台Nginx可以同时作为"负载均衡服务器"与"Web缓存服务器"来使用。以下是配置片段供参考:

同时,对于影响页面展现的静态资源,例如:css, js 等可以放在具有优质带宽的IDC(IDC=互联网数据中心,优质/高速的带宽也比较贵,正所谓一份价钱一分货);其他的静态资源,如图片等可以放在价格相对低廉的IDC中,以域名区分两种静态资源,节省每一分钱。

网络拓扑图

         / Ngnix - 1:1 - Resin
F5 --
         / Squid - 1:n - Apache

监控统计平台

  • 业务统计 - 用户访问统计
  • 软件性能 - 应用系统监控,例如:请求响应时间……
  • 硬件/网络性能 - Ganglia监控

其它要点

  • IE浏览器对同一域名(包括子域名)只能建立2个连接,连接多了只能排队……
  • 双F5架构,两台职能划分不同,镜像,心跳接管……
  • Raid存储阵列……
  • Linux操作系统及其优化……

 

评论 1
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值