网站如何做分布式（集群）的大纲

最新推荐文章于 2025-12-09 16:59:39 发布

转载最新推荐文章于 2025-12-09 16:59:39 发布 · 645 阅读

文章标签：

本文探讨了采用分布式系统的必要性及应用场景，包括负载均衡、故障转移等，并深入分析了分布式环境下如何进行合理的应用与数据拆分。

一、提供多个对外的接口，按照一定规则，分派不同请求由不同接口来处理。
这时候需要考虑：

二、把一个功能拆分成多个功能，不同功能分布部署到不同服务器上

对外功能的拆分
- http://news.sina.com.cn/ http://sports.sina.com.cn/ http://mobile.sina.com.cn/
- http://www.microsoft.com/china/ http://www.microsoft.com/downloads/
- SOA
n层架构，其中的一些层分布到不同服务器上
- WEB + DB 模式

按照请求流程，我们可以在以下环节按照一定规则，把用户的请求分流到不同服务器上：

Web Client Level
- 例子：QQ 设置中你可以选择登陆的服务器IP
DNS Based Selection
- 优点：
- 缺点：
  - 不能区分服务器的差异，也不能反映服务器的当前运行状态。
  - DNS 的刷新需要时间，无法及时故障切换。
TCP balancing proxies
- 硬件
- 软件
HTTP-aware routers
URL重定向

如果发现某一部分应用需要做分布式了，就可以按照以下思路来考虑如何改造：

从应用所用数据看是否支持分布式

多份并存数据（一个数据存在多份）最大多长时间同步一次是可接受的。
- 内存缓存的数据跟数据库的数据（页面级缓存和业务逻辑缓存）
- 静态文件跟数据库
- 查询数据库跟业务变更数据库
数据按照一定规则拆分（一个数据只存在一份）对业务是否有影响
- 过去每年的数据迁移到一个对应历史库中。
- 专用的图片服务器 http://pics.ebaystatic.com/

此处可分析：QQ的在线用户数据，会是如何处理的呢？

从应用逻辑过程看是否支持分布式