一、判断大型网站的标准
1、pv值(page views)网站浏览量
概念:一个网站,所有的页面,在一天24小时内,被访问的总量,达到千万级别,或百万以上。
2、uv值(unique visitor)独立访客
概念:一个网站,在一天24小时内,有多少个用户来访问我们的网站。uv值几十万个。
3、独立ip
概念:一个网站,在一天24小时内,有多少个独立IP来访问我们的网站。
【如果要考虑公司的局域网,uv值略大于独立ip的。】
二、大型网站带来哪些问题:
1、高的并发量。
并发量:一个网站的,在同一时间点(1秒内),有多少个用户正在请求同一个地址的网站。
2、大的流量(带宽)
带宽需求变大。
3、数据存储的问题。
当数据表里面的记录非常大,从容量来说,达到GT级别,要快速的查找到想要的数据。
三、高并发如何解决:
网站的架构,采用分层设计,使用负载均衡和集群。
四、如何解决大流量
1、防止网站的资源被盗链,存在于一些大的资源类型的网站。
2、减少了http请求(可以把一些css样式文件和js,一些背景图,合并成一个文件)
3、配置浏览器缓存(把一些更新不是很频繁的资源,比如css,js图片,缓存到浏览器端,当浏览器请求同一资源时,直接从浏览器缓存里面取出)。
4、配置压缩,减少数据传输量
5、可以把比较占流量的一些资源单独部署服务器。
6、花钱买带宽。
五、大存储的解决方案:
最终目标:不查询数据库或减少查询数据库,在查询数据库时,要快速的查询到数据。
1、使用服务器端的缓存。
(1)、磁盘缓存(页面静态化技术)
(2)、内存缓存(memcache,redis,mongodb,mysql的memory存储引擎)
2、优化数据库
六、页面静态化技术
把一个动态(操作数据库)的php页面,转化成一个静态的html页面
实现步骤
一个http请求,返回的数据分两部分,响应头部信息和响应主体。
(1)拿到响应主体数据内容。(ob缓冲)
(2)把响应主体数据内容,写入到html文件中,(file_put_contents)
(3)直接访问html文件。
1、ob缓存内容:
ob缓存:output_buffering(输出缓存),用于缓存响应主体的数据内容。
如何开启:
第一种方式:在php.ini中,【;output_buffering=4096】把前面的注释去掉
第二种方式:在页面中使用ob_start()函数,来开启。
两种方式的区别是,ob_start()只在当前页面有效,
2、常用函数
ob_start();开启
ob_get_contents();获取ob缓存里面的数据内容。
ob_clean();清空ob缓存里面的数据,不关闭ob缓存。
ob_end_clean();清空ob缓存里面的数据,并关闭ob缓存
ob_flush();把ob缓存里面的数据给刷新(移动,推送)到程序缓存,不关闭ob缓存。
ob_end_flush();把ob缓存里面的数据给刷新(移动,推送)到程序缓存,并关闭ob缓存。
3、网站静态化:
真静态:实实在在的生成一个html页面。
伪静态:从表面上看来是访问一个静态页面,实际上还是访问的是动态页面。【伪静态主要是有利于seo的】
实现方式:
真静态实现方式:
第一种:使用ob缓存技术
第二种:使用模板替换技术
伪静态的实现方式:使用apache的rewrite机制(url重写机制)