
计算机
文章平均质量分 73
wbj0110
这个作者很懒,什么都没留下…
展开
-
Google Search Appliance 主机负载计划
抓取网址的数量上限您的许可指定了您可以抓取的网址的上限。 不过,如果您的网址尚未达到许可所规定的上限,您可以为想要抓取的网址指定较小的数量上限。 如果您输入的数字小于许可指定的总页数上限,您可以提高系统性能。 在您点击保存时间表和主机负载按钮后,系统最多比您指定数量多抓取约 10% 的内容。 系统抓取的网址要稍微多一些,这样在清除重复后,页数与您指定的上限将非常接近。请注意: 如果您将...原创 2013-09-09 10:03:36 · 126 阅读 · 0 评论 -
PHP/Shell大文件数据统计并且排序
诸多大互联网公司的面试都会有这么个问题,有个4G的文件,如何用只有1G内存的机器去计算文件中出现次数做多的数字(假设1行是1个数组,例如QQ号码)。如果这个文件只有4B或者几十兆,那么最简单的办法就是直接读取这个文件后进行分析统计。但是这个是4G的文件,当然也可能是几十G甚至几百G的文件,这就不是直接读取能解决了的。同样对于如此大的文件,单纯用PHP做是肯定行不通的,我的思路是不管多大文件...原创 2013-08-23 14:39:21 · 151 阅读 · 0 评论 -
PHP版单点登陆实现方案
摘要:本文主要介绍了利用webservice,session,cookie技术,来进行通用的单点登录系统的分析与设计。具体实现语言为PHP。单点 登录,英文名为Single Sign On,简称为 SSO,是目前企业,网络业务的用户综合处理的重要组成部分。而SSO的定义,是在多个应用系统中,用户只需要登陆一次就可以访问所有相互信任的应用系 统。动机:用过ucenter的全站登录方式...原创 2013-08-23 14:39:01 · 98 阅读 · 0 评论 -
php中抽象类和接口的概念和区别
[php] view plaincopy//抽象类的定义: abstract class ku{ //定义一个抽象类 abstract function kx(); ...... } function aa extends ku{ //实现抽象类的方法 function kx(){ ...原创 2013-08-22 15:01:10 · 106 阅读 · 0 评论 -
PHP 常用的反射函数
1. get_class — 返回对象的类名string get_class ([ object $obj ] )返回对象实例 obj 所属类的名字。如果 obj 不是一个对象则返回 FALSE。Note: 在 PHP 扩展库中定义的类返回其原始定义的名字。在 PHP 4 中 get_class() 返回用户定义的类名的小写形式,但是在 PHP 5 中将返回类名定义时的名字,如同扩展...原创 2013-08-22 14:55:08 · 217 阅读 · 0 评论 -
PHP5新特性--更加面向对象化的PHP
PHP处理对象部分的内核完全重新开发过,提供更多功能的同时也提高了性能。在以前版本的php中,处理对象和处理基本类型(数字,字符串)的方式是一样的。这种方式的缺陷是:当将对象赋值给一个变量时,或者通过参数传递对象时,对象将被完全拷贝一份。在新的版本里,上述操作将传递引用(可以把引用理解成对象的标识符),而非值。 很多PHP程序员可能甚至没有察觉到老的对象处理方式。事实上,大多数的php应用都可以很...原创 2013-08-22 13:17:42 · 157 阅读 · 0 评论 -
基数排序的一个变形应用
说起排序,大多数人在实际项目中很少自己去写一个排序,一般来说,qsort一行话就可以了。我也很少在实际项目中用到过基数排序,最近,写了一篇博客文章叫做: 字符串之全文索引 ,这篇文章的下一篇文章 要用到一个倍增算法。这个倍增算法,就可以非常巧妙的运用基数排序。作为那篇文章的一个铺垫,我专门写了一篇基数排序的文章。这篇文章里面的基数排序肯定是一个变形。大多数网上 或者 书上的基数排序都是从...原创 2013-08-21 17:33:37 · 116 阅读 · 0 评论 -
Yii学习--使用Yii来建立博客
Yii 之初体验 安装Yii创建应用骨架应用的工作流程在这一部分里,我们将讲解怎样建立一个程序的骨架作为着手点。为简单起见,我们假设Web服务器根目录是/wwwroot ,相应的URL是 http://www.example.com/。1. 安装Yii 首先,我们来安装Yii框架。 从 www.yiiframework.com 获取一份Yii的拷贝,解...原创 2013-08-20 14:53:18 · 421 阅读 · 0 评论 -
BTrace--动态跟踪Java代码的执行状况工具
非常强烈的推荐下BTrace这个工具,用了后不得不说太强大了,BTrace简单来说,就是能在不改动当前程序的情况下,运行时的去监控Java程序的执行状况,例如可以做到内存状况的监控、方法调用的监控等等,官方网站上有非常多详细的例子,我不说太多,只在下面举一个简单的例子来说明它的作用,BTrace的User Guide请见:http://kenai.com/projects/btrace/pag...原创 2013-08-20 09:02:58 · 139 阅读 · 0 评论 -
BTrace实现原理的分析
什么是BTrace?BTrace是SUN Kenai云计算开发平台下的一个开源项目。旨在为java提供安全可靠的动态跟踪分析工具。Btrace基于动态字节码修改技术(Hotswap)来实现运行时java程序的跟踪和替换。(还记得javarebel不?)Btrace的脚本是用纯java编写的,基于一套官方提供的annotation,使跟踪逻辑实现起来异常简单。实现原理用一个简单的公式...原创 2013-08-20 09:02:50 · 123 阅读 · 0 评论 -
memcache集群相关
memcached是怎么工作的? Memcached的神奇来自两阶段哈希(two-stage hash)。Memcached就像一个巨大的、存储了很多<key,value>对的哈希表。通过key,可以存储或查询任意的数据。 客户端可以把数据存储在多台memcached上。当查询数据时,客户端首先参考节点列表计算出key的哈希值(阶段一哈希),进而选中一个节点;客户端将请求发送给...原创 2013-08-23 14:39:48 · 124 阅读 · 0 评论 -
php网站架构【 百万级】
在了解过世界最大的PHP站点,Facebook的后台技术后,今天我们来了解一个百万级PHP站点的网站架构:Poppen.de。Poppen.de是德国的一个社交网站,相对Facebook、Flickr来说是一个很小的网站,但它有一个很好的架构,融合了很多技术,如 Nginx、MySql、CouchDB、Erlang、Memcached、RabbitMQ、PHP、Graphite、Red5以及T...原创 2013-08-23 14:40:10 · 229 阅读 · 0 评论 -
内链策略
1、文章页与相关内容页的链接 传奇世界私服 文章页面没有导出链接的权重是最高的,但是这样对于整站权重的提高是不可取的。内页的导出链接一定要遵从相关原则,比如当前的文章内容主要是关于颈椎病的,那么内页的相关文章可以以“专题页面”的形式把颈椎病的早起症状、治疗方法、危害列出来,这些是大类的。其次,针对每个类别,列出相关文章列表,这里用问答的形式展示,比如颈椎痛怎么办?颈椎病应该注意什么?挂什么...原创 2013-09-05 09:28:38 · 220 阅读 · 0 评论 -
谷歌地图开发入门
现在lbs搞的红火的很,基于地图的交友购物交通服务更是多如牛毛,几天就主要对谷歌地图开发一点初步,另外发现mapabc的开发接口很是详细,如果不是谷歌地图的话,感觉mapabc更容易入门,有很多现成的代码,学习起来更容易,对一些复杂的开发比较适合,例如房地产等开发,不过谷歌地图比较主流,一些简单的开发还是比较好的使用,官方手册是最好的学习资料http://code.google.com...原创 2013-09-02 09:43:07 · 284 阅读 · 0 评论 -
基于用户细分的比较分析
从网站的用户层面,我们根据用户访问的行为特征将用户细分成各种类型,因为用户行为各异,行为统计指标各异,分析的角度各异,所以如果要对用户做细分,可以从很多角度根据各种规则实现各种不同的分类,看到过有些数据分析报告做了各种用户的细分,各种用户行为的分析,再结合其他各种维度,看上去内容绝对足够丰富,但很难理解这些分析结果到底是为了说明什么问题,也许作为一个咨询报告反映当前整体的趋势和用户特征确实合适...原创 2013-08-31 17:53:53 · 115 阅读 · 0 评论 -
海量数据处理
1. 给定a、b两个文件,各存放50亿个url,每个url各占64字节,内存限制是4G,让你找出a、b文件共同的url?方案1:可以估计每个文件安的大小为50G×64=320G,远远大于内存限制的4G。所以不可能将其完全加载到内存中处理。考虑采取分而治之的方法。1)遍历文件a,对每个url求取,然后根据所取得的值将url分别存储到1000个小文件(记为a0,a1,a2...a999)中...原创 2013-08-29 10:06:33 · 109 阅读 · 0 评论 -
LAMP网站架构
LAMP(Linux-Apache-MySQL-PHP)网站架构是目前国际流行的Web框架,该框架包括:Linux操作系统,Apache网络服务器,MySQL数据库,Perl、PHP或者Python编程语言,所有组成产品均是开源软件,是国际上成熟的架构框架,很多流行的商业应用都是采取这个架构,和Java/J2EE架构相比,LAMP具有Web资源丰富、轻量、快速开发等特点,微软的.NET架构相比...原创 2013-08-29 10:06:16 · 113 阅读 · 0 评论 -
搜索引擎核心技术原理
1.概述搜索引擎(search engine)是指根据一定的策略、运用特定的计算机程序搜集互联网上的信息,在对信息进行组织和处理后,为用户提供检索服务的系统。2.搜索引擎分类按照信息搜集方法和服务提供方式的不同,搜索引擎系统可以分为三大类:全文搜索引擎(Full Text Search Engine)、目录索引类搜索引擎(Search Index/Directory)和元搜索引...原创 2013-08-28 10:39:30 · 1521 阅读 · 0 评论 -
一道智商测试题 月薪三万
智商测试开始:小明和小强都是张老师的学生,张老师的生日是某月某日,2人都不知道张老师的生日。 生日是下列10组中一天: 3月4日3月5日3月8日6月4日6月7日9月1日9月5日12月1日12月2日12月8日 张老师把月份告诉了小明,把日子告诉了小强,张老师问他们知道他的生日是那一天吗? 小明说:如果我不知道的话,小强肯定也不知道。 小强说:本来我也不知道,但是现...原创 2013-08-27 11:03:52 · 244 阅读 · 0 评论 -
网站的活跃用户与流失用户
网站用户管理的目标是发掘新用户,保留老用户。但仅仅吸引新用户还不错,还需要保持新用户的活跃度,使其能持久地为网站创造价值;而一旦用户的活跃度下降,很可能用户就会渐渐地远离网站,进而流失。所以基于此,我们可以对用户进行又一个细分&mdash;&mdash;活跃用户和流失用户。活跃用户与流失用户活跃用户,这里是相对于“流失用户”的一个概念,是指那些“存活”着的用户,用户会时不时地光顾...原创 2013-08-26 14:58:08 · 229 阅读 · 0 评论 -
网站关键词的分析
一、文章要害字优化: 文章要害字优化包罗要害字局势改变,要害字拆分,要害字规划,要害字密度四个局部。 A:要害字方式改换。优化文章时呈现要害字并不是一切要害字都非要以方针要害字的网站推行方式呈现,通常还会为了使句子更为通畅而选用其他的要害字方式。写文章的时分可以恰当的融入要害字的改变方式也不失为一种优化文章要害字的办法。通常要害字改变的方式包罗同义词、同义词、对同一件事物不一样说法的词等等。也...原创 2013-08-26 10:23:17 · 151 阅读 · 0 评论 -
RESTful架构
越来越多的人开始意识到,网站即软件,而且是一种新型的软件。 这种"互联网软件"采用客户端/服务器模式,建立在分布式体系上,通过互联网通信,具有高延时(high latency)、高并发等特点。 网站开发,完全可以采用软件开发的模式。但是传统上,软件和网络是两个不同的领域,很少有交集;软件开发主要针对单机环境,网络则主要研究系统之间的通信。互联网的兴起,使得这两个领域开始融合,现在我...原创 2013-08-20 09:02:39 · 95 阅读 · 0 评论 -
关于 IPv6 的10个误解
IPv6 还不能用于生产环境 IPv6 已经开发了20年了,最初的工作是在1992年展开的,叫做IP Next Generation,在1998年被标准化为 IPv6。在2008年在因特网上部署,并且2008年的奥运会服务器就支持 IPv6。在2011年6月8日,几个大型网站开始测试启用 IPv6,叫做Wor IPv6 还不能用于生产环境IPv6 已经开发了20年了,最初的...原创 2013-08-19 17:56:03 · 136 阅读 · 0 评论 -
Yii框架权限控制
需求:公司拥有一套用户权限系统。我们在新版框架中,我们需要兼容这套用户权限系统。 问题:YII单表方式已经满足不了我们的需求,急切需要对YII进行扩展设计,支持数据库分表设计 解决方法:1、新建protected/sinashowExt/JController.php文件 [php] view plaincopy /** * Contr...原创 2013-08-19 17:55:49 · 139 阅读 · 0 评论 -
maven实现依赖的“全局排除"
大多数java应用源码构建和依赖管理是使用maven来实现的,maven也是java构建和依赖管理的事实上的标准。我们的应用系统也都是基于maven构建的,maven虽然在依赖管理方面确实很牛叉,但是并不能很优雅地解决所有依赖的问题,比如此次谈及的“全局排除”功能。 之前包括现在都在经历这样的事情,想禁止一个依赖被依赖进来,如果这个依赖属于冷门的依赖,很少类库会间接依赖它,那么...原创 2013-08-17 17:24:24 · 259 阅读 · 0 评论 -
Quartz任务调度
了解Quartz体系结构 Quartz对任务调度的领域问题进行了高度的抽象,提出了调度器、任务和触发器这3个核心的概念,并在org.quartz通过接口和类对重要的这些核心概念进行描述: ●Job:是一个接口,只有一个方法void execute(JobExecutionContext context),开发者实现该接口定义运行任务,JobExecutionConte...原创 2013-08-16 11:42:27 · 152 阅读 · 0 评论 -
php配置yii框架(转)
yii具有很多当今web2.0开发所需要的特性。下边是一个简短列表。 MVC设计模式 :yii在WEB设计中采用经过验证的技术,可以较好的把显示与逻辑分离。DAO,活动记录:yii充许在对象方面建立数据库模型,保存长而重复语句。整合jquery:最流行的javascript框架之一,苦于jquery可以定屈非常高效并且多功能的javascript接口表单输入验证:yii可以很...原创 2013-08-16 11:01:03 · 145 阅读 · 0 评论 -
git使用说明
Linus为Linux Kernel Project发起的版本控制项目。HEAD代表当前最新状态。tag为某个状态的标签。SHA1为每个提交日志的唯一标识。 install: apt-get install git-core git clone: git仓库可以使用git clone获得:git clone git://url 也...原创 2013-08-16 10:21:42 · 100 阅读 · 0 评论 -
大型门户网站架构分析
千万人同时访问的网站,一般是有很多个数据库同时工作,说明白一点就是数据库集群和并发控制,这样的网站实时性也是相对的。这些网站都有一些共同的特点:数据量大,在线人数多,并发请求多,pageview高,响应速度快。总结了一下各个大网站的架构,主要提高效率及稳定性的几个地方包括:1、程序程序开发是一方面,系统架构设计(硬件+网络+软件)是另一方面。软件架构方面,做网站首先需要很多web服务器存储静态...原创 2013-08-16 00:07:13 · 354 阅读 · 0 评论 -
BTrace实际案例分析
问题表象问题描述1.最近有项目组的童鞋反馈,web页面频繁出现假死的状态。2.web页面的假死出现是概率事件,且无法确定假死的引发原因。3.是在一定的操作之后出现的,但是无法确定究竟是哪些操作引发这些操作。问题分析初步分析我们都知道web容器一般都是单实例多线程的方式工作的,当页面发起请求后,tomcat发分配一个线程进行当前请求的处理,当出现...原创 2013-08-14 17:16:12 · 121 阅读 · 0 评论 -
Java BTrace的使用
BTrace 是一个非常不错的java诊断工具, 最近试着用了一下, 文档比较少, 主要是看例子吧. BTrace 中的B表示bytecode, 表明它是在字节码层面上对代码进行trace 用来在运行中的java类中注入trace代码, 并对运行中的目标程序进行热交换(hotswap) btrace还提供了VisualVM Plugin 以及Netbeans Plugin术语 Probe...原创 2013-08-14 15:11:31 · 130 阅读 · 0 评论 -
在线调试工具BTrace 的使用--例子
BTrace 是一款利用hotSpot虚拟机可以动态替换class的特点而完成的,可以对online的程序动态的改变类的行为(一般为加些打印日志),进而进行线上调试的一个工具。主要步骤如下(本次测试只针对BTrace和测试的程序在同一台机器上,remote的还待实验):1、下载地址:http://kenai.com/projects/btrace/downloads/download/...原创 2013-08-14 14:50:05 · 179 阅读 · 0 评论 -
Apache和Nginx防盗链的几种配置方法
要实现防盗链,我们就必须先理解盗链的实现原理,提到防盗链的实现原理就不得不从HTTP协议说起,在HTTP协议中,有一个表头字段叫referer,采用URL的格式来表示从哪儿链接到当前的网页或文件。换句话说,通过referer,网站可以检测目标网页访问的来源网页,如果是资源文件,则可以跟踪到显示它的网页地址。有了referer跟踪来源就好办了,这时就可以通过技术手段来进行处理,一旦检测到来源不是本...原创 2013-08-14 13:29:53 · 161 阅读 · 0 评论 -
OOP-关于面向对象的哲学体系及科学体系的探讨
目录 Catelog 目录 Catelog 序言 Perface 真经第一章:世界 Waltanschauung 真经第二章:抽象 Abstraction ...原创 2013-08-17 17:24:42 · 234 阅读 · 0 评论 -
淘宝图片服务的学习
一、淘宝网的困境 对于淘宝网这样的大型电子商务网站,对于图片服务的要求特别的高。而且对于卖家来说,图片远胜于文字描述,因此卖家也格外看重图片的显示质量、访问速度等问题。根据淘宝网的流量分析,整个淘宝网流量中,图片的访问流量会占到90%以上,而主站的网页则占到不到10%。同时大量的图片需要根据不同的应用位置,生成不同大小规格的缩略图。考虑到多种不同的应用场景以及改版的可能性,一张原图有可能...原创 2013-08-17 17:25:00 · 138 阅读 · 0 评论 -
大型互联网网站架构心得
我们知道,对于一个大型网站来说,可伸缩性是非常重要的,怎么样在纵向和横向有良好的可伸缩性,就需要在做架构设计的时候考虑到一个分的原则,我想在多个方面说一下怎么分: 首先是横向的分: 1. 大的网站化解为多个小网站:当我们一个网站有多个功能的时候 我们知道,对于一个大型网站来说,可伸缩性是非常重要的,怎么样在纵向和横向有良好的可伸缩性,就需要在做架构设计的时候考虑到一个分的原...原创 2013-08-19 10:59:09 · 99 阅读 · 0 评论 -
BTrace 神器 简单实用教程
BTrace本身也是可以独立运行的程序,作用是在不停止目标程序运行的前提下,通过HotSpot虚拟机的HotSwap技术动态插入原本不存在的调试代码。比如遇到了我们的程序出问题,而又没有足够的打印语句时,我们一般的方法是不得不停掉服务,然后修改代码,增加打印语句,重新编译重新运行来解决,效率很低。但有了BTrace,我们需要做的就很简单了,举例说明:比如环境上运行着一个简单程序:...原创 2013-08-19 10:58:57 · 151 阅读 · 0 评论 -
Yii框架分库设计
需求:原网站功能庞大,数据库服务器与数据库众多,有部分数据单库多表都不足以应付业务的快速增长(例如用户系统)。我们便有了分库的需求 问题:YII单DB方式已经满足不了我们的需求,急切需要对YII进行扩展设计,支持数据库分库设计 解决方法: 1、在protected/component目录下面新建一个JUnicomActiveRecord.php文件。代码如下: ...原创 2013-08-19 10:58:43 · 117 阅读 · 0 评论 -
Yii框架分表设计
需求:原网站功能庞大,数据库服务器与数据库众多,有部分数据单表已经无法满足我们的需求。我们便有了分表的需求 问题:YII单表方式已经满足不了我们的需求,急切需要对YII进行扩展设计,支持数据库分表设计 解决方法:1、新建protected/sinashowExt/JActiveRecord.php文件 [php] view plaincopy ...原创 2013-08-18 09:16:44 · 233 阅读 · 0 评论 -
Yii框架相关说明
db组件 'schemaCachingDuration'=>3600, 为什么不起做用?需要开缓存如何在页面下边显示sql的查询时间在log组件的routes中加入array('class'=>'CProfileLogRoute','levels'=>'error, warning',)同时在db组件中加入'enableProfiling'=>true,...原创 2013-08-18 09:16:28 · 249 阅读 · 0 评论