- 博客(95)
- 资源 (1)
- 收藏
- 关注
原创 中文分词的核心问题
中文分词是互联网公司必修的课程之一。分词有诸多好处,对于搜索引擎来说,最大的好处就是把索引之后的数据量降下来了。对于互联网公司的词典来说,规模都很大,一般会在几百万的级别上。今天和一个朋友聊天,说起互联网中用到的分词方法。朋友说,应该最主要注重两点:速度和线程安全。速度不言而喻,速度慢就意味着成本的增加。多线程是分词必修具备的功能。不然,搜索引擎无法使用它。分词的算法比较成熟,路径寻优基本上是
2009-02-19 21:47:00
1093
转载 婚礼上新郎经典发言稿
大家好!今天我由衷地开心和激动,因为我终于结婚了。一时间纵有千言万语却不知从和说起。但我知道,这万语千言最终只能汇聚成两个字,那就是“感谢”。首先要感谢在座的各位朋友在这个美好的周末,特意前来为我和xxx的爱情做一个重要的见证,没有你们,也就没有这场,让我和我妻子终生难忘的婚礼。其次,还要感谢xxx的父母,我想对您二老说,您二老把您们手上唯一的一颗掌上明珠交付给我这个年轻人保管,谢谢您们的信任,我
2008-04-02 17:10:00
807
转载 autoconf 和automake生成Makefile文件
http://blog.youkuaiyun.com/qipnx/archive/2008/03/16/2187254.aspx
2008-03-25 20:02:00
758
转载 linux必学的60个命令
inux必学的60个命令Linux提供了大量的命令,利用它可以有效地完成大量的工作,如磁盘操作、文件存取、目录操作、进程管理、文件权限设定等。所以,在Linux系统上工作离不开使用系统提供的命令。要想真正理解Linux系统,就必须从Linux命令学起,通过基础的命令学习可以进一步理解Linux系统。不同Linux发行版的命令数量不一样,但Linux发行版本最少的命令也有200多个。这里笔者把比较重
2008-03-25 10:43:00
4272
原创 中年家庭如何规划投资买房?
理财案例: 郑女士,34岁,小孩虚岁12岁,读六年级,家庭净年收入20万元左右,每月支出3000元,有两幢房子:一套住房,在老家,有贷款每月要还1300元,房子现在出租,收入和贷款相抵;一套商铺,首付已经付清,有贷款20万元,手头存款有15万元,还有2万多元基金,没有商业保险,现在想在杭州购买住房,老家房子的房价没有涨,不知道是不是该卖掉,想询问如何处置手中的房子,另外询问怎样更合理去支配现
2008-01-12 20:44:00
851
转载 年收入15万元家庭如何理财
理财案例: 读者方女士咨询:我今年35岁,有个11岁的小孩,目前我们家庭年收入15万元左右,家庭年支出5-6万元,有一套55平方米的房子,没有按揭,有一辆面包车,给儿子买了份太平洋保险,基金25万元左右,外借8-9万元,活期存款2万元左右,请问手头上的钱应该如何投资,投资哪一块? 家庭财务分析: 根据方女士提供的情况,其家庭属于典型的中层收入阶层,年收入15万元,支出5-6万元
2008-01-12 20:43:00
1460
转载 理财
股市风云变幻。据说2008年行情不错,但是专家又告诉我们这些小散,说是将比去年更难赚钱。于是我决定,今年还是继续跟着基金专家们走。经验告诉我,既然咱不专业,跟着专业理财走准没错。2006年5月,我先后买入3只封闭式基金,即184702基金同智(2007年2月封转开)、184738基金通宝(2007年5月封转开)、184700基金鸿飞,时隔一年,3只基金都有1-2倍的收益。 股市是虚拟经
2008-01-12 20:39:00
913
转载 看月薪2000元的工薪一族如何买房
现在有很多的大学生都是在毕业以后选择留在自己上学的城市,一来对城市有了感情,二来也希望能在大的城市有所发展,而现在很多大城市劳动力过剩,大学生想找到一个自己喜欢又有较高收入的职位已经变得非常难,很多刚毕业的朋友的月收入都可能徘徊在2 000元人民币左右,如果您是这样的情况,让我们来核算一下,如何利用手中的有限资金来进行理财。 如果您是单身一人,月收入在2 000人民币,又没有其他的奖金分
2008-01-12 20:36:00
689
转载 成功人士必知的理财知识:金字塔法则
对于每个理财人员来讲,理财金字塔是一个老生常谈的话题.其原理是:最底层较宽较稳健,它是建立理财规划的基石,包括风险较小的理财产品,如储蓄,保险,国债等等;中层是年期.风险.回报都在中等水平,如企业债券,金融债券,优先股,各类基金等等;顶部较窄,投入资金不多,承担风险多,收益相对较高的具有进取性的投资产品,如房屋,股票,期货等等 金字塔的尖顶有多高,底边有多长,要根据建设金字塔的人本身的希望.需要
2008-01-12 20:34:00
1198
转载 80后三口之家如何理财
王先生:我1981年出生,现在一家大型国有企业做中层经理,税后月收入9000元。太太是某私企行政人员,月收入2500元。房屋贷款1000元/月,基本生活开销5000元/月,每月结余约5500元。另外,我们还有年终奖金20000元,保险费支出7000元/年,存款、债券利息约有5000元左右,杂费支出约3000元。我们这对“80后”的小夫妻2005年结婚,如今两个女儿已经5个月大了,夫妻二人都有五险一
2008-01-12 20:20:00
1845
原创 Yahoo,我去也!
经过一段时间的求职,终于尘埃落定,去了yahoo。别管怎么样,一段新的征程也要开始了。总体来说这段时间还是比较郁闷的,先后被百度和腾迅拒之门外。 自身素质和公司的要求还是有一定差距的。从应聘过程中发现,公司需要那些能够发现问题,解决问题的人。尤其是解决问题,公司非常注重解决问题的能力,在面试的过程中出一些算法题,考查你这方面的能力,而对于你的项目经验或者所掌握的知识,他们并不看重,认为这些东西到公
2007-11-15 14:55:00
6025
1
转载 static的全部用法
static的全部用法 要理解static,就必须要先理解另一个与之相对的关键字,很多人可能都还不知道有这个关键字,那就是auto,其实我们通常声明的不用static修饰的变量,都是auto的,因为它是默认的,就象short和long总是默认为int一样;我们通常声明一个变量: int a; string s; 其实就是:
2007-11-15 08:38:00
836
转载 Linux下软件包的解压方式大全
Linux下软件包的解压方式大全 大致总结了一下linux下各种格式的压缩包的压缩、解压方法。但是部分方法我没有用到,也就不全,希望大家帮我补充,我将随时修改完善,谢谢!整理:会游泳的鱼来自:www.LinuxByte.net最后更新时间:2005-2-20 .tar 解包:tar xvf FileName.
2007-11-07 11:22:00
770
转载 Linux下软件包的解压方式大全
Linux下软件包的解压方式大全 大致总结了一下linux下各种格式的压缩包的压缩、解压方法。但是部分方法我没有用到,也就不全,希望大家帮我补充,我将随时修改完善,谢谢!整理:会游泳的鱼来自:www.LinuxByte.net最后更新时间:2005-2-20 .tar 解包:tar xvf FileName.
2007-11-07 11:17:00
1030
转载 Linux系统内核文件Cache管理机制
Linux系统内核文件Cache管理机制2007-08-26 15:00 1 、前言 自从诞生以来,Linux 就被不断完善和普及,目前它已经成为主流通用操作系统之一,使用得非常广泛,它与 Windows、UNIX 一起占据了操作系统领域几乎所有的市
2007-10-15 19:23:00
828
转载 同步传输、异步传输
在网络通信过程中,通信双方要交换数据,需要高度的协同工作。为了正确的解释信号,接收方必须确切地知道信号应当何时接收和处理,因此定时是至关重要的。在计算机网络中,定时的因素称为位同步。同步是要接收方按照发送方发送的每个位的起止时刻和速率来接收数据,否则会产生误差。通常可以采用同步或异步的传输方式对位进行同步处理。 1. 异步传输(Asynchronous Transmission): 异步传
2007-09-11 08:39:00
746
转载 C语言函数调用约定
在C语言中,假设我们有这样的一个函数:int function(int a,int b)调用时只要用result = function(1,2)这样的方式就可以使用这个函数。但是,当高级语言被编译成计算机可以识别的机器码时,有一个问题就凸现出来:在CPU中,计算机没有办法知道一个函数调用需要多少个、什么样的参数,也没有硬件可以保存这些参数。也就是说,计算机不知道怎么给这个函数传递参
2007-09-10 20:44:00
1150
转载 栈和堆的区别
一个由 c/C++ 编译的程序占用的内存分为以下几个部分:1 、栈区( stack )— 由编译器自动分配释放,存放函数的参数值,局部变量的值等。其操作方式类似于数据结构中的栈。2 、堆区( heap )— 一般由程序员分配释放,若程序员不释放,程序结束时可能由 OS 回收。注意它与数据结构中的堆是两回事,分配方式倒是类似于链表,呵呵。3 、全局区(静态区)( static )— 全局变量和静态变
2007-09-10 11:00:00
848
转载 static和extern的说明
static 是c++中很常用的修饰符,它被用来控制变量的存储方式和可见性,下面我将从 static 修饰符的产生原因、作用谈起,全面分析static 修饰符的实质。 static 的两大作用: 一、控制存储方式: static被引入以告知编译器,将变量存储在程序的静态存储区而非栈上空间。
2007-09-10 10:51:00
699
转载 linux下ulimit命令的具体作用
linux下ulimit命令的具体作用 ulimit -s设置应用栈大小。原来的太小,栈溢出。 2楼 gooboy (编啊编,爬啊爬 ) 回复于 2006-03-03 11:07:41 0 那默认的大小是多少呢,启动系统的时候是读哪个配置去初始化这个栈的大小呢? 我想在启动的时候就给他设置大一点 3楼 fierygnu (va_list ) 回复于 2
2007-09-02 21:39:00
1198
转载 调试内存
linux使用valgrind 工具检查内存泄露Valgrind是一款非常强大的工具集合,它包含有包括内存检测、CPU监测等多种工具,其中最常用的是内存检测功能,它能监测出以下的各种内存错误: 1. 访问非法内存区域 2. 使用未被初始化的内存区域 3. 非法释放内存,比如多次free一个内存 4. 内存泄露使用步骤: 1. 使用valgrind前需要使用-g参数编译源程序以便生成d
2007-09-02 18:21:00
1192
转载 关于SIGSEGV错误及处理方法
关于SIGSEGV错误及处理方法今天编程遇到了 SIGSEGV错误,比较困惑,所以找了些资料,总结一下: (1)官方说法是: SIGSEGV --- Segment Fault. The possible cases of your encountering this error are: 1.buffer overflow --- usually caused by a pointer refe
2007-08-23 19:09:00
7541
转载 栈和堆
堆(heap)和栈(stack)是C/C++编程不可避免会碰到的两个基本概念。首先,这两个概念都可以在讲数据结构的书中找到,他们都是基本的数据结构,虽然栈更为简单一些。 在具体的C/C++编程框架中,这两个概念并不是并行的。对底层机器代码的研究可以揭示,栈是机器系统提供的数据结构,而堆则是C/C++函数库提供的。 具体地说,现代计算机(串行执行机制),都直接在代码底层支持栈的数据结
2007-08-22 11:30:00
820
原创 杂记2007 8 22
1. 使用下标操作符,在一个类中重载了下标操作符,然后定义一个指针对象,利用这个指针调用下标操作符的方式:(*a)[ ]。2. multiple defination of (多重定义),一般在头文件中定一个函数,而这个函数并非内联,则可能出现这个错误。解决办法,将其放到cpp文件中,或者将其设置为inline。至于什么原因,我还需要进一步了解?3. 工程中许多文件在windows中写的,然后在l
2007-08-22 11:05:00
612
原创 工程进度
2007 8 8开始编写代码,其中几个部分是朱光文写的,然后自己参照firtex,在windows下写的代码,期间写到一半的时候,转到linux下把这些部分的错误代码,改正过来,然后又转到windows下,写其余的代码,第一次使用的是 UE,第二次使用的net,结果再转到linux就不好使了,出现了莫名奇妙的错误, 怎么也没有调试成功,最后没办法,在第一次写的基础上,把后来的代码逐个加上,慢慢调
2007-08-22 10:45:00
645
原创 工程进度记录
2007 8 6 我计划作索引合并可能已经快一个月了,至少半个月(大约三周了),这段时间可真谓一无所获 ,惭愧惭愧!我也不清楚下一步该如何做了。彻底晕倒了。为什么造成这种局面呢,我自己也说不明白,是不是工程太大了呢?这个不是主要原因,这个有点可笑,那我是什么原因呢?可能我一时半会还找不到,只能把现在情况记下来,留作以后分析吧。开始的决定做索引合并是发现,索引合并会使建索引的过程与爬虫组合,
2007-08-06 15:40:00
1062
转载 计算机编程英语词汇
算法常用术语中英对照 Data Structures 基本数据结构 Dictionaries 字典 Priority Queues 堆 Graph Data Structures 图 Set Data Structures 集合 Kd-Trees 线段树 Numerical Problems 数值问题 Solving Linear Equations 线性方程组 Bandwidth Reduc
2007-07-31 16:11:00
917
转载 关于项目的角色
“ 软件工程 ” 的学科至少包括三个重要的组成部分:产品设计、系统构架设计和项目控制,而相应地,软件开发队伍中也有三个重要角色:产品经理、系统架构师和项目经理。这三个角色直接关系着项目的成功或失败。以下是对这三个角色的分工的具体介绍:(部分摘自《程序员》,作者:刘天北) 《人月神话》一书
2007-07-23 21:41:00
3308
转载 Linux系统下SVN服务器的搭建过程详解
Linux系统下SVN服务器的搭建过程详解 1 环境: 服务器放在redhatAS4.0上,客户端在windows 2000。 2 软件包 2.1 服务器: subversion-1.3.2-1.rh90.i386.rpm。可能还会用到其他依赖组件,在我的配置中要用到:apr-0.9.5- 0.2.i386.rpm , neon-0.24.7
2007-07-23 20:38:00
1382
转载 详细解说 STL 排序(Sort)
详细解说 STL 排序(Sort) 作者Winter 详细解说 STL 排序(Sort) 0 前言: STL,为什么你必须掌握 1 STL提供的Sort 算法 1.1 所有sort算法介绍 1.2 sort 中的比较函数
2007-07-17 10:26:00
885
原创 2007 7 13博士谈话有感
2007年7月13日,星期五。今天中午父母过来,本打算回实验室取东西,碰巧许老师和王强博士师兄在谈话。许老师让我演示一下我们的程序。随后师兄发表了一些评论。我们三个人讨论一些问题。一个项目如何作?如何能够做得好?在我们的谈话中,我深深体会到公司的人员为什么要如此的加班加点。而这种现象的背后是公司的要求。而在学校没有这种要求,这样有很多的事情是没有干好的。没有做好的主要原因是心态问题,是作事情的态度
2007-07-13 14:35:00
621
转载 strings(字符串)详解(一)
之所以抛弃char*的字符串而选用C++标准程序库中的string类,是因为他和前者比较起来,不必担心内存是否足够、字符串长度等等,而且作为一个类出现,他集成的操作函数足以完成我们大多数情况下(甚至是100%)的需要。我们可以用 = 进行赋值操作,== 进行比较,+ 做串联(是不是很简单?)。我们尽可以把它看成是C++的基本数据类型。 好了,进入正题………首先,为了在我们的程序中使用stri
2007-07-13 08:33:00
922
原创 Linux 守护进程的编程方法[转载]
守护进程(Daemon)是运行在后台的一种特殊进程。它独立于控制终端并且周期性地执 行某种任务或等待处理某些发生的事件。守护进程是一种很有用的进程。Linux的大多数 服务器就是用守护进程实现的。比如,Internet服务器i
2007-07-12 07:54:00
1072
原创 Linux守护进程(转贴)
一. Linux守护进程简介 1.alsasound :Alsa声卡驱动守护程序。Alsa声卡驱动程序本来是为了一种声卡Gravis UltraSound(GUS)而写的,该程序被证明很优秀,于是作者就开始为一般的声卡写驱动程序。 Alsa和OSS/Free 及OSS/Linux兼容,但是有自己的接口,甚至比OSS优秀。 2.acpid:acpid(Advanced Configuration
2007-07-12 07:52:00
665
转载 fschange – Linux File System Change Notification
dnotify and inotify are the current file change notification services in the Linux kernel. Unfortunately, they share a couple of shortcomings that make it difficult to use them for efficient (real-tim
2007-07-12 07:31:00
1285
转载 Efficient in-memory extensible inverted file
AbstractThe growing amount of on-line data demands efficient parallel and distributed indexing mechanisms to manage large resource requirements and unpredictable system failures. Parallel and dist
2007-07-10 10:20:00
2201
转载 关于lucene断点续索引和增量索引的问题
关于lucene断点续索引和增量索引的问题1、 像百度、google等桌面搜索建立索引的时候可以停止后重新索引,他能保证以前索引
2007-07-08 21:58:00
5009
转载 lucene索引合并与增量索引
利用 Lucene,在创建索引的工程中你可以充分利用机器的硬件资源来提高索引的效率。当你需要索引大量的文件时,你会注意到索引过程的瓶颈是在往磁盘上写索引文件的过程中。为了解决这个问题, Lucene 在内存中持有一块缓冲区。但我们如何控制 Lucene 的缓冲区呢?幸运的是,Lucene 的类 IndexWriter 提供了三个参数用来调整缓冲区的大小以及往磁盘上写索引文件的频率。
2007-07-08 19:22:00
2056
原创 杂记
第二章进入系统(Accessing the system)翻译:hfzheng电子邮件:hfzheng@sohu.com转载请务必保留译者信息!用户帐号每个用户在系统中都必须有一个帐号,用来登录系统。全部用户帐号都在/etc/passwd文件中定义,该文件也包括了用来识别用户唯一性的元素。Root帐号Root帐号和密码在Solaris操作环境安装过程中设定。这是系统管理员用来进行具体的管理任务时
2007-07-07 18:27:00
634
转载 top 命令详解
top监控工具可以显示CPU占用率为前几位的进程,并提供CPU的实时活动情况top监控命令在FreeBSD上的使用top监控工具可以显示CPU占用率为前几位的进程,并提供CPU的实时活动情况语法:top [-s time] [-d count] [-q] [-h] [-n number] [-f filename] [-o field][-U usename]-S 将系统进程信息也显示到屏幕上,默
2007-07-07 18:22:00
1183
嵌入式系统设计的验证与调试技术
2011-03-28
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人