
我的笔记
文章平均质量分 77
amuseme_lu
Don't Grow Old, Grow Up!
展开
-
MongoDB之Hadoop驱动介绍
MongoDB之Hadoop驱动介绍------------------------1. 一些概念 Hadoop是一套Apache开源的分布式计算框架,其中包括了分布式文件系统DFS与分布式计算模型MapReduce,而MongoDB是一个面向文档的分布式数据原创 2011-07-04 23:21:17 · 13918 阅读 · 5 评论 -
使用awk对文档中特定字段的排序
使用awk对文档中特定字段的排序----------------------------------------------------1. 问题定义现在要对如下文档按特定字段排序,lemo@debian:~/Testspace/awk$ cat fileName Sex Salary Lemo man 4000 Jok woman 3000 Job man 6000 P原创 2011-11-17 23:47:48 · 13148 阅读 · 1 评论 -
emacs Magit简单介绍
emacs Magit简单介绍---------------------1. 什么是Magit 在介绍Magit之前,我们先来了解一下什么是Git,Git 是 Linux Torvalds 为了帮助管理 Linux® 内核开发而开发的一个开放源码的版本控制软件,它是一个快速、可扩展的分布式版本控制系统,它具有极为丰富的命令集,对内部系统提供了高级操作和完全访问。而这里的Ma原创 2011-11-03 13:45:03 · 10840 阅读 · 0 评论 -
在Centos上安装RabbitMQ流程
在Centos上安装RabbitMQ流程------------------------1. 需求 由于项目中要用到消息队列,经过ActiveMQ与RabbitMQ的比较,最终选择了RabbbitMQ做为我们的消息系统,但是ActiveMQ在效率和可扩展性上都不错,只是网上很多人反应它会时常崩溃,而且随着消息并发数的增加,时常会出现连接很慢的情况。 目前我测试的服务器系原创 2011-12-15 15:35:44 · 14054 阅读 · 0 评论 -
Xapian 学习笔记 2 相关概念
Xapian 学习笔记 2 一些概念---------------------------1. 同步概念 Xapian没有显示的支持多线程,为了避免不必要的线程死锁,Xapian没有使用任何全局变量,所以你可以你的多线程应用中放心的使用Xapain对象,但是一些Xapian对象内部是有关联的,如Xapian::Database::get_document(),返回的对象Xapian原创 2012-05-30 13:34:35 · 6999 阅读 · 0 评论 -
Xapian 学习笔记 3 相关字段的排序
Xapian 学习笔记 3 相关字段的排序在Xapina中,命中文档的排序是以文档的相关度降序来做的,当两个文档的相关度一样时,按文档id的升序来做,你也可以通过设置enquire.set_docid_order(enquire.DESCENDING)来把其变成降序,或者设置成不关心文档id的排序enquire.set_docid_order(enquire.DONT_CARE);当然这个原创 2012-05-31 17:31:29 · 6414 阅读 · 0 评论 -
Xapian 学习笔记 4 分面搜索
Xapian 学习笔记 4 分面搜索------------------------1. 什么是分面搜索 分面搜索使用户可以动态的对用户所查询的命中文档进行特定属性的聚合,分面搜索在很多地方都有应用,特别昌电子商场中,用户输入一个查询条件,服务器返回这个查询所命中的文档的分类信息,如用户查询“电脑”,那服务器返回命中“电脑”这个关键词的所有文档,并且对这些文档进行类型的聚类,如平板原创 2012-06-01 15:13:48 · 6133 阅读 · 1 评论 -
Xapian学习笔记 1 介绍
Xapian介绍 ----------1. 简单介绍 Xapian 是一个开源的搜索引擎库,是用C++来编写的,准许GPL协议(http://www.opensource.org/licenses/gpl-license.php),它现在可以与Perl,python,PHP,Java等语言来绑定使用。 和Lucene一样,Xapian只是一个搜索引擎工具库,用户可以原创 2012-05-24 15:38:39 · 9525 阅读 · 1 评论 -
Blog 搬新家了
由于朋友送了一个空间,现在把一些这个博客中的原创内容都搬到新家中去。地址为www.lemolu.com以后这个博客就不更新了。多谢大家这么久以来的支持与关心。原创 2012-11-08 14:32:37 · 3516 阅读 · 0 评论 -
MongoDB之bson的介绍
MongoDB之bson的介绍 1. 什么是bson BSON是一种类json的一种二进制形式的存储格式,简称Binary JSON,它和JSON一样,支持内嵌的文档对象和数组对象,但是BSON有JSON没有的一些数据类型,如Date和BinData类型。 BSON可以做为网络数据交换的一种存储形式,这个有点类似于Google的Protocol Buffer,但是BSON是一原创 2011-06-28 23:46:00 · 45451 阅读 · 6 评论 -
Facebook Scribe介绍
<br /> Facebook Scribe介绍<br />-------------------1. 介绍<br /> Scribe是Facebook一个开源的实时分布式日志收集系统。它提高了大规模日志收集的可靠性和可扩展性。你可以在不同的节点上安装Scribe服务,然后这些服务会把收集到的信息发布到中心的服务集群上去。当中心服务不可得到时,本地的Scribe服务会暂时把收集到的信息存储到本地,等中心服务恢复以后再进行信息的上传。中心服务集群可以把收集到的信息写入本地磁盘或者分布式文原创 2011-04-16 17:27:00 · 10260 阅读 · 2 评论 -
十个程序开发入门必去网站
<br /> <br /> <br />如何学习编程?或许这些网站会有点用:<br /><br /><br />IBM developerWorks<br /><br />http://www.ibm.com/developerworks/webservices/<br /><br />ibm的开发者社区是一个相当棒的编程社区网站。你刻意通过它来了解最新的程序设计潮流。最棒的地方是你能在上面看到各国优秀程序员的编程实例文章,而且还比较易懂。<br /><br /><br />转载 2010-08-26 22:38:00 · 1083 阅读 · 0 评论 -
使用 cURL 和 libcurl 通过 Internet 进行对话
<br />使用 cURL 和 libcurl 通过 Internet 进行对话<br />将 libcurl 与 C 以及 Python 结合使用<br /><br /><br />Tim M. Jones, 顾问工程师, <br />2009 年 10 月 29 日cURL 是一个命令行工具,可以对文件传输使用许多协议,包括 HTTP、FTP、Secure Copy (SCP)、Telnet 等等。但是,除了可以用命令行通过 Internet 与端点对话外,还可以使用 libcurl 编写简单或复杂的转载 2010-09-10 11:04:00 · 1392 阅读 · 3 评论 -
CMake 简单介绍
<br />cmake 简单介绍<br />----------<br />1. cmake简介<br /> cmake是一个跨平台、开源的构建系统。它是一个集软件构建、测试、打包与一身的软件。它使用与平台和编译器独立的配置文件来对软件编译过程进<br />行控制。现在许多跨平台的开源软件都转向了用cmake来做构建工具,如KDE,Kdevelop,hypertable等,使用cmake,你可以不用关心如何去创建编译可执行文<br />件和动态库。它为了支持不同的平台,提供原创 2010-09-03 22:07:00 · 6098 阅读 · 1 评论 -
使用CMake来编写平台相关的检查 -- use google translate
CMake的:如何编写平台检查如果你想编写软件编制,在不同操作系统上运行,你必须对不同平台的特殊性质的照顾。在不同的操作系统有细微的差别,例如在FreeBSD你不应该使用malloc.h,而这是完全可以在Linux上使用它。处理这些差异通常是通过提供一个头文件,它包含了定义,根据平台性能报表,通常命名为config.h中一堆:1#定义HAVE_MALLOC_H/ *#民主基金HAVE_SYS_MNTTAB_H 1 * // *#民主基金HAVE_SYS_MNTENT_H 1 * /1#定义HAVE_SYS_翻译 2010-09-30 10:39:00 · 7771 阅读 · 0 评论 -
免费开源的数据挖掘软件
<br /><br />在网上看到一篇文章介绍五个免费开源的数据挖掘软件,转过来。 by 陈皓Orange<br />Orange 是一个基于组件的数据挖掘和机器学习软件套装,它的功能即友好,又很强大,快速而又多功能的可视化编程前端,以便浏览数据分析和可视化,基绑定了Python以进行脚本开发。它包含了完整的一系列的组件以进行数据预处理,并提供了数据帐目,过渡,建模,模式评估和勘探的功能。其由C++ 和 Python开发,它的图形库是由跨平台的Qt框架开发。RapidMiner<br />R转载 2010-12-15 09:59:00 · 1853 阅读 · 0 评论 -
一次百度面试经历
<br /><br />一次百度面试经历<br /> <br />时间:2010-12-19 早上11点<br />地点:上海百度移动业务部<br />职位:linux服务端开发工程师<br /> <br /> <br />早上10点到了百度公司,在上海的市中心,公司不大,就一层楼,估计就百来个人吧。进去以后一位漂亮MM叫我到会议室等一下。然后进行了1个小时的笔试。大概内容如下:一共9题,其中有一题是英文翻译、一题是用python或shell写一个程式,找出特定目录下所有文件中最大的数字,一个文件中有多行,原创 2010-12-20 23:00:00 · 1854 阅读 · 2 评论 -
Thrift 是什么?
<br /><br />Thrift 是什么?<br /> Thrift源于大名鼎鼎的facebook之手,在2007年facebook提交Apache基金会将Thrift作为一个开源项目,对于当时的facebook来说创造thrift是为了解决facebook系统中各系统间大数据量的传 输通信以及系统之间语言环境不同需要跨平台的特性。所以thrift可以支持多种程序语言,例如: C++, C#, Cocoa, Erlang, Haskell, Java, Ocami, Perl, PHP, Pyth转载 2011-03-19 20:42:00 · 10354 阅读 · 0 评论 -
Apache Thrift的简单使用
Apache Thrift的简单使用---------------------- 1. 简单介绍Thrift是Facebook的一个开源项目,主要是一个跨语言的服务开发框架。它有一个代码生成器来对它所定义的IDL定义文件自动生成服务代码框架。用户只要在其之前进行二次开发就行,对于底层的RPC通讯等都是透明的。目前它支持的语言有C++, Java, Python, PHP, Ruby, Erlang, Perl, Haskell, C#, Cocoa, Smalltalk, and OCaml. 2. 下载原创 2011-03-20 12:49:00 · 69395 阅读 · 10 评论 -
MongoDB: 一个简单的配置两个shared的例子
<br /> MongoDB: 一个简单的配置两个shared的例子<br /> <br />下面这个例子开启了两个shared服务,一个配置服务,一个mongos服务,所有这些服务都在同一台服务器上进行测试,当然也可以放在不同的服务器上。<br /> 1. 创建Shards<br />在本机上启动一对shared服务<br /> <br />$ mkdir /data/db/a /data/db/b$ ./mongod --shardsvr --dbpath /data/db/a --port 100原创 2011-05-20 10:37:00 · 4409 阅读 · 0 评论 -
学会控制自己 - 看《绿巨人》有感觉
最近制定了近期的学习计划,希望能在下来的一个月内有初步的效果。于是休息一下,看了一部美国大片,《绿巨人》,感觉还是不错的,不管在电影的情节、场景特效、对于人内心世界的描述方面,都做得不错,呵呵,真希望国内的科幻电影也要向国外多学习学习了。其中让我印象是深的感觉是做为生活在这个地球的人类在说,如何很好的对控制自己是那么的重要,不管又物质上和精神上,这种适当的控制都是很有必要的,其中主演说的那句话很有意思“你们最好不要惹我生气,因为我生气的样子,你们不会喜欢的",的确如何,一但他变身后,他就不能够控制自己,原创 2010-08-14 22:52:00 · 2357 阅读 · 1 评论