- 博客(17)
- 收藏
- 关注
原创 Beansdb key,value数据存储
http://code.google.com/p/beansdb/ 简介BeansDB 是一个主要针对大数据量、高可用性的分布式KeyValue存储系统,采用HashTree和简化的版本号来快速同步保证最终一致性(弱),一个简化版的Dynamo。它采用类似memcached的去中心化结构,在客户端实现数据路由。目前只提供了Python版本的客户端,其它语言的客户端可以由...
2010-12-25 22:02:15
172
原创 LinkedIn数据基础设施简介
作者 Ron Bodkin 译者 张龙 来自LinkedIn的Jay Kreps在近日举办的Hadoop峰会上详细介绍了LinkedIn对数据的处理方式。Kreps介绍了LinkedIn每天是如何处理1.2千亿个关系并通过高容量、低延迟的站点服务来混合大量的数据计算的。LinkedIn的很多重要数据都是离线的,移动起来相当慢。因此,他们将每天对Hadoop的批处理作为计算的重要组...
2010-12-25 21:37:23
164
原创 Hadoop 分布式文件存储系统HDFS
hadoop 分布式文件系统:体系和设计1.介绍hadoop文件系统(HDFS)是一个运行在普通的硬件之上的分布式文件系统,它和现有的分布式文件系统有着很多的相似性,然而和其他的分布式文件系统的区别也是很明显的,HDFS是高容错性的,可以部署在低成本的硬件之上,HDFS提供高吞吐量地对应用程序数据访问,它适合大数据集的应用程序,HDFS放开一些POSIX的需求去实现流式地访问文件数据,...
2010-12-22 22:34:39
163
原创 Chrome 浏览器插件
1.Google 快速搜索插件 http://code.google.com/p/chrome-quick-search/ 2.Google任务 http://www.chromeextensions.org/other/google-tasks/
2010-12-13 20:12:32
126
Python的线程池实现
实现代码:#coding:utf-8import Queueimport threadingimport sysimport timeimport urllib#替我们工作的线程池中的线程class MyThread(threading.Thread): def __init__(self, workQueue, resultQueue,timeout=30, **kwargs): th...
2009-04-30 15:17:04
169
原创 2009-4 编程语言排行榜:脚本语言占据半壁江山
TIOBE今日公布了2009年4月的编程语言排行榜,本期前十的榜单与上期相比没明显变化,Java、C、C++依然以绝对优势占据前三甲的位置;排名第四到十位的分别是:PHP、VB、Python、C#、JavaScript、Perl和Ruby。Ruby经过数月的艰难爬升后终于进入前十,上期第十名Delphi下滑一位,排在第十一位。仔细分析本期榜单可以看出,前十名中的PHP、Pytho...
2009-04-15 13:39:55
229
如何将S60上的py文件打包成SIS安装文件
如何将S60上的py文件打包成SIS安装文件。 1.需要的软件 1)ensymble_python2.5-0.28.py , 2)Python2.5.4, 3)openssl.zipensymble介绍: 【Tools to make PyS60 applications for Symbian S60 phones】ensymble的下载地址:http://code.google.c...
2009-04-15 09:20:37
159
如何使用Psyco为你的Python程序提速。
psyco加速Python执行速度的方法:要求:版本对照:File name Python versions Well-tested withpsyco-x.y-win32-py2.2.2.exe 2.2.2 and up 2.2.2 and 2.2.3psyco-x.y-win32-py2.3.exe 2.3 and up 2.3 ...
2009-03-20 17:45:38
338
Python上传文件MultipartPostHandler.py
#!/usr/bin/python##### 02/2006 Will Holcomb <wholcomb@gmail.com># # This library is free software; you can redistribute it and/or# modify it under the terms of the GNU Lesser General Publi...
2009-03-06 14:22:00
256
Python异常处理体系
1.Python内建异常体系结构The class hierarchy for built-in exceptions is:BaseException +-- SystemExit +-- KeyboardInterrupt +-- GeneratorExit +-- Exception +-- StopIteration +-- StandardError...
2009-02-24 11:06:06
231
设计模式----单例模式
package com.nstars.rpc;public class Singleton { /* 饿汉式单例模式 缺点:未实现延迟初始化。 *//* private static Singleton singleton = new Singleton(); private Singleton(){ } public static Singleton getInsta...
2009-02-16 11:10:35
122
字符串相似性算法【最长公共字符串算法】 【LCS】
#!/user/bin/env python# -*- coding: utf-8 -*-class arithmetic(): def __init__(self): pass ''' 【编辑距离算法】 【levenshtein distance】 【字符串相似度算法】 ''' def levenshtein(self,first,second): if len(firs...
2009-02-12 17:10:25
159
字符串相似度算法 levenshtein distance 编辑距离算法
参考:http://www.merriampark.com/ld.htm#WHATIShttp://en.wikipedia.org/wiki/Levenshtein_distance * Java * C++ * Visual Basic * Python[code="java"]Javapublic class Dist...
2009-02-10 10:16:55
252
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人