自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(476)
  • 资源 (1)
  • 收藏
  • 关注

原创 熔岩的相关文章收藏

HttpClient4 Post XML到一个服务器上 纯Java文件操作工具,支持文件、文件夹的复制、删除、移动 山寨版Log4j Java反射深度测试 深入理解HTTP Session 深入理解ServletRequest与ServletResponse Java字符编码根本原理 Servlet接收JSP参数乱码问题解决办法 JDBC数据源(DataSource)的简单实现 ...

2011-02-20 21:57:00 295

原创 老王的Python教程-推荐

强烈推荐,适合入门,适合深入 http://www.cnpythoner.com/

2011-02-02 22:46:55 513

原创 转贴一篇不错的Python入门教程 - Instant Hacking[译文]

原文 http://www.hetland.org/python/instant-hacking.php Instant Hacking[译文] 译者: 肯定来过                                       这是一篇简短的关于python程序设计语言的入门教程,原文在这里,翻着词典翻译了来! 这是一份对编程艺术的简短介绍,其中的例子是用python写成的。(如果你已...

2011-02-02 00:09:16 338

原创 python快速入门教程

python所支持的数据类型:整型、长整型、布尔型、浮点型、复数、字符串、列表(list)、元组(Tuple)、字典(Dict)、object python能支持理论意义上的长整型,如C#中的长整型是Int64,即最大值为2的64次方,而python中的长整型只与机器的虚拟内存大小有关,你完全不用考虑溢出这样的异常。 python是一种动态语言,虽然在定义变量时无需定义变量的类型,...

2011-02-01 23:41:15 328

原创 python入门教程:语句和语法

注释(#): python中的注释是以#开头的,不像c++中有/**/之类的多行注释。 继续():表示继续上一行,通常情况下,一行表示一个语句,一行过长的语句可以使用进行分解 语句块(:):在c#/php/javascript/c++中,对于复合语句是用{}来标识,而在python中,是用:配合缩进来实现语句块,如: if a>0: #todo else: #todo ...

2011-02-01 23:40:44 243

原创 python教程:安装python运行环境以及简单程序

python3.0已推出,但据说很多库都不能用了,建议使用2.6版本,我目前使用的是2.5版,与2.6版差距不大。 注意:2.6版本开始,print需要加上括号,否则会提示语法错误。 安装python运行环境: 下载for windows的安装包,http://www.python.org/,不过,正式对外的下载地址被和谐了,请移步到这里下载:http://www.python.o...

2011-02-01 23:38:14 549

原创 利用Python抓取和解析网页(二)补充

五、为HTML文档中的属性值添加引号   前面我们讨论了如果根据HTML解析器中的某种处理程序来解析HTML文件,可是有时候我们却需要使用所有的处理程序来处理HTML文档。值得庆幸的是,使用HTMLParser模块解析HTML文件的所有要素并不比处理链接或者图像难多少。   import HTMLParser  import urllib  class parseAttrs(H...

2011-02-01 23:34:00 148

原创 利用Python抓取和解析网页(二)

 对搜索引擎、文件索引、文档转换、数据检索、站点备份或迁移等应用程序来说,经常用到对网页(即HTML文件)的解析处理。事实上,通过Python语言提供的各种模块,我们无需借助Web服务器或者Web浏览器就能够解析和处理HTML文档。本文上篇中,我们介绍了一个可以帮助简化打开位于本地和Web上的HTML文档的Python模块。在本文中,我们将论述如何使用Python模块来迅速解析在HTML文件中的数...

2011-02-01 23:31:45 497

原创 利用Python抓取和解析网页(一)

对搜索引擎、文件索引、文档转换、数据检索、站点备份或迁移等应用程序来说,经常用到对网页(即HTML文件)的解析处理。事实上,通过Python语言提供的各种模块,我们无需借助Web服务器或者Web浏览器就能够解析和处理HTML文档。本文将详细介绍如何利用Python抓取和解析网页。首先,我们介绍一个可以帮助简化打开位于本地和Web上的HTML文档的Python模块,然后,我们论述如何使用Python...

2011-02-01 23:25:46 429

我新弄的博客和论坛+新浪微博

  主博客是:http://www.liuxinglanyue.com/   主论坛是:http://bbs.liuxinglanyue.com/   论坛崩溃掉了。                这个论坛已于2011-2-18日恢复。   欢迎对论坛的版块设置提供改进意见,谢谢。   同时也欢迎在论坛里交流技术。   这里有个论坛:http://java.liuxingla...

2011-02-01 00:05:23 154

对2010年的总结

        我的博客:http://www.liuxinglanyue.com/         欢迎来踩。         其实谈不上总结,而是生活的一段剪影。         直到昨天晚上,我注册的域名(liuxinglanyue.com)终于和博客绑定了。这中间还是遇到了不少问题,不过最终都被我消灭了(当然是非常兴奋了,哈哈)。         首先说说域名的事。考操作系...

2011-01-31 16:11:13 136

原创 海量数据算法收藏

1. 给定a、b两个文件,各存放50亿个url,每个url各占64字节,内存限制是4G,让你找出a、b文件共同的url?       方案1:可以估计每个文件安的大小为50G×64=320G,远远大于内存限制的4G。所以不可能将其完全加载到内存中处理。考虑采取分而治之的方法。        (1)遍历文件a,对每个url求取clip_image002,然后根据所取得的值将url分别存储到1...

2011-01-28 14:21:24 142

原创 Java深度历险(收藏)

Java深度历险(一)——Java字节代码的操纵 Java深度历险(二)——Java类的加载、链接和初始化    

2011-01-12 16:13:45 137

原创 关于Web推荐系统的一些博客资料

A.关于推荐系统的综述说明 推荐系统:主要推荐方法 电子商务推荐系统入门基础 电子商务推荐系统研究综述 Collaborative Filtering 为什么基于项目的协同过滤是稳定的. 个性化推荐系统的研究进展[和朋友一起写的小综述] 推荐系统:协同过滤之user-based collaborative filtering 数字化信息服务中个性化与共享理念分析 ...

2011-01-11 15:43:49 208

原创 深入浅出 Java Concurrency

转自:   J.U.C 整体认识 原子操作 part 1 从AtomicInteger开始 原子操作 part 2 数组、引用的原子操作 原子操作 part 3 指令重排序与happens-before法则 原子操作 part 4 CAS操作 锁机制 part 1 Lock与ReentrantLock 锁...

2011-01-08 23:00:52 242

原创 Myeclipse 8.5 配置SVN

参考:http://www.cnblogs.com/ewyb/archive/2010/10/20/1856785.html

2011-01-08 14:49:46 129

原创 算法导论第 3 版之多线程算法-开头部分(带图版)

转自:http://blog.youkuaiyun.com/hoping/archive/2010/02/25/5326354.aspx 本书中的主要算法都是顺序算法 ,适合于运行在每次只能执行一条指令的单处理器计算机上。在本章中,我们要把算法模型转向并行算法 ,它们可以运行在能够同时执行多条指令的多处理器计算机中。我们将着重探索优雅的动态多线程算法模型,该模型既有助于算法的设计和分析,同时也易于进行高...

2011-01-08 11:19:19 418

原创 算法导论第 3 版之多线程算法

 转载的文章中没图,这里补充下: http://liuxinglanyue.iteye.com/admin/blogs/865784      算法导论第 3 版之多线程算法(—)        算法导论第 3 版之多线程算法(二)      算法导论第 3 版之多线程算法(三)          算法导论第3版新增第27章:多线程算法(完整版)    ...

2011-01-08 10:59:46 225

原创 《算法导论》读书笔记(收藏)

《算法导论》读书笔记1(算法入门)   《算法导论》读书笔记2(复杂度的表示,递归,以及概率)   《算法导论》读书笔记3(堆排序)   《算法导论》读书笔记4 (快速排序)   《算法导论》读书笔记5(线性时间排序)   《算法导论》读书笔记6(中位数和顺序统计学)   《算法导论》读书笔记7 (散列表)    ...

2011-01-07 15:40:58 981 1

原创 Java编程思想 (收藏)

1、面向对象的特性   2、内存分配   3、基本类型   4、操作符   5、流程控制   6、初始化与清理   7、访问权限控制   8、复用   9、多态   10、接口   11、内部类   12、内部类(多继承)   13、内部类(闭包与回调)   14、内部类(再论工厂模式)   15、异常   16、字符串  ...

2011-01-07 15:34:01 152

原创 Java解惑系列(收藏)

  1.1 java解惑你知多少(一) 1.2 java解惑你知多少(二) 1.3 java解惑你知多少(三) 1.4 java解惑你知多少(四) 1.5 java解惑你知多少(五) 1.6 java解惑你知多少(六) 1.7 java解惑你知多少(七) 1.8 java解惑你知多少(八) ...

2011-01-07 15:30:39 97

原创 搜索引擎技术二(帖子收藏)

   网络爬虫技术  搜索引擎算法研究  搜索引擎分类与工作原理  搜索引擎排名的作用及搜索引擎排名的商业价值  Hadoop笔记--不需要分布式编程经验地分布式编程  什么是Heritrix-开源crawler  开发垂直门户的分布式搜索引擎系统  nu...

2011-01-05 20:02:54 153

原创 搜索引擎技术一(帖子收藏)

   利用Sphinx实现实时全文检索  基于Sphinx构建准实时更新的分布式通用搜索引擎平台  尝试使用IKVM运行Lucene 2.9.0版  中文分词的整理  Apache Lucene 2.9的改进  Scrapy 轻松定制网络爬虫  如何识别搜索引擎爬虫的真伪 ...

2011-01-05 20:01:44 196

原创 Google Python 视频教程

Google Python Class Day 1 Part 1   Google Python Class Day 1 Part 2   Google Python Class Day 1 Part 3   Google Python Class Day 2 Part 1   Google Python Class Day 2 Part 2   Google Python C...

2011-01-04 08:39:43 728 1

原创 Redis: under the hood(收藏)

Redis: under the hood How does the Redis server work? I was curious to learn more about Redis’s internals, so I’ve been familiarizing myself with the source, largely by reading and jumping aroun...

2011-01-03 10:54:25 179

原创 编译原理(第2版)勘误表

今天刚买了这本书,顺便提供一下勘误表。 来自:http://infolab.stanford.edu/~ullman/dragon/errata.html 此书网站 http://dragonbook.stanford.edu/     Errata for Compilers: Principles, Techniques, and Tools, Second Edition ...

2011-01-02 14:46:17 498

原创 Django学习笔记(收藏)

  Django笔记1   Django笔记2   Django笔记3   Django笔记4   Django笔记5(管理站点)   Django笔记6(表单处理)   Django笔记7(通用视图)   Django笔记8(模板引擎)   Django笔记9(会话、用户和注册)   Django笔记10(缓存机制)   Django笔记11(...

2011-01-01 15:43:17 381

原创 Redis指令文档(非常有用的)

连接控制QUIT 关闭连接AUTH (仅限启用时)简单的密码验证 适合全体类型的命令EXISTS key 判断一个键是否存在;存在返回 1;否则返回0;DEL key 删除某个key,或是一系列key;DEL key1 key2 key3 key4TYPE key 返回某个key元素的数据类型 ( none:不存在,string:字符,list,set,zset,hash)KEYS patt...

2011-01-01 15:32:26 340

原创 用Redis存储好友关系-python版

这是一个用Redis存储好友关系的python下使用Redis的例子。作者是Eric Florenzano (@ericflo)。相信对各位人生苦短用python的同学是一个好的入门例子。例子说明:其中虽然用了follow和block等字眼,但是他的关系不是一个微博系统的单向关注,而是类似SNS的双向关系。   """ I've been thinking lately about h...

2011-01-01 11:56:06 426

关于Google的那点事 2011预言及回望

 GOS又按照惯例放出了他们对2011年Google的预测: 1. Google Docs会提供更多免费存储空间,至少会有20GB。   2. Gmail会进化到HTML 5,读取速度更快,支持离线邮件存储,并完全整合其它Google Apps组件,比如Google Calendar和Google Docs。   3. Android内置的键盘会整合Google Scribd,提供输入建议。...

2011-01-01 11:02:34 148

原创 学习MySql技术博客推荐

分类 MySQL优化设计 (62) MySQL初级应用 (61) MySQL基础知识 (79) MySQL解错方案 (41) MySQL高级应用 (30) 未分类 (13) Handler-Socket Plugin for MySQL – SQL的功能、NoSQL的性能 DRBD+Heartbeat让MySQL提供的服务更加稳定 ...

2011-01-01 10:45:30 175

原创 关于Lucene的讨论

分类为[lucene]的文章 Lucene如何实现分页,如何显示从1到10,或者从11到20的结果? 如何写Lucene的分析器? Lucene下如何更新一个或一组已经索引的文档? Lucene下如果不优化索引,删除的文档什么时候真的能被删除? Lucene下如果打开IndexWriter,优化索引,然后关闭IndexWriter,会发生什么? ...

2011-01-01 10:20:21 102

Google美女副总裁:女子也能做极客

  相信很多人都知道Google副总裁Marissa Mayer,这位美女在Google这个顶级搜索公司的地位不容小觑。Mayer近日在接受采访时谈到了两性择业问题,她认为女性也可以从事IT工作,希望能通过自己的努力帮助打破女性不适合科技类工作的偏见。 为什么在技术行业女性从业人员非常少? Mayer:我喜欢技术,我认为这不应该以性别做分界线,想要在这个行业消除性别歧视还有很多努力需...

2010-12-31 21:52:22 212

个人团队企业技术博客收录(不断更新)

IBM技术文档库   阿里巴巴(软件)开发者博客 淘宝数据平台与产品部官方博客 搜索引擎研究团队   车东[Blog^2] 阿里巴巴数据仓库   笔记 by 车东 Apache 下载点 人人镜像   Spring 官方论坛 淘蝌蚪 深沉的船   yiihsia[互联网后端技术] J2EE学习备忘录 熔岩   pagefault 新浪开发者博客 福林雨 ...

2010-12-31 15:33:26 270

原创 Webdis – 为 Redis 提供 HTTP 接口

Redis 一直以来只提供纯文本操作协议(只有在 Cluster 中应用了二进制协议),这可能令很多推崇 RESTFul 的同学感觉不爽了,最近,一位同学业余开发了一个支持 HTTP 协议的 Redis Proxy,取名Webdis。其在Redis 的讨论区一发布,则引来一遍赞扬之声。下面是其简单使用例子: Webdis 在安装运行上秉承了 Redis 的极简主义,只需要 make 一...

2010-12-31 09:24:30 1225

原创 Lucene 学习总结(收藏)推荐

Lucene学习总结之一:全文检索的基本原理   Lucene学习总结之二:Lucene的总体架构   Lucene学习总结之三:Lucene的索引文件格式 (1)   Lucene学习总结之三:Lucene的索引文件格式 (2)   Lucene学习总结之三:Lucene的索引文件格式 (3)   Lucene学习总结之四:Lucene索引过程分析(1)   Lu...

2010-12-30 20:54:50 204

原创 重构方法实战(收藏)

重构方法(2) - 内联方法 重构方法(3)- 用查询方法代替临时变量 重构方法(4) - 引入解释性变量 重构方法(5) - 分离临时变量 重构方法(6) - 去除对参数的赋值 重构方法(7) - 用方法对象代替方法 重构方法(8) - 移动方法 重构方法(9) - 移动字段 重构方法(10) - 提取类 重构方法(11) - 内联类  重构方法(12) – 隐藏委托类 重...

2010-12-30 16:48:45 191

原创 计算Java对象占用内存空间的大小(对于32位虚拟机而言)

参考文档:http://liuxinglanyue.iteye.com/blog/855907 http://www.developersky.net/thread-97-1-1.html   Sizeof.java   package com.liuxinglanyue; public class Sizeof { public static void runGC (...

2010-12-30 16:23:09 198

原创 Java对象占用内存空间的大小

转自:it民工 基本数据的类型的大小是固定的,这里就不多说了。对于非基本类型的Java对象,其大小就值得商榷。 在Java中,一个空Object对象的大小是8byte,这个大小只是保存堆中一个没有任何属性的对象的大小。看下面语句: Object ob = new Object();  这样在程序中完成了一个Java对象的生命,但是它所占的空间为:4byte+8byte。4byte...

2010-12-30 15:16:41 575

原创 基于Lucene的Compass 资源(收藏)

1.2、Compass相关网上资源 1、官方网站1: http://www.opensymphony.com 2、官方网站2:[url] http://www.compass-project.org[/url] 3、官方社区:http://forum.compass-project.org 1.3、相关文章 1、《Compass指南》 作者:江南白衣 http://wiki.springside....

2010-12-29 18:29:50 136

最大公约数和最小公倍数

简单便捷 很好懂 这是一个不错的资源

2008-11-16

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除