- 博客(476)
- 资源 (1)
- 收藏
- 关注
原创 熔岩的相关文章收藏
HttpClient4 Post XML到一个服务器上 纯Java文件操作工具,支持文件、文件夹的复制、删除、移动 山寨版Log4j Java反射深度测试 深入理解HTTP Session 深入理解ServletRequest与ServletResponse Java字符编码根本原理 Servlet接收JSP参数乱码问题解决办法 JDBC数据源(DataSource)的简单实现 ...
2011-02-20 21:57:00
295
原创 转贴一篇不错的Python入门教程 - Instant Hacking[译文]
原文 http://www.hetland.org/python/instant-hacking.php Instant Hacking[译文] 译者: 肯定来过 这是一篇简短的关于python程序设计语言的入门教程,原文在这里,翻着词典翻译了来! 这是一份对编程艺术的简短介绍,其中的例子是用python写成的。(如果你已...
2011-02-02 00:09:16
338
原创 python快速入门教程
python所支持的数据类型:整型、长整型、布尔型、浮点型、复数、字符串、列表(list)、元组(Tuple)、字典(Dict)、object python能支持理论意义上的长整型,如C#中的长整型是Int64,即最大值为2的64次方,而python中的长整型只与机器的虚拟内存大小有关,你完全不用考虑溢出这样的异常。 python是一种动态语言,虽然在定义变量时无需定义变量的类型,...
2011-02-01 23:41:15
328
原创 python入门教程:语句和语法
注释(#): python中的注释是以#开头的,不像c++中有/**/之类的多行注释。 继续():表示继续上一行,通常情况下,一行表示一个语句,一行过长的语句可以使用进行分解 语句块(:):在c#/php/javascript/c++中,对于复合语句是用{}来标识,而在python中,是用:配合缩进来实现语句块,如: if a>0: #todo else: #todo ...
2011-02-01 23:40:44
243
原创 python教程:安装python运行环境以及简单程序
python3.0已推出,但据说很多库都不能用了,建议使用2.6版本,我目前使用的是2.5版,与2.6版差距不大。 注意:2.6版本开始,print需要加上括号,否则会提示语法错误。 安装python运行环境: 下载for windows的安装包,http://www.python.org/,不过,正式对外的下载地址被和谐了,请移步到这里下载:http://www.python.o...
2011-02-01 23:38:14
549
原创 利用Python抓取和解析网页(二)补充
五、为HTML文档中的属性值添加引号 前面我们讨论了如果根据HTML解析器中的某种处理程序来解析HTML文件,可是有时候我们却需要使用所有的处理程序来处理HTML文档。值得庆幸的是,使用HTMLParser模块解析HTML文件的所有要素并不比处理链接或者图像难多少。 import HTMLParser import urllib class parseAttrs(H...
2011-02-01 23:34:00
148
原创 利用Python抓取和解析网页(二)
对搜索引擎、文件索引、文档转换、数据检索、站点备份或迁移等应用程序来说,经常用到对网页(即HTML文件)的解析处理。事实上,通过Python语言提供的各种模块,我们无需借助Web服务器或者Web浏览器就能够解析和处理HTML文档。本文上篇中,我们介绍了一个可以帮助简化打开位于本地和Web上的HTML文档的Python模块。在本文中,我们将论述如何使用Python模块来迅速解析在HTML文件中的数...
2011-02-01 23:31:45
497
原创 利用Python抓取和解析网页(一)
对搜索引擎、文件索引、文档转换、数据检索、站点备份或迁移等应用程序来说,经常用到对网页(即HTML文件)的解析处理。事实上,通过Python语言提供的各种模块,我们无需借助Web服务器或者Web浏览器就能够解析和处理HTML文档。本文将详细介绍如何利用Python抓取和解析网页。首先,我们介绍一个可以帮助简化打开位于本地和Web上的HTML文档的Python模块,然后,我们论述如何使用Python...
2011-02-01 23:25:46
429
我新弄的博客和论坛+新浪微博
主博客是:http://www.liuxinglanyue.com/ 主论坛是:http://bbs.liuxinglanyue.com/ 论坛崩溃掉了。 这个论坛已于2011-2-18日恢复。 欢迎对论坛的版块设置提供改进意见,谢谢。 同时也欢迎在论坛里交流技术。 这里有个论坛:http://java.liuxingla...
2011-02-01 00:05:23
154
对2010年的总结
我的博客:http://www.liuxinglanyue.com/ 欢迎来踩。 其实谈不上总结,而是生活的一段剪影。 直到昨天晚上,我注册的域名(liuxinglanyue.com)终于和博客绑定了。这中间还是遇到了不少问题,不过最终都被我消灭了(当然是非常兴奋了,哈哈)。 首先说说域名的事。考操作系...
2011-01-31 16:11:13
136
原创 海量数据算法收藏
1. 给定a、b两个文件,各存放50亿个url,每个url各占64字节,内存限制是4G,让你找出a、b文件共同的url? 方案1:可以估计每个文件安的大小为50G×64=320G,远远大于内存限制的4G。所以不可能将其完全加载到内存中处理。考虑采取分而治之的方法。 (1)遍历文件a,对每个url求取clip_image002,然后根据所取得的值将url分别存储到1...
2011-01-28 14:21:24
142
原创 关于Web推荐系统的一些博客资料
A.关于推荐系统的综述说明 推荐系统:主要推荐方法 电子商务推荐系统入门基础 电子商务推荐系统研究综述 Collaborative Filtering 为什么基于项目的协同过滤是稳定的. 个性化推荐系统的研究进展[和朋友一起写的小综述] 推荐系统:协同过滤之user-based collaborative filtering 数字化信息服务中个性化与共享理念分析 ...
2011-01-11 15:43:49
208
原创 深入浅出 Java Concurrency
转自: J.U.C 整体认识 原子操作 part 1 从AtomicInteger开始 原子操作 part 2 数组、引用的原子操作 原子操作 part 3 指令重排序与happens-before法则 原子操作 part 4 CAS操作 锁机制 part 1 Lock与ReentrantLock 锁...
2011-01-08 23:00:52
242
原创 Myeclipse 8.5 配置SVN
参考:http://www.cnblogs.com/ewyb/archive/2010/10/20/1856785.html
2011-01-08 14:49:46
129
原创 算法导论第 3 版之多线程算法-开头部分(带图版)
转自:http://blog.youkuaiyun.com/hoping/archive/2010/02/25/5326354.aspx 本书中的主要算法都是顺序算法 ,适合于运行在每次只能执行一条指令的单处理器计算机上。在本章中,我们要把算法模型转向并行算法 ,它们可以运行在能够同时执行多条指令的多处理器计算机中。我们将着重探索优雅的动态多线程算法模型,该模型既有助于算法的设计和分析,同时也易于进行高...
2011-01-08 11:19:19
418
原创 算法导论第 3 版之多线程算法
转载的文章中没图,这里补充下: http://liuxinglanyue.iteye.com/admin/blogs/865784 算法导论第 3 版之多线程算法(—) 算法导论第 3 版之多线程算法(二) 算法导论第 3 版之多线程算法(三) 算法导论第3版新增第27章:多线程算法(完整版) ...
2011-01-08 10:59:46
225
原创 《算法导论》读书笔记(收藏)
《算法导论》读书笔记1(算法入门) 《算法导论》读书笔记2(复杂度的表示,递归,以及概率) 《算法导论》读书笔记3(堆排序) 《算法导论》读书笔记4 (快速排序) 《算法导论》读书笔记5(线性时间排序) 《算法导论》读书笔记6(中位数和顺序统计学) 《算法导论》读书笔记7 (散列表) ...
2011-01-07 15:40:58
981
1
原创 Java编程思想 (收藏)
1、面向对象的特性 2、内存分配 3、基本类型 4、操作符 5、流程控制 6、初始化与清理 7、访问权限控制 8、复用 9、多态 10、接口 11、内部类 12、内部类(多继承) 13、内部类(闭包与回调) 14、内部类(再论工厂模式) 15、异常 16、字符串 ...
2011-01-07 15:34:01
152
原创 Java解惑系列(收藏)
1.1 java解惑你知多少(一) 1.2 java解惑你知多少(二) 1.3 java解惑你知多少(三) 1.4 java解惑你知多少(四) 1.5 java解惑你知多少(五) 1.6 java解惑你知多少(六) 1.7 java解惑你知多少(七) 1.8 java解惑你知多少(八) ...
2011-01-07 15:30:39
97
原创 搜索引擎技术二(帖子收藏)
网络爬虫技术 搜索引擎算法研究 搜索引擎分类与工作原理 搜索引擎排名的作用及搜索引擎排名的商业价值 Hadoop笔记--不需要分布式编程经验地分布式编程 什么是Heritrix-开源crawler 开发垂直门户的分布式搜索引擎系统 nu...
2011-01-05 20:02:54
153
原创 搜索引擎技术一(帖子收藏)
利用Sphinx实现实时全文检索 基于Sphinx构建准实时更新的分布式通用搜索引擎平台 尝试使用IKVM运行Lucene 2.9.0版 中文分词的整理 Apache Lucene 2.9的改进 Scrapy 轻松定制网络爬虫 如何识别搜索引擎爬虫的真伪 ...
2011-01-05 20:01:44
196
原创 Google Python 视频教程
Google Python Class Day 1 Part 1 Google Python Class Day 1 Part 2 Google Python Class Day 1 Part 3 Google Python Class Day 2 Part 1 Google Python Class Day 2 Part 2 Google Python C...
2011-01-04 08:39:43
728
1
原创 Redis: under the hood(收藏)
Redis: under the hood How does the Redis server work? I was curious to learn more about Redis’s internals, so I’ve been familiarizing myself with the source, largely by reading and jumping aroun...
2011-01-03 10:54:25
179
原创 编译原理(第2版)勘误表
今天刚买了这本书,顺便提供一下勘误表。 来自:http://infolab.stanford.edu/~ullman/dragon/errata.html 此书网站 http://dragonbook.stanford.edu/ Errata for Compilers: Principles, Techniques, and Tools, Second Edition ...
2011-01-02 14:46:17
498
原创 Django学习笔记(收藏)
Django笔记1 Django笔记2 Django笔记3 Django笔记4 Django笔记5(管理站点) Django笔记6(表单处理) Django笔记7(通用视图) Django笔记8(模板引擎) Django笔记9(会话、用户和注册) Django笔记10(缓存机制) Django笔记11(...
2011-01-01 15:43:17
381
原创 Redis指令文档(非常有用的)
连接控制QUIT 关闭连接AUTH (仅限启用时)简单的密码验证 适合全体类型的命令EXISTS key 判断一个键是否存在;存在返回 1;否则返回0;DEL key 删除某个key,或是一系列key;DEL key1 key2 key3 key4TYPE key 返回某个key元素的数据类型 ( none:不存在,string:字符,list,set,zset,hash)KEYS patt...
2011-01-01 15:32:26
340
原创 用Redis存储好友关系-python版
这是一个用Redis存储好友关系的python下使用Redis的例子。作者是Eric Florenzano (@ericflo)。相信对各位人生苦短用python的同学是一个好的入门例子。例子说明:其中虽然用了follow和block等字眼,但是他的关系不是一个微博系统的单向关注,而是类似SNS的双向关系。 """ I've been thinking lately about h...
2011-01-01 11:56:06
426
关于Google的那点事 2011预言及回望
GOS又按照惯例放出了他们对2011年Google的预测: 1. Google Docs会提供更多免费存储空间,至少会有20GB。 2. Gmail会进化到HTML 5,读取速度更快,支持离线邮件存储,并完全整合其它Google Apps组件,比如Google Calendar和Google Docs。 3. Android内置的键盘会整合Google Scribd,提供输入建议。...
2011-01-01 11:02:34
148
原创 学习MySql技术博客推荐
分类 MySQL优化设计 (62) MySQL初级应用 (61) MySQL基础知识 (79) MySQL解错方案 (41) MySQL高级应用 (30) 未分类 (13) Handler-Socket Plugin for MySQL – SQL的功能、NoSQL的性能 DRBD+Heartbeat让MySQL提供的服务更加稳定 ...
2011-01-01 10:45:30
175
原创 关于Lucene的讨论
分类为[lucene]的文章 Lucene如何实现分页,如何显示从1到10,或者从11到20的结果? 如何写Lucene的分析器? Lucene下如何更新一个或一组已经索引的文档? Lucene下如果不优化索引,删除的文档什么时候真的能被删除? Lucene下如果打开IndexWriter,优化索引,然后关闭IndexWriter,会发生什么? ...
2011-01-01 10:20:21
102
Google美女副总裁:女子也能做极客
相信很多人都知道Google副总裁Marissa Mayer,这位美女在Google这个顶级搜索公司的地位不容小觑。Mayer近日在接受采访时谈到了两性择业问题,她认为女性也可以从事IT工作,希望能通过自己的努力帮助打破女性不适合科技类工作的偏见。 为什么在技术行业女性从业人员非常少? Mayer:我喜欢技术,我认为这不应该以性别做分界线,想要在这个行业消除性别歧视还有很多努力需...
2010-12-31 21:52:22
212
个人团队企业技术博客收录(不断更新)
IBM技术文档库 阿里巴巴(软件)开发者博客 淘宝数据平台与产品部官方博客 搜索引擎研究团队 车东[Blog^2] 阿里巴巴数据仓库 笔记 by 车东 Apache 下载点 人人镜像 Spring 官方论坛 淘蝌蚪 深沉的船 yiihsia[互联网后端技术] J2EE学习备忘录 熔岩 pagefault 新浪开发者博客 福林雨 ...
2010-12-31 15:33:26
270
原创 Webdis – 为 Redis 提供 HTTP 接口
Redis 一直以来只提供纯文本操作协议(只有在 Cluster 中应用了二进制协议),这可能令很多推崇 RESTFul 的同学感觉不爽了,最近,一位同学业余开发了一个支持 HTTP 协议的 Redis Proxy,取名Webdis。其在Redis 的讨论区一发布,则引来一遍赞扬之声。下面是其简单使用例子: Webdis 在安装运行上秉承了 Redis 的极简主义,只需要 make 一...
2010-12-31 09:24:30
1225
原创 Lucene 学习总结(收藏)推荐
Lucene学习总结之一:全文检索的基本原理 Lucene学习总结之二:Lucene的总体架构 Lucene学习总结之三:Lucene的索引文件格式 (1) Lucene学习总结之三:Lucene的索引文件格式 (2) Lucene学习总结之三:Lucene的索引文件格式 (3) Lucene学习总结之四:Lucene索引过程分析(1) Lu...
2010-12-30 20:54:50
204
原创 重构方法实战(收藏)
重构方法(2) - 内联方法 重构方法(3)- 用查询方法代替临时变量 重构方法(4) - 引入解释性变量 重构方法(5) - 分离临时变量 重构方法(6) - 去除对参数的赋值 重构方法(7) - 用方法对象代替方法 重构方法(8) - 移动方法 重构方法(9) - 移动字段 重构方法(10) - 提取类 重构方法(11) - 内联类 重构方法(12) – 隐藏委托类 重...
2010-12-30 16:48:45
191
原创 计算Java对象占用内存空间的大小(对于32位虚拟机而言)
参考文档:http://liuxinglanyue.iteye.com/blog/855907 http://www.developersky.net/thread-97-1-1.html Sizeof.java package com.liuxinglanyue; public class Sizeof { public static void runGC (...
2010-12-30 16:23:09
198
原创 Java对象占用内存空间的大小
转自:it民工 基本数据的类型的大小是固定的,这里就不多说了。对于非基本类型的Java对象,其大小就值得商榷。 在Java中,一个空Object对象的大小是8byte,这个大小只是保存堆中一个没有任何属性的对象的大小。看下面语句: Object ob = new Object(); 这样在程序中完成了一个Java对象的生命,但是它所占的空间为:4byte+8byte。4byte...
2010-12-30 15:16:41
575
原创 基于Lucene的Compass 资源(收藏)
1.2、Compass相关网上资源 1、官方网站1: http://www.opensymphony.com 2、官方网站2:[url] http://www.compass-project.org[/url] 3、官方社区:http://forum.compass-project.org 1.3、相关文章 1、《Compass指南》 作者:江南白衣 http://wiki.springside....
2010-12-29 18:29:50
136
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人