- 博客(16)
- 收藏
- 关注
爬虫抓网页知识小结
1,用于抓取时间date的 但是时间的格式多变 import java.util.regex.Matcher;import java.util.regex.Pattern; Pattern p = Pattern.compile("\\bon\\b");Matcher m = p.matcher(str);if(m.find()){ str = m.group(...
2011-11-11 15:10:05
150
登录微博的样例
import java.io.BufferedReader;import java.io.IOException;import java.io.InputStream;import java.io.InputStreamReader;import java.util.ArrayList;import java.util.List;import org.apache.co...
2011-11-11 14:58:42
135
原创 Map List Set转
1.list转setJava代码 复制代码 1. Set set = new HashSet( new ArrayList()); Java代码 复制代码 1. Set set = new HashSet( new ArrayList()); Set set = new HashSet(new ArrayList()); ...
2011-05-20 10:12:22
123
原创 抓sohuBlog的时候碰到web zip形式
Gzip压缩了,用压缩输入流GZIPInputStream gzin = new GZIPInputStream(fin); // 得到压缩输入流 public static void unGZipFile(File source, String target) throws Exception { FileInputStream fin = new FileInputStr...
2011-05-13 13:35:42
112
原创 字符串去除html标签
[color=red] content=content.replaceAll("]+>",""); //剔出了的标签 content=content.replace(" ",""); content=content.replace(".",""); conte
2011-05-13 12:30:30
135
原创 HTMLParser使用详解(3)- 通过Filter访问内容【转】
项目用到 转来存着 谢谢HTMLParser遍历了网页的内容以后,以树(森林)结构保存了结果。HTMLParser访问结果内容的方法有两种。使用Filter和使用Visitor。(一)Filter类顾名思义,Filter就是对于结果进行过滤,取得需要的内容。HTMLParser在org.htmlparser.filters包之内一共定义了16个不同的Filter,也可以分为几类。...
2011-03-18 17:36:05
85
原创 HTMLParser使用详解(2)- Node内容【转】
项目用到 转来存着 谢谢HTMLParser将解析过的信息保存为一个树的结构。Node是信息保存的数据类型基础。请看Node的定义:public interface Node extends Cloneable;Node中包含的方法有几类:对于树型结构进行遍历的函数,这些函数最容易理解:Node getParent ():取得父节点NodeList getChild...
2011-03-18 17:34:25
154
原创 HTMLParser使用详解(1)- 初始化Parser[转]
因为在项目中用到 然后转来存着在研究搜索引擎的开发中,对于HTML网页的处理是核心的一个环节。网上有很多开源的代码,对于Java来说,HTMLParser是比较著名并且得到广泛应用的一个。HTMLParser的主页是http://htmlparser.sourceforge.net/,最后的更新是 2006年9月的1.6版。不过没关系,HTML的内容已经很久没有大的变化了,HTMLParser...
2011-03-18 17:32:24
120
原创 Htmlparser Filter 简要归纳(转)
1 . 逻辑关系:与或非AndFilter() Creates a new instance of an AndFilter.AndFilter(NodeFilter[] predicates) Creates an AndFilter that accepts nodes acceptable to all given filters.An...
2011-03-18 17:26:16
101
原创 HttpClient的 post 、get使用方法(转)
Http学习之使用HttpURLConnection发送post和get请求2010-02-23 16:08Http学习之使用HttpURLConnection发送post和get请求最常用的Http请求无非是get 和post,get请求可以获取静态页面,也可以把参数放在URL字串后面,传递给servlet,post与get的不同之处在于post的参数不是放在URL字串里面,而是放在...
2011-03-18 13:37:22
167
原创 文件操作大全(转的)
1.创建文件夹//import java.io.*;File myFolderPath = new File(%%1);try {if (!myFolderPath.exists())myFolderPath.mkdir();}catch (IOException e) {System.err.println("新建目录操作出错");}2.创建文件/...
2011-03-16 15:08:56
100
原创 Groovy探索 关于“Load my Resource”模式的解读
声明: 转自软件信雅达很早就在Groovy语言的官方文档上看到了“Load my Resource”模式,却一直没有在意,可能是因为它不是GOF的经典模式中的一种。最近又不经意的看到了它,却鬼使神差的大概看了一遍,当略略有点明白它的意思时,就有点惊奇于它的功能了,当再一次阅读时,静下心来想一想,就真正感叹于它的思想了。总体来说,这个模式主要是针对一些资源的使用来的。这些资源包括文件...
2011-02-24 13:53:41
205
原创 eclipse自动提示设置
从Window -> preferences -> Java -> Editor -> Content assist -> Auto-Activation下,我们可以在"."号后面加入我们需要自动提示的首字幕,比如"west"。在"."后面随便输入几个字符,比如"abij",然后回到开发环境,File -> export -> general -> preferences -&
2011-02-24 11:09:43
111
原创 Groovy Tip 10 Groovy语言对String的简化操作
声明:转自 软件信雅达在Groovy语言中,对String对象的操作就像操作List对象一样的方便。比如我们在Java语言中,对String对象的操作用得比较多的是substring方法。如下: String str = "abcdefg"; System.out.println(str.substring(1,3)); 结果为:bc...
2011-02-23 17:33:33
163
原创 Groovy探索之Gstring(转摘)
声明:转自:软件信雅达Groovy语言里有很多看起来不起眼的小玩意,但使用以后,我们却常常会惊异于它的巨大能量,Gstring就是其中之一。Java的String对象是我们最最常用的对象,却也是诟病最多的对象。一句话来说,String使用起来非常不方便。而Gstring不但使用方便,而且更是Groovy语言动态性的基础。所谓Gstring,是指通过双引号引起来的、带有占位表达式...
2011-02-23 17:11:54
542
Groovy的方法小结
// normal stringsdeffirstname= 'Kate'defsurname= "Bush"assertfirstname* 2== 'KateKate'// GStringdeffullname= "$firstname$surname"assertfullname== 'Kate Bush'assertfullname-firstname== ' ...
2011-02-23 15:43:58
129
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人