
httpclient
文章平均质量分 79
iteye_12411
这个作者很懒,什么都没留下…
展开
-
httpclient发送Json格式数据举例之google短网址
public String getGooGlShortUrl(String apiKey,String sourceUrl) throws Exception{ String shortUrl = null; DefaultHttpClient httpClient = new DefaultHttpClient(); try { HttpPos...原创 2012-03-30 14:06:27 · 156 阅读 · 0 评论 -
httpclient自动获取页面编码设置进行字符编码,使httpclient适用所有网页抓取不乱码...
//生成HttpMethod的方法就不举例了,网上很多,这里只是写明如何使得Httpclient适用所有编码的网页抓取 /** * 获取页面html内容 * @param method * @param methodType * @return String * @throws UnsupportedEncodingException * @thr...原创 2012-09-20 20:33:00 · 407 阅读 · 0 评论 -
java模拟浏览器包htmlunit,selenium
发现一个很不错的模拟浏览器包htmlunit,它可以直接执行访问网站地址,并执行相应的JavaScript脚本;这个功能对于网站爬虫有很大的帮助,一些网站使用了ajax,如果使用简单的http访问只能抓到原始的html源码,但对于页面内执行的ajax却无法获取;使用这个包后,可以将执行ajax后的html源码一并抓取下来。网站地址:http://htmlunit.sourceforge.ne...原创 2012-05-27 16:49:21 · 387 阅读 · 0 评论 -
Httpclient Cookies 处理
HttpClient Cookies简介 HttpClient支持自动管理Cookies,允许服务端设定Cookies,并在请求时自动返回客户端的Cookies信息。客户端也可以手动的设置Cookies发送到服务端。 不幸的是,同一时间内有太多的Cookies标准: Netscape Cookie, RFC2109, RFC2965 以及大量供应商不符合规范的自定义Cooki...原创 2013-10-08 15:56:09 · 180 阅读 · 0 评论 -
HttpClient如何 关闭连接(转)
Java代码HttpClient client = new HttpClient(); HttpMethod method = new GetMethod("http://www.apache.org"); try { client.executeMethod(method); byte[] responseBody = nul...原创 2013-10-10 10:19:26 · 718 阅读 · 0 评论 -
httpclient工具类【转】
package com.xyj.com.tool.util;import java.io.File;import java.io.IOException;import java.net.URISyntaxException;import java.nio.charset.Charset;import java.security.cert.CertificateExcept...原创 2013-11-16 11:46:38 · 104 阅读 · 0 评论 -
抓取Js动态生成数据且以滚动页面方式分页的网页
当我们在进行数据抓取的时候,如果目标网站是以Js的方式动态生成数据且以滚动页面的方式进行分页,那么我们该如何抓取呢?如类似今日头条这样的网站:http://toutiao.com/我们可以使用Selenium来搞定这件事情。Selenium的设计目的虽然是用于Web应用程序的自动化测试,但是却非常适合用来做数据抓取,可以非常简单地绕过网站的反爬虫限制,因为Selenium直接运行在浏览...原创 2015-11-08 23:21:33 · 369 阅读 · 1 评论 -
httpclient代理[转]
httpclient4.x配置带用户名和密码的代理httpClient通过代理(Http Proxy)进行请求原创 2012-12-29 11:17:42 · 126 阅读 · 0 评论 -
HttpClient优化相关
首先,HttpClient可以共用,减少创建HttpClient的开销。当然,如果你的应用调用HttpClient并不怎么频繁的话那就没必要共用了,毕竟在内存中维护一个空闲的httpClient对象是不保险的。 其次,Connection可以重用,减少建立连接的开销。 要完成以上两点,可以用多线程下的MultiThreadedHttpConnectionManager管理Http...原创 2014-09-17 15:21:16 · 338 阅读 · 0 评论