
网页分析
whiker
这个作者很懒,什么都没留下…
展开
-
用HtmlCleaner抓取新闻
HtmlCleaner 用来做html的网页分析 能够做到过滤一些标签 提取一些标签 他能够利用xpath来进行筛选,非常方便。 这里简单的做点介绍 首先导入jar包 然后建立对象HtmlCleaner 根据URL和charset来分析出网页所有的标签。 然后筛选我们想要的信息 Demo如下: //HtmlCleaner Demo //读取了http://w原创 2014-04-14 18:03:51 · 1322 阅读 · 0 评论 -
java 模拟浏览器登陆sina微博
总共三次请求:第一次目的获取 nonce servertime pubkey rsakv pcid第二次目的获取 ticket loginUrl第三次目的获取 Cookie 1.将用户名先urlencode编码再Base64Encode编码2.根据http://login.sina.com.cn/sso/prelogin.php?entry=weibo&callback=sinaSSO原创 2015-07-24 23:56:00 · 3596 阅读 · 9 评论