
--14.4.爬虫
leoIsCoding
Github : [ https://github.com/leoChaoGlut ]
Email : [ leoIsCoding@163.com ]
展开
-
JSOUP获取网页数据返回403错误(403 error loading URL,connection类)
最近做的项目需要利用JSOUP进行网页获取和解析,但是遇到了拒绝访问的问题,返回的结果是: java.io.IOException: 403 error loading URL http://www.xxx.com/xxx 连接代码是这样的: [java] view plain copy Document doc = Jsoup.connec转载 2016-02-23 13:59:42 · 2879 阅读 · 0 评论 -
Avalon属性ms-text的坑
Avalon是去哪儿网的一个MVVM框架. 前两天用jsoup写了个爬虫,可以根据优快云用户名爬取该用户的所有文章.(Github:https://github.com/leoChaoGlut/spider4优快云) 然后我先爬了自己的,把文章放到我自己的阿里云上. 然后在处理前端数据显示的时候出现一个这样的问题: 报错:"Unexcepted token }". 我就纳闷了原创 2016-02-25 13:28:24 · 3375 阅读 · 0 评论 -
网页信息抓取进阶 支持Js生成数据 Jsoup的不足之处
今天又遇到一个网页数据抓取的任务,给大家分享下。 说道网页信息抓取,相信Jsoup基本是首选的工具,完全的类JQuery操作,让人感觉很舒服。但是,今天我们就要说一说Jsoup的不足。 1、首先我们新建一个页面 [html] view plain copy > html> head> tit转载 2016-02-28 09:09:49 · 1688 阅读 · 0 评论