大约是在四月份,和同学一起做了一个基于用户兴趣的新闻推送系统,由我负责后端开发。
期间遇到的问题就是新闻数据的来源,(肯定是要去那些新闻门户网站去那啥的是不是),最后采用的java写爬虫,java写爬虫也有很多中方法。我选择了最简单的Jsoup。嘿嘿嘿。
http://www.open-open.com/jsoup/
这是Jsoup的官方中文文档网址,反复翻阅即便即可。
使用Jsoup很简单,自带抓取,也自带解析,很棒!
下一篇上Jsoup源码
大约是在四月份,和同学一起做了一个基于用户兴趣的新闻推送系统,由我负责后端开发。
期间遇到的问题就是新闻数据的来源,(肯定是要去那些新闻门户网站去那啥的是不是),最后采用的java写爬虫,java写爬虫也有很多中方法。我选择了最简单的Jsoup。嘿嘿嘿。
http://www.open-open.com/jsoup/
这是Jsoup的官方中文文档网址,反复翻阅即便即可。
使用Jsoup很简单,自带抓取,也自带解析,很棒!
下一篇上Jsoup源码