
Data Mining
wbj0110
这个作者很懒,什么都没留下…
展开
-
JAVA实现新浪微博页面抓取(非API)
cookie用浏览器的开发者工具登陆微博后得到 只写了抓取下载页面部分 抽取内容可用jsoup完成 注意这是模拟浏览器登录的操作 你在浏览器上完成不了的 代码也不能完成(比如访问不是粉丝的人的第11页好友列表(新浪规定只能访问前10页非自己粉丝的微博用户))这个代码依赖JSOUP package jsoupTest; import java.io.IOException...原创 2014-05-21 10:24:06 · 286 阅读 · 0 评论 -
调用新浪微博API发布微博(java版)
首先,需要下载新浪微博的SDK,这里附上地址:http://code.google.com/p/weibo4j/downloads/detail?name=weibo4j-oauth2-beta2.0.zip 下载完了之后解压,然后打开myeclipse,新建项目,再把刚才解压出来的Import到项目中。 接下来,到这个网址http://open.weibo.com/ 注册应用。有三种应用...原创 2014-05-24 09:31:03 · 282 阅读 · 0 评论 -
新浪微博API(java版)
修改事项: 1、接口返回结果采用json对象方式封装 2、修改WeiboResponse中空字符串("")调用判断的bug 3、修改了JSONObject中返回空对象的问题 4、增加了直接文件上传接口直接 常用接口实例: (使用前先修改 Weibo.java 中 public static final String CONSUMER_KEY = ""; public static fina...原创 2014-05-27 15:09:08 · 235 阅读 · 0 评论 -
新浪微博小爬虫(转)
一直琢磨着写个爬虫玩,上学期都没实行,于是花了大概一天写了这个东西 其实半天就把程序调试好了,可是在往mysql数据库里保存数据的时候出了问题 python的中文编码实在是非常麻烦,不光如此,因为有些用户的简介里有一些特殊符号,®或者笑脸之类的,于是在这里纠结了很久,好歹最后是成功了(其实也就是过滤掉了那些特殊符号) 效率来说呢,开始的时候一个小...原创 2014-05-27 15:12:56 · 125 阅读 · 0 评论