c#网页方式获取新浪微博的微博数据

转载于 2015-10-28 11:11:35 发布 · 2.1k 阅读

·

0

·

app 专栏收录该内容

10 篇文章

订阅专栏

本文详细介绍了如何通过分段访问策略获取新浪微博的所有数据，包括三次访问的URL构造方式，以及如何利用mid参数确保数据的连续性和完整性。

新浪微博的数据是分三段显示的。代码中只请求http://weibo.com/leijun#!/leijun?page=2&pre_page=1&end_id=3547112191461289&end_msign=-1只能获取第一段前15条微博。

代码需要访问三次才能将微博数据全部获取

第一次访问的url为 url = "http://weibo.com/" + uid + "?from=profile&wvr=5&loc=tagweibo&page=" + j.ToString()
+ "&pre_page=" + (j - 1).ToString() + "&end_id=" + end_id + "&end_msign=-1";

其中uid为需要访问的新浪用户uid（不是新浪用户账户，收集过新浪微博数据的你应该是知道的吧）。

page为微博的页码，pre_page为前一页的页码，end_id为最新发布的微博的mid（即首页第一条微博的mid，获取一次后，之后访问此值保持不变）。

第二次访问的url为 url = "http://weibo.com/" + uid + "?from=profile&wvr=5&loc=tagweibo&page=" + j.ToString()
+ "&pre_page=" + j.ToString() + "&end_id=" + end_id + "&end_msign=-1&max_id="+max_id+"&pagebar=0";

其它值与第一次访问一致。max_id表示第一次访问后返回的最后一条微博（即当前页的第15条微博的）的mid。

第三次访问的url url = "http://weibo.com/" + uid + "?from=profile&wvr=5&loc=tagweibo&page=" + j.ToString()
+ "&pre_page=" + j.ToString() + "&end_id=" + end_id + "&end_msign=-1&max_id=" + max_id + "&pagebar=1";

其它值与第一次访问一致。max_id表示第二次访问后返回的最后一条微博（即当前页的第30条微博）的mid。

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。