社交媒体数据探索:从Twitter获取有价值信息
1. 数据搜索请求的处理
在数据处理的最后部分, package_search
请求有其独特之处。该请求的响应是一个包含所请求数据包的字典,我们主要关注字典中的两部分:
- response_dict['result']['count']
:这是与搜索请求匹配的数据包的总体数量。我们可以利用这个数量来进行分页请求,或者一次性请求所有数据。
- response_dict['result']['results']
:这是一个包含各个数据数据包的列表,每个数据包都有详细的描述信息。
需要注意的是, data.gov
并不保存数据本身,仅保存数据数据包的元数据。每个数据包都有自己的URL,可用于访问数据,这通常需要额外的RESTful API请求。如果数据由不使用CKAN的网站提供,请求和响应的细节将与这里展示的CKAN协议不匹配。
RESTful API处理的核心步骤通常非常一致,CKAN展示了使用JSON以及以标准化字典形式响应的最佳实践,该字典包含响应信息和更详细的状态。
2. 使用Twitter API收集信息
2.1 准备工作
我们将使用 TwitterAPI
模块通过Twitter社交网络收集有关人员的信息。使用Twitter的第一步是拥有一个Twitter账户,这可以在 http://www.