推特数据采集自动化与扩展指南
1. 推特高级数据采集
在进行推特数据采集时,有两种可用的API:REST API和流式API。以下是它们的区别:
| API类型 | 特点 |
| ---- | ---- |
| REST API | 返回已发布的数据,暴露静态端点 |
| 流式API | 返回实时数据以供查询 |
流式API的优势在于数据是实时的,虽然目前使用相对较少,但随着实时数据的不断生成和公开,未来会更普及。而且由于实时数据很有吸引力,网上有很多相关资源和帮助。
下面是一个使用流式API进行数据采集的脚本示例:
from tweepy.streaming import StreamListener
from tweepy import OAuthHandler, Stream
API_KEY = '5Hqg6JTZ0cC89hUThySd5yZcL'
API_SECRET = 'Ncp1oi5tUPbZF19Vdp8Jp8pNHBBfPdXGFtXqoKd6Cqn87xRj0c'
TOKEN_KEY = '3272304896-ZTGUZZ6QsYKtZqXAVMLaJzR8qjrPW22iiu9ko4w'
TOKEN_SECRET = 'nsNY13aPGWdm2QcgOl0qwqs5bwLBZ1iUVS2OE34QsuR4C'
class Listener(StreamListener):
def on_data(self, data):
print data
return True
auth = OAut
超级会员免费看
订阅专栏 解锁全文
406

被折叠的 条评论
为什么被折叠?



