一场别开生面的python应用实战案例

学好python,改变人生!
最近看了央视旗下的玉渊潭天微博介绍了菲律宾control我们sina微博的视频,这是一个难得的python实战案例,至少有四五个python重要硬核方向值得研究,所以今天写一下这个相关的一些技术领域,点到为止,具体视频欢迎自行搜索“40万数据揭秘菲律宾社交机器人"相关视频。以下部分为视频截图,原始视频自行观看。
在这里插入图片描述
应用一:玉渊 收集对方原始信息,涉及到的可能的python库
在这里插入图片描述
https://github.com/JustAnotherArchivist/snscrape这是一个用于从社交媒体网站(包括Twitter、Instagram和Weibo等)抓取数据的Python库。它可以抓取公开的微博数据,无需API Key。其他的P虫相关库包括Requests、Beautiful Soup、Scrapy、Selenium、MechanicalSoup、PyQuery等,这里只是归纳一下,特殊团队手上都有很多自己开发未公开的库。
应用二:对收集的大量信息进行关键词抽取
对关键词进行词频统计,抽取等涉及到的就是自然语言处理了,这方面的库有NLTK、SpaCy、jieba分词、wordcloud词云、Gensim、Yake等等。

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值