学好python,改变人生!
最近看了央视旗下的玉渊潭天微博介绍了菲律宾control我们sina微博的视频,这是一个难得的python实战案例,至少有四五个python重要硬核方向值得研究,所以今天写一下这个相关的一些技术领域,点到为止,具体视频欢迎自行搜索“40万数据揭秘菲律宾社交机器人"相关视频。以下部分为视频截图,原始视频自行观看。
应用一:玉渊 收集对方原始信息,涉及到的可能的python库
https://github.com/JustAnotherArchivist/snscrape这是一个用于从社交媒体网站(包括Twitter、Instagram和Weibo等)抓取数据的Python库。它可以抓取公开的微博数据,无需API Key。其他的P虫相关库包括Requests、Beautiful Soup、Scrapy、Selenium、MechanicalSoup、PyQuery等,这里只是归纳一下,特殊团队手上都有很多自己开发未公开的库。
应用二:对收集的大量信息进行关键词抽取
对关键词进行词频统计,抽取等涉及到的就是自然语言处理了,这方面的库有NLTK、SpaCy、jieba分词、wordcloud词云、Gensim、Yake等等。
一场别开生面的python应用实战案例
于 2024-07-03 16:31:19 首次发布