
Python
Takio_
菜鸟进阶中。。
展开
-
[Python3] 爬取百度搜索内容页广告均数
本段代码用于对key_word.txt中的搜索词进行百度搜索,获取百度内容页(首页)的推广广告数。其中为了防止特例偏差,所以每个关键词爬取了10次,并取均值作为最终展示的广告数量。主要运用的Beautifulsoup函数库,爬取代码在requeset函数中.Beautifulsoup手册:https://www.crummy.com/software/BeautifulSoup/bs4/do...原创 2019-01-31 19:54:28 · 2790 阅读 · 1 评论 -
[Python3] 简单的jieba分词以及停用词去除
本文主要为【爬取百度搜索内容页广告均数】提供关键词文件,主要做输入文件的分词功能,并写入key_word.txt文件,以供下一模块使用。https://blog.youkuaiyun.com/qq_36791314/article/details/86724025函数功能主要为调用简单的jiaba分词(stripdata函数)并进行停用词去除(stripword函数)main函数为creat(),可...原创 2019-02-12 17:33:42 · 32280 阅读 · 2 评论