
Python
JordanPanther
这个作者很懒,什么都没留下…
展开
专栏收录文章
- 默认排序
- 最新发布
- 最早发布
- 最多阅读
- 最少阅读
-
python 爬虫学习:抓取智联招聘网站职位信息(二)
在第一篇文章(python 爬虫学习:抓取智联招聘网站职位信息(一))中,我们介绍了爬取智联招聘网站上基于岗位关键字,及地区进行搜索的岗位信息,并对爬取到的岗位工资数据进行统计并生成直方图展示;同时进入每个职位明细页面提取出职位要求部分的页面内容,经数据清洗后将职位要求部分写入txt文件(FILEPATH+FILENAME + ‘-requirements.TXT’);接下来我们要对该txt文件中...原创 2020-04-05 15:23:35 · 2219 阅读 · 0 评论 -
Python 爬虫学习:报错bs4.FeatureNotFound: Couldn’t find a tree builder with the features you requested
最近开始学习Python爬虫时,参考博主文章(http://python.jobbole.com/87977/)进行爬取智联招聘的职位信息数据。 碰到如下问题: bs4.FeatureNotFound**: Couldn’t find a tree builder with the features you requested: html_parser. Do you need to inst...原创 2018-07-17 16:28:07 · 1835 阅读 · 1 评论 -
python 写入文件时,报错:UnicodeEncodeError: 'gbk' codec can't encode character '\xa0' in position 1806: ille
最近用到python 爬取智联招聘上的网页,想把页面保存本地:def writeintofile(filename, str): # 打开文件 fo = open(filename, 'w') # 写的方式打开文件 print("文件名: ", fo.name) # 在文件末尾写入一行 fo.write(str) # 关闭文件 ...原创 2018-07-19 20:44:23 · 3117 阅读 · 2 评论 -
python 爬虫学习:抓取智联招聘网站职位信息(一)
近期智联招聘的网站风格变化较快,这对于想爬取数据的人来说有些难受。因此,在前人基础上,我整理了针对智联招聘网站的最新结构进行数据抓取的代码,目前支持抓取职位搜索列表页面的列表项,并将职位列表以exlce表格保存在本地,职位明细页面的职位介绍等内容。下一步将对抓取的数据逐步进行分析处理。 本文用到开发工具为PyCharm,python使用的版本是3.7。引用的模块包含:import r...原创 2018-08-01 15:53:58 · 7364 阅读 · 4 评论