- 博客(2)
- 收藏
- 关注
原创 selenium模拟登陆51job实现自动刷新简历
代码之前的准备:安装selenium,这里使用的是chrome浏览器,另外还需要下载chromedriver;其他浏览器自行下载对应的驱动配置;分析:1.51job的登录url是https://login.51job.com/login.php?lang=c;先get,然后找到对应的输入标签,使用浏览器的开发者工具点击查看账号和密码的两个标签分别为id="loginname"和id="pass...
2018-09-13 10:47:52
1299
转载 爬虫——结构化数据和非机构化数据的区别
一般来讲对我们而言,需要抓取的是某个网站或者某个应用的内容,提取有用的价值。内容一般分为两部分,非结构化的数据和结构化的数据。一类信息能够用数据或统一的结构加以表示,我们称之为结构化数据,如数字、符号;而另一类信息无法用数字或统一的结构表示,如文本、图像、声音、网页等,我们称之为非结构化数据。 结构化数据属于非结构化数据,是非结构化数据的特例。 定义: 结构化数据:即行数据,存储在数据库里,可...
2018-09-05 20:56:32
1787
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人