- 博客(6)
- 收藏
- 关注
原创 HDFS基础文件操作实验
本文基于配置完成的Hadoop集群上,完成hdfs的基本操作,包括文件上传,文件重命名与移动,文件的递归查找,查看文件目录下的文件
2022-10-14 21:16:59
2113
原创 基于selenium实现的是收集重庆市大数据工程师薪资水平
因为有些网站使用javascript渲染,所以使用传统的request库无法请求到全部的页面源代码,Selenium 是一个自动化测试工具,利用它我们可以驱动浏览器执行特定的动作,如点击、下拉等操作。对于一些 JavaScript 渲染的页面来说,这种抓取方式非常有效由此本文基于selenium自动化在edge浏览器上实现的,使用mysql数据库进行数据存储,以便进行数据的分析。...
2022-08-11 19:39:35
648
原创 python3网络爬虫aiohttp实战案例
本文介绍了使用aiohttp库实现异步爬虫爬取网站图书的评论,及其代码的详细解释(案例来源于python3网络爬虫开发实战,本人对其进行了改编)
2022-07-29 10:22:19
917
2
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人