- 博客(6)
- 收藏
- 关注
原创 Linux——虚拟机用户登录循环(大数据)
先打开用户选择页面,在该页面输入Ctrl + Alt + F1~F... 进入tty命令页面(我在网上看到的每个电脑都不同,如我的电脑是输入Ctrl+Alt+F5,每一个都试一试,都不行的话还可以试试Shift + Ctrl + F1以及上网找找进入tty的方法)然后输入以下命令 其中hadoop:hadoop是指定文件或目录的新所有者和所属组,/home/hadoop是你的文件的路径,这几个参数改为你的。打开虚拟机,进入用户选择页面,选择菜单上的控制---文件管理器。成功连接以后 按如下顺序点击。
2024-09-22 14:52:10
823
原创 爬虫笔记3:1bs4爬取小说章节标题和章节内容2xpath爬取58同城二手房源信息
1.获取网站页面2.把页面源代码加载到实例化的bs对象或者etree对象中3.对想要获取的资源进行标签定位(找到所在的位置,用文件夹来比喻就是找到路径)4.获取标签或者属性中存储的值(以三国演义来说先获取章节标题(文本),章节内容需要获取属性中的存放章节内容的地址,再通过获取到的地址,获取内容所在页面的位置)
2024-01-24 16:55:25
481
1
原创 爬虫笔记2:1百度翻译2豆瓣电影
2右击'检查'--点击'网络'--点击'XHR'--在百度翻译页面的输入文本框,用英文状态输入cat--找到对应的sug(如下图,三个英文字母有三个sug,找到表单数据是cat的)网页右击'检查'--点击'网络'--点击'XHR'--在页面中鼠标拖动到最底--出现新的包。需求分析:在豆瓣电影的某个页面获取当前页面的电影的数据(名称,导演...)发现只有后面的参数改变了,而且页面只是局部的更新-->ajax请求。2.观察url,分析url,找到指定的url。分析url(以豆瓣电影-排行榜-喜剧为例)
2024-01-21 23:13:46
649
1
原创 笔记:pycharm导入包
3.直接输入pip install D:\java\JavaMaven\requests-2.31.0.tar.gz。(注:D:\java\JavaMaven\这个是下载的位置 requests-2.31.0.tar.gz是名字 )2.打开pycharm新建项目---然后点击Terminal。1.在这里搜索要下载的包(下载的时候注意版本信息)4.回车等待 就可以了。
2024-01-20 13:49:42
1068
1
原创 笔记:Java导入包(eclipse)
4.右击项目中的压缩包选择Build Path ->Add to Build Path。3.直接拖动压缩包到该项目中(选择copy files)2.打开压缩包所在文件夹 在eclipse打开项目。1.下载需要的压缩包。
2024-01-20 12:47:28
1128
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人