- 博客(5)
- 收藏
- 关注
原创 Hadoop集群的搭建及配置
关闭Hadoop集群的过程相对简单,通常涉及到停止相关服务进程。具体的命令可能因Hadoop版本和配置的不同而有所差异,但通常可以通过类似。的命令来停止HDFS和YARN的服务。
2024-04-26 14:06:10
1028
7
原创 抓取静态网页数据
urllib 库是 Python 内置的 HTTP 请求库,它 可以看做是处理URL 的组件集合。网络爬虫抓取静态网页数据的过程就是获得网页源代码的过程,这个过程模仿用户通过浏览器访问网页的过程,包括向Web服务器发送HTTP请求、服务器对 HTTP 请求做出响应并返回网页源代码。抓取静态网页的技术:静态网页是HTML格式的网页,这种网页在浏览器中呈现的内容都会体现在源代码中,此时我们若要抓取静态网页的数据,只需要获得网页的源代码即可。在Python中,有很多库可以用来编写网络爬虫,其中最基本和常用的是。
2023-12-11 21:22:04
127
1
原创 java 学习心得分享
Java是一门面向对象的高级编程语言,不仅吸收了C语言的各种优点,还摒弃了C里难以理解的多继承、指针等概念,因此Java语言具有功能强大和简单易用两个特征。遵循良好的编程习惯,如规范命名、合理注释、保持代码简洁等,可以帮助你编写出更易读、易维护的代码。掌握基础语法使我们更得心应手,Java的基础语法包括变量、数据类型、运算符、控制流语句等,这些是编写Java程序的基础。Java是一种面向对象的编程语言,理解OOP的概念,如类、对象、继承、多态和封装等,对于学习Java非常重要。
2023-12-04 19:44:52
1072
5
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人