- 博客(4)
- 收藏
- 关注
原创 HDFS分布式文件系统:部分命令详解
以上就是整理的部分有关Hadoop的命令,注意:这些命令需要在Hadoop的安装目录的bin目录下执行,或者你的系统环境变量中已经包含了Hadoop的bin目录。
2024-04-18 21:22:14
1832
2
原创 网络爬虫部分基础知识分享
网络爬虫(Web Crawler)又称网络蜘蛛、网络机器人,它是一种按照一定规则,自动浏览万维网的程序或脚本。通俗地讲,网络爬虫就是一个模拟真人浏览万维网行为的程序,这个程序可以代替真人自动请求万维网,并接收从万维网返回的数据。与真人浏览万维网相比,网络爬虫能够浏览的信息量更大,效率也更高。网络爬虫历经几十年的发展,技术变得更加多样化,并结合不同的需求衍生出类型众多的网络爬虫。网络爬虫按照系统结构和实现技术大致可以分为4种类型,分别是通用网络爬虫聚焦网络爬虫增量式网络爬虫深层网络爬虫。
2023-12-09 22:17:29
2444
原创 python数据分析部分基础知识
数据分析是利用数学、统计学理论与实践相结合的科学统计分析方法,对Excel数据、数据库中的数据、收集的大量数据、网页抓取的数据进行分析,从中提取有价值的信息并形成结论进行展示的过程。广义数据分析包括狭义数据分析和数据挖掘。狭义的数据分析通过数据的统计分析发现数据中的信息,分析数据结果背后的原因。数据挖掘则是通过习学算法和模型挖掘数据潜在规律,还可以预测数据的未来的走向。Python数据分析就是数据分析之中的方法之一,简单易学,上手快,兼容性强等多个优点。
2023-12-01 23:51:21
234
1
原创 JAVA语言一得
ile、for循环while循环是当条件为真时才能执行循环体,do-while循环当条件为真时,能继续执行循环体while循环与do-while循环的区别是:do-while循环的循环体至少被执行一次;while循环是先判断,满足条件后执行循环体,do...while循环是先执行一次循环后,在根据条件来判断要不要继续执行下去,两个循环都是要满足条件后才会继续执行循环体,如图for循环需要用到三个语句(三个表达式),for循环语言中的三个表达式中,三个表达式都可以省。
2023-10-24 19:46:54
878
1
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人