自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(5)
  • 收藏
  • 关注

原创 Hadoop一课一得

Hadoop是一个由Apache基金会所开发的分布式系统基础架构,它允许用户在不了解分布式底层细节的情况下,开发分布式程序,从而充分利用集群的威力进行高速运算和存储。分布式文件系统(HDFS):Hadoop实现了一个分布式文件系统,其中HDFS具有高容错性的特点,并且设计用来部署在低廉的硬件上。它提供高吞吐量来访问应用程序的数据,特别适合处理超大数据集。HDFS放宽了POSIX的要求,可以以流的形式访问文件系统中的数据。MapReduce框架。

2024-04-19 22:46:03 813 1

原创 大数据分析与应用

大数据分析与应用是指利用大规模、多样化和高速增长的数据资源,通过采用各种技术和方法对数据进行收集、存储、处理和分析,从而获取有价值的洞察和知识,并将其应用于各个领域和行业中。大数据分析与应用的主要目标是从海量的数据中挖掘出有意义的信息,以支持决策制定、业务优化、创新发展等。通过对大数据的深入分析,可以帮助企业和组织发现潜在的商机、优化运营流程、改进产品和服务、提高效率和竞争力等。

2023-12-22 11:34:01 2271

原创 Python数据分析与可视化一课一得

Python数据分析与可视化是指使用Python编程语言进行数据处理、分析和可视化的过程。Python拥有许多强大的库和工具,使得数据分析和可视化变得更加简单和高效。数据分析通常涉及对数据进行清洗、转换、整合和统计等处理,以获取有关数据的洞察和见解。Python提供了一些常用的数据分析库,如NumPy、Pandas和SciPy,它们提供了各种数据结构、函数和算法,用于处理和分析数据。可视化是将数据以图表、图形或其他可视形式展示出来的过程。

2023-12-22 09:35:40 1267

原创 网络爬虫一课一得

网络爬虫(Web crawler),也称为网络蜘蛛(Web spider)、网络机器人(Web robot)或网络蠕虫(Web worm),是一种自动化程序,用于在互联网上自动抓取和索引网页数据。网络爬虫的主要功能是浏览互联网,并按照预定的规则自动地从网站上抓取信息。它们通过发送HTTP请求来访问网页,并从响应中提取所需的数据。爬虫可以从一个网页链接到另一个网页,逐级遍历整个网站,或者根据给定的搜索条件和规则,抓取特定的网页数据。网络爬虫通常用于搜索引擎、数据挖掘、数据分析、内容聚合和监测等应用。

2023-12-16 18:33:01 1804 1

原创 java一课一得

Java是一种面向对象的编程语言,由Sun Microsystems(后来被Oracle收购)于1995年推出。它被设计成具有简单、可移植和安全的特性,可以应用于各种不同的平台和设备。Java具有以下特点:1. 简单易学:Java语法相对简单,与其他编程语言相比较容易学习和理解。2. 面向对象:Java是一种纯粹的面向对象编程语言,支持封装、继承和多态等面向对象的概念。3. 平台无关性:Java程序可以在不同的操作系统和硬件平台上运行,只需编写一次并使用Java虚拟机(JVM)来实现跨平台。

2023-12-16 17:59:55 1118 4

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除