自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(10)
  • 收藏
  • 关注

原创 Spring Boot入门指南:快速构建Web应用

Web应用是一种运行在Web服务器上的软件程序,用户通过Web浏览器进行访问和交互。它无需在个人计算机上安装特定软件,只需一个支持的网页浏览器即可跨设备、跨平台使用。Spring Boot是由Pivotal团队提供的基于Spring的全新框架,旨在简化Spring应用的初始搭建和开发过程。它遵循“约定优于配置”的原则,提供了内嵌的服务器、定制化的启动器Starters等特性。您可以使用@Value注解将配置文件中的单个属性值注入到Spring bean中,或者使用。

2025-06-23 13:38:25 746

原创 从入门到实战:Spark Word Count

Spark Word Count 作为大数据处理领域的经典案例,通过简单的词频统计任务,展示了 Spark 强大的数据处理能力和灵活的编程模型。从基础的代码实现到关键操作解析,再到实际应用拓展与性能优化,希望本文能让你对 Spark Word Count 有更全面、深入的理解。掌握这一案例后,你可以以此为起点,探索 Spark 在更多复杂场景中的应用,开启大数据处理的进阶之旅。如果你在实践过程中有任何疑问或新的想法,欢迎在评论区交流讨论!

2025-06-19 15:19:16 1126

原创 网络爬虫技术全景解析:从入门到实战

conn = aiohttp.TCPConnector(limit=100) # 连接池控制。logger.error(f"请求失败: {url} {str(e)}")# 高并发异步爬虫示例。

2025-06-15 12:59:46 1262

原创 使用 JavaScript 实现数据可视化:从代码到图表的全方位解析

从图片可以看出,项目包含多个 JavaScript 文件(如散点图.js、饼图.js 等)和 HTML 文件(任务 2.2.html)。通过对各个 JavaScript 文件的解析,我们了解了如何使用 ECharts 库来创建不同类型的图表,包括饼图、散点图、柱形图和折线图。

2024-11-21 20:41:36 1516

原创 Hive 数据仓库

Hive 是由 Facebook 开源的一个数据仓库工具,它允许用户使用类 SQL 语句来进行数据的查询、分析以及管理,将结构化的数据文件映射为数据库中的表,并提供了一套完整的机制用于数据的抽取、转换和加载(ETL)操作。本质上,Hive 是把 HQL 语句转化为 MapReduce、Tez 或者 Spark 等计算引擎可执行的任务,从而在 Hadoop 集群上进行数据处理。

2024-11-18 15:32:43 3225

原创 k-means算法聚类与BIRCH聚类算法的分析

k-means 算法一种基于划分的聚类算法,其核心思想是将数据集中的样本点划分到 k 个不同的簇中,使得簇内样本点的距离平方和最小。具体步骤1.确定簇的数量 k:首先需要人为指定要划分的簇的数量。2.初始化质心:随机从数据集中选取 k 个样本点作为初始质心,每个质心代表一个簇的中心。3.分配样本点到簇:计算每个样本点到各个质心的距离(通常采用欧几里得距离等),然后将样本点分配到距离其最近的质心所在的簇。4. 更新质心:对于每个簇,重新计算该簇内所有样本点的均值作为新的质心。5.重复迭代。

2024-11-03 16:05:06 917

原创 mongodb基本操作

使用语法::用于切换/创建数据库,若不存在则创建,否则切换到指定数据库。:数据库名称。执行命令,创建数据库articledb。

2024-04-24 15:14:45 4181

原创 python数据合并实操

在Jupyter中新建一个notebook,在notebook进行操作。

2024-04-20 17:29:53 2530

原创 mongodb分片集群部署

重新打开mongodb服务,即可像原来一样使用,但是数据存储方式和原来已经不一样了,变成了分布式的分片存储。

2024-04-16 18:21:50 1664

原创 MongoDB副本集部署(windows)

环境准备本教程演示mongodb4.4 副本集部署(一主两从,伪分布式)|节点 | 配置 ||-主节点-|-localhost:27017-|| 从节点1 | localhost:27018 || 从节点2 | localhost:27019 |每一个节点(实例)都创建对应的数据文件(data)和日志文件(log)。语法:示例:主节点:从节点1(以管理员身份启动):从节点2:以上三个节点启动的都是一次性服务,所以窗口不要关闭!

2024-04-09 17:37:49 383

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除