石泽雯-优快云博客

原创 Spring Boot入门指南：快速构建Web应用

Web应用是一种运行在Web服务器上的软件程序，用户通过Web浏览器进行访问和交互。它无需在个人计算机上安装特定软件，只需一个支持的网页浏览器即可跨设备、跨平台使用。Spring Boot是由Pivotal团队提供的基于Spring的全新框架，旨在简化Spring应用的初始搭建和开发过程。它遵循“约定优于配置”的原则，提供了内嵌的服务器、定制化的启动器Starters等特性。您可以使用@Value注解将配置文件中的单个属性值注入到Spring bean中，或者使用。

2025-06-23 13:38:25 746

原创从入门到实战：Spark Word Count

Spark Word Count 作为大数据处理领域的经典案例，通过简单的词频统计任务，展示了 Spark 强大的数据处理能力和灵活的编程模型。从基础的代码实现到关键操作解析，再到实际应用拓展与性能优化，希望本文能让你对 Spark Word Count 有更全面、深入的理解。掌握这一案例后，你可以以此为起点，探索 Spark 在更多复杂场景中的应用，开启大数据处理的进阶之旅。如果你在实践过程中有任何疑问或新的想法，欢迎在评论区交流讨论！

2025-06-19 15:19:16 1130

原创网络爬虫技术全景解析：从入门到实战

conn = aiohttp.TCPConnector(limit=100) # 连接池控制。logger.error(f"请求失败: {url} {str(e)}")# 高并发异步爬虫示例。

2025-06-15 12:59:46 1263

原创使用 JavaScript 实现数据可视化：从代码到图表的全方位解析

从图片可以看出，项目包含多个 JavaScript 文件（如散点图.js、饼图.js 等）和 HTML 文件（任务 2.2.html）。通过对各个 JavaScript 文件的解析，我们了解了如何使用 ECharts 库来创建不同类型的图表，包括饼图、散点图、柱形图和折线图。

2024-11-21 20:41:36 1516

原创 Hive 数据仓库

Hive 是由 Facebook 开源的一个数据仓库工具，它允许用户使用类 SQL 语句来进行数据的查询、分析以及管理，将结构化的数据文件映射为数据库中的表，并提供了一套完整的机制用于数据的抽取、转换和加载（ETL）操作。本质上，Hive 是把 HQL 语句转化为 MapReduce、Tez 或者 Spark 等计算引擎可执行的任务，从而在 Hadoop 集群上进行数据处理。

2024-11-18 15:32:43 3226

原创 k-means算法聚类与BIRCH聚类算法的分析

k-means 算法一种基于划分的聚类算法，其核心思想是将数据集中的样本点划分到 k 个不同的簇中，使得簇内样本点的距离平方和最小。具体步骤1.确定簇的数量 k：首先需要人为指定要划分的簇的数量。2.初始化质心：随机从数据集中选取 k 个样本点作为初始质心，每个质心代表一个簇的中心。3.分配样本点到簇：计算每个样本点到各个质心的距离（通常采用欧几里得距离等），然后将样本点分配到距离其最近的质心所在的簇。4. 更新质心：对于每个簇，重新计算该簇内所有样本点的均值作为新的质心。5.重复迭代。

2024-11-03 16:05:06 919

原创 mongodb基本操作

使用语法::用于切换/创建数据库,若不存在则创建，否则切换到指定数据库。:数据库名称。执行命令，创建数据库articledb。

2024-04-24 15:14:45 4183

原创 python数据合并实操

在Jupyter中新建一个notebook,在notebook进行操作。

2024-04-20 17:29:53 2531

原创 mongodb分片集群部署

重新打开mongodb服务，即可像原来一样使用，但是数据存储方式和原来已经不一样了，变成了分布式的分片存储。

2024-04-16 18:21:50 1664

原创 MongoDB副本集部署（windows）

环境准备本教程演示mongodb4.4 副本集部署（一主两从，伪分布式)|节点 | 配置 ||-主节点-|-localhost:27017-|| 从节点1 | localhost:27018 || 从节点2 | localhost:27019 |每一个节点（实例）都创建对应的数据文件（data）和日志文件（log）。语法：示例：主节点：从节点1（以管理员身份启动）：从节点2：以上三个节点启动的都是一次性服务，所以窗口不要关闭！

2024-04-09 17:37:49 383

szwzwwww的博客