自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(12)
  • 收藏
  • 关注

转载 一课一得:Spring Boot 整合 MyBatis 实现数据库操作

通过自动配置众多内容,它让开发者得以从繁琐的配置工作中解脱出来,将更多的精力投入到业务逻辑的实现上。这节课程让我全面掌握了 Spring Boot 整合 MyBatis 的核心步骤,从项目的创建、依赖的配置,到各层代码的编写以及接口的测试,每一个环节都紧密相连、至关重要。在今后的学习中,我将不断加强对这些知识点的练习,通过实际项目的锻炼,争取能够更加熟练地运用它们进行项目开发。我相信,随着对这些技术的深入理解和掌握,我将在 Java 综合项目开发的道路上迈出更加坚实的步伐。

2025-07-07 23:07:02 109

原创 Python爬虫进阶实战:拉勾网数据全链路采集与分析(含分布式架构)

本文系统介绍了基于Python的招聘数据爬取与分析项目。项目采用Scrapy框架构建分布式爬虫系统,结合Requests/BS4和Selenium实现静态/动态页面采集,并针对7种常见反爬机制提供解决方案。通过MySQL/MongoDB/Elasticsearch构建数据管道,实现数据清洗存储与可视化分析。重点剖析了薪资预测模型构建过程(MSE:1250000,R2:0.85),同时强调法律合规性,包括robots.txt遵守、请求间隔控制等最佳实践。最后给出爬虫工程师的成长路径图,涵盖从基础库使用到机器学

2025-06-30 23:24:17 1391

原创 Python爬虫终极指南:从拉勾网实战到分布式架构设计

Python爬虫终极指南:从拉勾网实战到分布式架构设计

2025-06-30 23:01:55 990

原创 Python爬虫实战:从入门到项目落地

在Python爬虫学习中,:爬取拉勾网Python相关职位数据,分析薪资分布与技能需求。

2025-06-30 22:50:06 337

原创 探索大数据处理的奥秘

在信息化高速发展的今天,大数据已经成为企业决策、科学研究等领域不可或缺的重要资源。Hadoop,作为大数据处理领域的佼佼者,凭借其分布式存储和计算能力,为海量数据的处理提供了强有力的支持。经过这段时间的深入学习与实践,我对Hadoop有了更加全面和深入的理解,接下来我将与大家分享我的学习心得。

2024-12-22 11:24:35 476

原创 基于Flask开发简易数据可视化网页

Flask是一个用Python编写的轻量级Web应用框架。它易于扩展,且拥有丰富的第三方库支持,使得开发者能够快速地构建Web应用。Flask的核心理念是保持简单和可扩展,这让它成为开发小型到中型Web应用的理想选择。对于数据可视化项目来说,Flask的轻量级和灵活性尤为重要,因为我们可以根据需要轻松地集成各种数据处理和可视化库。本文介绍了如何使用Flask框架开发一个简易的数据可视化网页。通过Flask的路由和视图函数,我们将数据处理和可视化与HTML模板相结合,最终生成了一个包含数据可视化图表的网页。

2024-12-22 11:03:28 1284

原创 python数据可视化分析一课一得

最著名的应用案例是沃尔玛的“啤酒与尿布”故事,通过分析顾客购买记录,发现购买尿布的顾客往往也会购买啤酒,从而促进了两者在货架上的相邻摆放,增加了销售额。关联规则挖掘作为大数据分析中的一项重要技术,旨在发现数据集中不同项之间的有趣关联,为商业策略制定、用户行为分析提供强有力的支持。通过合理设定参数、选择合适的算法,可以有效挖掘出数据集中隐藏的关联关系,为决策提供科学依据。随着技术的不断进步,关联规则挖掘将在更多领域发挥重要作用,推动数据驱动决策的深入发展。

2024-11-27 16:46:35 916

原创 索引优化1

其中聚集索引,次要索引,覆盖索引,复合索引,前缀索引,唯一索引默认都是使用B+树索引,统称索引。第二种:ALTER TABLE table_name ADD INDEX index_name ON (columnName1,columnName2...);为了加快Col2的查找,可以维护一个右边所示的二叉查找树,每个节点分别包含索引键值和一个指向对应数据记录物理地址的指针,这样就可以运用二叉查找在一定的复杂度内获取到相应数据,从而快速的检索出符合条件的记录。这种数据结构,就是索引。#只针对英语内容生效。

2024-07-01 17:34:47 958

原创 MongoDB副本集群

一.副本集概述副本集的功能:(1)数据冗余:副本集可以确保副本结点与主结点数据的更新,以防止单个数据库的服务宕机造成数据丢失的问题。这些副本结点可以和主结点位于同一个数据中心或处于安全考虑分布于其他数据中心(2)自动故障转移:副本集没有固定的主结点,整个集群会选举出一个主结点,当这个主结点不会正常工作时,会选举一个副本结点切换为主结点,客户端会连接到这个新的主结点,并且数据和应用程序都将保持可用。MongoDB副本集实现这样的主/副本切换是自动的,因此副本集是保证MongoDB高可用的基础。

2024-07-01 17:22:54 1318

原创 1.编写两个泛型方法:swapArray方法hprintArray方法,完成任意类型数组的输出。创建不同类型的数组,测验这两个方法。

注意:由于Java的数组是引用类型,这里我们返回修改后的原数组泛型方法,用于打印任意类型数组的所有元素。

2024-06-25 11:03:28 375

原创 MongoDB分片综合应用及实践

MongoDB的分片是将数据水平拆分成多个部分(称为“chunks”),并将这些chunks分散存储在不同的MongoDB实例上。每个实例称为一个分片(Shard),它们共同组成了一个分片集群。MongoDB的分片集群由一个或多个mongos路由实例、多个分片实例以及一个或多个配置服务器(Config Servers)组成。mongos负责接收客户端的请求,并将请求路由到相应的分片上;配置服务器则存储了分片集群的元数据和配置信息。接下来,我们需要为sales集合定义一个分片键。在这个示例中,我们将使用。

2024-06-17 10:04:14 1901

原创 MongoDB分片综合应用

本文将深入探讨MongoDB分片的概念、原理,并通过示例代码展示如何在实际应用中综合使用分片来提升数据库的性能和可扩展性。通过选择合适的分片键、配置分片集群以及合理地插入和查询数据,你可以充分发挥MongoDB分片的优势,提升数据库的性能和可扩展性。MongoDB的分片原理是基于范围分片或哈希分片将数据分散到不同的Shard上。范围分片是根据分片键的值范围将数据分散到不同的Shard上,而哈希分片则是通过对分片键进行哈希计算,将哈希值分散到不同的Shard上。选择一个合适的分片键是分片成功的关键。

2024-06-17 09:52:11 316

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除