自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+

数据攻城狮的博客

探索编程世界

  • 博客(200)
  • 资源 (1)
  • 问答 (1)
  • 收藏
  • 关注

原创 Java Spring Boot 与前端结合打造图书管理系统:技术剖析与实现

本图书管理系统采用前后端分离架构。后端基于 Spring Boot,`LibraryApplication` 启动项目,`application.properties` 做配置。`Book` 为实体类,`LibraryController` 处理请求,`LibraryService` 及实现类负责业务逻辑,`BookRepository` 进行数据访问,`GlobalExceptionHandler` 处理异常。前端用 HTML、CSS、JS。

2025-03-31 11:30:17 706

原创 我的创作纪念日 打造高效 Python 日记本应用:从基础搭建到功能优化全解析

本文详细介绍了如何使用 Python 和 tkinter 库开发一个功能丰富的日记本应用。从数据库搭建入手,利用 sqlite3 连接 SQLite 数据库并创建包含日期、天气和内容字段的日记表。在界面设计方面,打造了含新建、搜索等选项的菜单栏,以 Treeview 组件按日期降序展示日记列表的列表页面,以及用于编辑和查看日记详情的页面。功能实现上,涵盖日记保存更新、搜索排序及关键词高亮显示等功能。通过完整代码展示及各部分解析,全方位呈现了该日记本应用从基础构建到功能优化的全过程。

2025-03-13 09:15:25 852

原创 深入探索Python机器学习算法:(加州房价预测)XGBoost 与贝叶斯优化驱动的鲁棒性集成模型

基于 XGBoost 与贝叶斯优化的加州房价预测模型,涵盖数据清洗、迭代填补、地理特征工程、递归特征选择及堆叠集成建模全流程。通过 SHAP 值可视化解析特征贡献等。

2025-03-07 15:09:32 1241 1

原创 深入探索Python机器学习算法:模型调优

本文深入探索 Python 机器学习的模型调优。先介绍超参数搜索方法,包括网格搜索、随机搜索、贝叶斯优化及其优缺点与适用场景。接着阐述模型复杂度分析,如借助学习曲线和验证曲线判断,利用正则化、特征选择和工程优化。最后聚焦模型融合与集成,讲解 Bagging 等融合方法、随机森林等常见算法,还以 Stacking 模型为例,运用网格搜索进行参数调优,全面提升模型性能 。

2025-03-04 17:01:40 1216

原创 深入探索Python机器学习算法:模型评估

本文深入探索 Python 机器学习中的模型评估。先介绍数据集划分,包括划分原则、简单随机、分层抽样、时间序列等划分方法,以及 K 折交叉验证等技术及不同划分方法的适用场景。接着分析评估指标,涵盖分类任务的准确率、召回率等指标与回归任务的均方误差等指标,并阐述不同评估指标的选择要点。最后强调模型评估注意事项,如避免数据泄露,通过计算均值、标准差及置信区间确保评估指标的稳定性与可靠性 。

2025-03-04 16:59:08 666

原创 深入探究Python机器学习算法:无监督学习(聚类算法如 K-Means、DBSCAN,降维算法如 PCA、SVD)

文章聚焦 Python 机器学习无监督学习算法,深入剖析聚类与降维算法。聚类算法中,详细介绍 K - Means 聚类的流程、K 值选择及评估方法,阐述层次聚类的原理、连接方法与可视化,讲解 DBSCAN 密度聚类的原理、优势及局限。降维算法方面,涵盖 PCA 的数学原理、应用及改进,SVD 的原理、与 PCA 的关系及 Python 实现,还介绍了局部线性嵌入(LLE)和等距映射(Isomap)等其他降维算法。

2025-03-03 12:12:46 1084

原创 一文读懂 Redis:从数据结构到高级特性与持久化

本文围绕 Redis 展开,全面介绍其基础概念、数据结构、高级特性及持久化方式。Redis 是基于内存的键值存储系统,支持持久化,读写速度快,适合高并发场景。文中详细阐述了字符串、哈希、列表等多种数据结构,并给出 Python 代码示例。高级特性涵盖发布订阅、缓存使用、事务操作。持久化方面,介绍了 RDB 快照和 AOF 日志两种方式,分析各自优缺点,还指出可按需选择或结合使用,以实现更好的数据保护与恢复。

2025-03-03 07:21:36 837

原创 深入探索Python机器学习算法:监督学习(线性回归,逻辑回归,决策树与随机森林,支持向量机,K近邻算法)

本文结合 Python 代码深入探讨常见机器学习算法。先介绍线性回归,含数据处理、共线性检测及扩展模型;逻辑回归用于二分类和多分类,展示 One - vs - Rest 和 Softmax 回归方法;决策树有多种算法及剪枝策略,随机森林经超参数调优提升性能;支持向量机含不同核函数、回归及多分类策略;K 近邻算法涉及 K 值选择、多种距离度量及改进策略。通过这些,助读者掌握算法原理、实现与应用。

2025-02-28 17:07:36 974

原创 苦于不知如何高效添加图片水印?Pillow 加 Tkinter 帮你轻松搞定!

在图片处理中,为图片添加文字水印是常见需求。本文介绍了如何利用 Python 实现该功能,借助 PIL(Pillow)库强大的图像处理能力,结合 Tkinter 构建友好的 GUI 界面。用户可通过界面便捷地选择图片,输入水印文字、字体大小和透明度等参数。程序会自动验证输入,确保参数有效。同时,程序不仅能处理单张图片,还支持批量添加水印,为用户提供高效的图片水印处理方案,让图片水印添加变得轻松简单。

2025-02-27 16:47:40 566

原创 深入剖析 OpenCV:全面掌握基础操作、图像处理算法与特征匹配

本文深入介绍了 OpenCV 从基础到应用的全流程知识。先讲解了在 Python 环境下使用 pip 和 Anaconda 安装 OpenCV 的方法。基础操作部分,涵盖图像读取、显示、保存,以及获取属性、访问像素、裁剪缩放旋转等,还能进行颜色空间转换。图像处理算法方面,介绍了均值、高斯等滤波,Canny、Sobel 等边缘检测,以及膨胀腐蚀等形态学操作。最后阐述了 ORB、SIFT 特征提取与不同方式的特征匹配,助你全面掌握 OpenCV,开启计算机视觉学习之旅。

2025-02-27 14:58:26 1244

原创 程序员的 “棋” 乐无穷:Python 打造五子棋游戏攻略(人机对战和人人对战)

本文介绍利用 Python 的 Tkinter 库开发五子棋游戏的过程。先阐述选择 Python 与 Tkinter 的原因,Python 库丰富,Tkinter 简单易用。接着详细讲解核心功能模块,如定义常量确定棋盘和棋子规格,用 Canvas 绘制棋盘,设计人人对战和人机对战模式选择界面,实现玩家落子、胜负判断、人机对战 AI 简单评估算法下棋,以及优化后的按钮管理与游戏重置功能。最后展望可从 AI 算法、游戏功能、界面设计等方面优化扩展游戏。

2025-02-26 09:15:00 782

原创 深入探索 Git 命令:全面掌握版本控制的强大工具

该博客全面介绍了Git的使用。重点围绕本地仓库管理,如文件的添加、提交、查看状态与差异等,还介绍版本回退、分支管理的多种操作。远程仓库部分涵盖添加、克隆、推送与拉取以及标签管理等内容。

2025-02-24 20:12:00 925 1

原创 文本分析实战:利用 Python 剖析用户评论数据(jieba,snownlp,gensim)

本文聚焦电商用户评论数据,展示如何用 Python 进行全面文本分析。在技术选型上,选用 pandas、numpy 处理数据,jieba、re、snownlp 进行文本处理,基于 gensim 构建 LDA 模型做主题建模,利用 matplotlib 和 wordcloud 可视化。代码实现涵盖数据预处理,包括缺失值处理、文本清洗、分词等;通过自定义情感词典结合 SnowNLP 进行情感分析;用 LDA 模型完成主题建模;还实现生成报告和可视化,生成包含统计、情感、主题信息的报告及多种可视化图表。

2025-02-24 12:07:51 1038

原创 DeepSeek V3和R1

DeepSeek V3 与 R1 的详细对比分析,内容涵盖模型定位、架构设计、性能表现等核心维度,并结合结构化图表与数据支撑

2025-02-19 00:01:32 2189 1

原创 基于Flask的问答系统的设计与实现

基于Flask的问答系统的设计与实现。主要功能有:注册登录,首页,问题详情页,问题回答及回复,搜索功能,发布问题功能,评论我的功能,回复我的功能,我的文章功能,编辑文章功能,我的评论功能,我的回复功能,后台管理功能。

2023-07-07 23:58:28 1973 2

原创 Flask+pyecharts实现电影数据分析可视化

之前有写过pyecharts实现电影数据分析可视化和Django+pyecharts实现电影数据分析可视化,但是综合起来感觉还是有缺陷,所以我使用Flask+pyecharts重新整合一下电影数据可视化。

2023-06-11 07:25:32 1672

原创 Tableau招聘信息数据可视化

Tableau招聘信息数据可视化,主要有学历与经验分布柱状图,公司行业分布与平均薪资折柱混合图,公司类型分布与平均薪资折柱混合图,平均薪资分布折线图,城市平均薪资词云图,学历与经验平均薪资折线图,公司规模分布与平均薪资折线图,城市岗位数量散点图

2023-06-07 05:28:52 1575

原创 基于Flask的留言板的设计与实现

基于Flask实现一个留言板功能

2023-04-28 21:36:10 1631 2

原创 Django+pyecharts实现电影数据分析可视化

文章主要实现Django结合pyecharts做一个电影数据可视化的小网站/系统。

2023-04-04 22:16:39 2214

原创 pyecharts实现电影数据分析可视化

根据豆瓣电影TOP250排行榜数据,使用pyecharts进行可视化分析。

2023-04-03 23:19:40 3740 4

原创 Django 4.0文档学习(四)

Django是一个开放源代码的Web应用框架,由Python写成。采用了MTV的框架模式,即模型M,视图V和模版T。它最初是被开发来用于管理劳伦斯出版集团旗下的一些以新闻内容为主的网站的,即是CMS(内容管理系统)软件。并于2005年7月在BSD许可证下发布。这套框架是以比利时的吉普赛爵士吉他手Django Reinhardt来命名的。2019年12月2日,Django 3. 0发布

2023-03-29 21:58:09 517

原创 Django 4.0文档学习(三)

Django是一个开放源代码的Web应用框架,由Python写成。采用了MTV的框架模式,即模型M,视图V和模版T。它最初是被开发来用于管理劳伦斯出版集团旗下的一些以新闻内容为主的网站的,即是CMS(内容管理系统)软件。并于2005年7月在BSD许可证下发布。这套框架是以比利时的吉普赛爵士吉他手Django Reinhardt来命名的。2019年12月2日,Django 3. 0发布

2023-03-28 22:57:40 466

原创 Django 4.0文档学习(二)

编写你的第一个 Django 应用,第 3 部分,编写更多视图,写一个真正有用的视图,一个快捷函数: render(),抛出 404 错误,一个快捷函数: get_object_or_404(),使用模板系统,去除模板中的硬编码 URL,为 URL 名称添加命名空间,

2023-03-19 21:09:40 416

原创 Django 4.0文档学习(一)

编写你的第一个 Django 应用,第 1 部分创建项目用于开发的简易服务器创建应用编写第一个视图编写你的第一个 Django 应用,第 2 部分数据库配置创建模型激活模型初试 API介绍 Django 管理页面

2023-03-17 16:21:19 1129

原创 pandas数据分析(三)

DataFrame数据处理与分析处理超市交易数据中的异常值处理超市交易数据中的缺失值处理超市交易数据中的重复值使用数据差分查看员工业绩波动情况使用透视表与交叉表查看业绩汇总数据使用重采样技术按时间段查看员工业绩

2023-03-16 20:13:56 2202 1

原创 python自动化办公(二)

文件和目录操作使用shutil库文件查找globfnmatchhashlib

2023-03-15 21:04:26 812

原创 python自动化办公(一)

当写文件时,操作系统往往不会立刻把数据写入硬盘,而是先放入内存中缓存起来,然后再陆续写入。忘记调用close方法的后果是,虽然建立了文件,但是数据并没有写入文件。这里的创建时间,并不是指这个文件内容的原创时间,如果文件从别处复制过来,那就是复制的时间。在进行Python文件的读取或者写入的时候,都需要调取close方法来关闭文件,encoding用于指定文件的编码方式,如GBK、UTF-8等,默认采用。mode指定了文件的打开模式。UTF-8,有时候打开一个文件全是乱码,这是因为编码参数和创建文件。

2023-03-12 20:37:43 3062 2

原创 pandas数据分析(二)

DataFrame数据处理与分析读取Excel文件中的数据筛选符合特定条件的数据查看数据特征和统计信息按不同标准对数据排序使用分组与聚合对员工业绩进行汇总

2023-03-08 14:37:59 2195

原创 pandas数据分析(一)

一般而言,数据分析工作的目标非常明确,即从特定的角度对数据进行分析,提取有用信息,分析的结果可作为后期决策的参考。扩展库pandas是基于扩展库numpy和matplotlib的数据分析模块,是一个开源项目,提供了大量标准数据模型,具有高效操作大型数据集所需要的功能,可以说pandas是使Python能够成为高效且强大的数据分析行业首选语言的重要因素之一。在各领域都存在数据分析需求,我们在实际应用和开发时经常会发现,很少有数据能够直接输入到模型和算法中使用,基本上都需要进行一定的预处理,例如处理

2023-03-06 23:06:16 808

原创 numpy数组与矩阵运算(二)

矩阵生成与常用操作矩阵生成矩阵转置查看矩阵特性矩阵乘法计算相关系数矩阵计算方差、协方差、标准差计算特征值与特征向量计算逆矩阵求解线性方程组奇异值分解函数向量化

2023-03-05 14:07:00 770

原创 numpy数组与矩阵运算(一)

numpy数组及其运算创建数组测试两个数组的对应元素是否足够接近修改数组中的元素值数组与标量的运算数组与数组的运算数组排序数组的内积运算访问数组中的元素数组对函数运算的支持改变数组形状数组布尔运算分段函数数组堆叠与合并

2023-03-04 15:42:51 687

原创 Python文件操作

txt文件操作JSON文件操作CSV文件操作Word、Excel、PowerPoint文件操作

2023-03-03 16:02:37 330

原创 Python机器学习实战(一)

基于逻辑回归实现乳腺癌预测基于k-近邻算法实现鸢尾花分类基于决策树实现葡萄酒分类基于朴素贝叶斯实现垃圾短信分类基于支持向量机实现葡萄酒分类基于高斯混合模型实现鸢尾花分类基于主成分分析实现鸢尾花数据降维基于奇异值分解实现图片压缩

2023-03-03 00:02:29 4247 2

原创 Hive电子商务消费行为分析项目

Hive电子商务消费行为分析项目某零售企业的门店最近一年收集的数据

2022-12-18 02:12:45 1305

原创 Python Flask教程学习03

主要写了Flask的两个扩展Flask 邮件(Flask-Mail)Flask Mysql及Flask SQLAlchemy

2022-10-28 23:38:19 626

原创 Python Flask教程学习02

Flask是一个轻量级的可定制框架,使用Python语言编写,较其他同类型框架更为灵活、轻便、安全且容易上手。它可以很好地结合MVC模式进行开发,开发人员分工合作,小型团队在短时间内就可以完成功能丰富的中小型网站或Web服务的实现。另外,Flask还有很强的定制性,用户可以根据自己的需求来添加相应的功能,在保持核心功能简单的同时实现功能的丰富与扩展,其强大的插件库可以让用户实现个性化的网站定制,开发出功能强大的网站。

2022-10-27 18:52:07 482

原创 Python Flask教程学习01

Flask是一个轻量级的可定制框架,使用Python语言编写,较其他同类型框架更为灵活、轻便、安全且容易上手。它可以很好地结合MVC模式进行开发,开发人员分工合作,小型团队在短时间内就可以完成功能丰富的中小型网站或Web服务的实现。另外,Flask还有很强的定制性,用户可以根据自己的需求来添加相应的功能,在保持核心功能简单的同时实现功能的丰富与扩展,其强大的插件库可以让用户实现个性化的网站定制,开发出功能强大的网站。

2022-10-24 23:55:37 902 2

原创 Hive调优(待完善)

Hive调优

2022-10-02 15:39:14 222

原创 Numpy+Pandas+Matplotlib学习

参考的教程是哔哩哔哩孙兴华UP主的视频,边学边做

2022-09-18 17:24:46 1512 2

原创 HBase学习02(HBase API)

环境准备DDL判断表是否存在创建表删除表创建命名空间DML插入数据单条数据查询扫描数据删除数据

2022-06-25 13:38:10 409

Hadoop项目案例:电影网站用户性别预测源代码

这个是课本上的项目,很早以前做的,数据文件(没放在代码里)得自己下载,你们得在自己电脑上做修改才能不报错,至于怎么修改,我也不知道。或许是改ip地址,版本信息,数据库配置之类的......这个主要是一个参考代码,不是下了就能运行的那种。

2022-03-09

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除