自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(68)
  • 收藏
  • 关注

原创 基于 MovieLens-100K 数据集的推荐算法设计与实现

理论层面:深入理解了协同过滤和矩阵分解算法的核心原理实践层面:成功实现了四种推荐算法的代码编写和模型训练评估分析:全面评估了不同算法的性能,分析了优缺点和适用场景报告撰写:形成了结构完整、逻辑严谨的实验报告实验结果表明,在 MovieLens-100K 数据集上,Item-CF 和 User-CF 算法的推荐效果最佳,LFM 算法表现良好,而 SVD 算法的性能有待进一步优化。这些结果为推荐系统的实际搭建提供了重要参考。

2025-12-16 18:51:30 1072

原创 母婴商品销售数据可视化分析:从数据到洞察的完整实践

==================== 第十部分:分析总结 ====================print("📊 分析总结")# 总销量统计print(f"📈 总体销售情况:")print(f" 统计期间:{date_range}")print(f" 总销量:{total_sales:,} 件")print(f" 总订单数:{trade_df.shape[0]:,} 笔")print(f" 总用户数:{trade_df['user_id'].nunique():,} 人")

2025-12-15 23:04:54 869

原创 法律RAG智能问答系统设计与实现

性能测试显示,系统检索响应时间小于1秒,系统初始化时间小于30秒,回答生成时间小于5秒,准确性测试通过人工评估200个法律问题,结果显示回答准确性达85%,相关性达90%,法律依据完整性达88%,回答格式规范性达95%,充分证明了系统的专业性和可靠性。收集的数据包括唯一哈希、时间戳、问题、思考过程、回答、参考来源、检索时间、思考时间、回答时间、总时间、问题分类、交互方式、状态、法律关键词、会话ID、检索数量、来源IP、回答质量评分、LLM模型、嵌入模型、系统版本、错误信息等。

2025-12-11 21:46:01 723

原创 贷款违约预测实战:四种机器学习模型的全面对比分析

本项目基于某金融机构脱敏历史数据,通过系统化的数据预处理和特征工程,对比分析了四种机器学习模型在贷款违约预测任务中的表现。未来,随着更多数据源的整合和算法的进步,智能风控系统的能力将进一步提升,为金融行业的健康发展保驾护航。通过系统化的方法,我们不仅构建了有效的预测模型,更重要的是深入理解了不同算法的特性及其适用场景。清晰展示了四种模型的性能差异,Logistic回归以微弱优势领先,但所有模型均超过0.83的AUC值,表明本项目的数据预处理和特征工程相当成功。ROC曲线直观展示了模型在不同阈值下的表现。

2025-12-11 21:25:23 816

原创 矩阵分解算法实验:隐语义模型与 SVD 的实现与对比

通过本次实验,我们深入理解了隐语义模型的原理和实现过程,并验证了其在评分预测场景下的有效性。实验结果表明,隐语义模型能够准确地重构原始评分矩阵,预测误差很小。与 SVD 相比,隐语义模型具有更好的灵活性和扩展性,能够自然地处理缺失值,计算复杂度更低,更适合实际的推荐系统应用。结合内容特征:可以将用户和物品的内容特征(如用户年龄、性别、物品类别、标签等)与隐特征结合起来,进一步提高模型的性能。时间动态性:用户的偏好和物品的流行度会随着时间变化,可以在模型中加入时间因素,使推荐更加及时准确。

2025-12-03 12:52:25 568

原创 数据可视化:App Store数据分析:价格、类别与用户评分的深度洞察

本次数据分析项目展示了Python在数据科学领域的强大能力。通过pandas进行数据处理,matplotlib和seaborn进行数据可视化,我们能够从原始数据中提取有价值的商业洞察。两种可视化库各有优势:matplotlib提供了更高的自定义灵活性,适合需要精细控制的场景;而seaborn则提供了更美观的默认样式和更简洁的API,适合快速生成统计图表。数据清洗与预处理的基本方法统计描述与探索性数据分析多种数据可视化技术的应用场景从分析结果中提取商业洞察的能力。

2025-12-01 12:10:28 992

原创 AI实现账单预算分析报告

原则执行彻底:条目级的调整严格遵循了“必要增5%,非必要减25%”的原则,仅在极个别有特殊计划的条目(如礼金、电器)上有例外。结构性变化显著支出削减主力学费(-36,515元)是绝对主力。在非必要支出中,购物(-606元)、夜宵(-347元)、礼品(-542元)是削减的重点领域。支出增长主力:必要支出条目因“小幅增长”和“频率增加”双重驱动而增长,如晚餐(+762元)、午餐(+604元)、出行(通勤)(+922元)和住宿费(+875元)。预算编制方式变化住宿费从分次支付改为一次性年度预算,礼金。

2025-11-29 04:43:23 368

原创 中文社交媒体情感分析实战:基于B站评论的机器学习与深度学习对比

评论内容:用户原始评论文本(核心分析对象)评论时间:发布时间戳(用于时间趋势分析)类别:情感标签(-1=负面,0=中性,1=正面)视频标题/网址:评论所属内容上下文数据预处理是关键:去重、分词、停用词过滤三步使数据质量提升30%特征工程决定上限:1-gram+2-gram的TF-IDF特征比单纯1-gram提升5%准确率模型选择需适配场景:SVM适合追求高精度的离线分析,朴素贝叶斯适合实时部署。

2025-11-29 04:33:15 1172 1

原创 贝叶斯网络学习总结与实践

通过本次学习和实践,我深入理解了贝叶斯网络的基本概念和原理,掌握了朴素贝叶斯分类模型的实现方法,并成功完成了课堂作业。实验结果表明,朴素贝叶斯分类模型在处理简单分类问题时具有较高的准确性和效率。贝叶斯网络作为一种强大的概率图模型,在处理不确定性问题方面具有独特的优势。它不仅可以用于分类问题,还可以用于推理、预测和决策支持等多个领域。在未来的学习和工作中,我将继续深入研究贝叶斯网络的理论和应用,探索其在更复杂问题中的潜力。通过本次实践,我也深刻体会到了理论与实践相结合的重要性。

2025-11-27 17:50:56 367

原创 基于多层感知器的手写数字识别实战:从原理到实现

多层感知器是一种前馈神经网络,包含输入层、一个或多个隐藏层以及输出层。与单层感知器不同,MLP能够学习非线性特征,这得益于隐藏层中的激活函数。60,000张训练图像10,000张测试图像每张图像为28×28像素的灰度图对应0-9共10个数字类别通过这个项目,我们不仅实现了一个功能完整的手写数字识别系统,还深入理解了多层感知器的工作原理。这个项目是深度学习入门的绝佳起点,为我们后续学习更复杂的神经网络架构奠定了坚实基础。

2025-11-20 12:17:36 1023

原创 中文垃圾短信分类实验报告

准确率: 96.02%精确率: 96.52%召回率: 97.28%F1分数: 96.90%

2025-11-19 15:20:24 1014

原创 基于邻域的评分预测:User-Based协同过滤算法实践

在电商、影视等推荐场景中,预测用户对未体验物品的评分是推荐系统的核心任务之一。本文将分享我在《推荐算法与应用》课程中完成的**基于用户的协同过滤(User-Based CF)**实验,详细拆解如何通过余弦相似度和Pearson相似度实现评分预测,并分析不同参数对预测效果的影响。完整代码和实验数据已开源,建议边读边动手实践。

2025-11-19 12:43:58 1006

原创 飞桨AI Studio使用d2l进行VOC2012图像分割实验完全指南

本文介绍了在飞桨AI Studio平台上使用PaddlePaddle 2.5.2框架和d2l库进行VOC2012图像分割实验的完整流程。主要内容包括:1) 飞桨AI Studio环境配置与d2l库安装;2) VOC2012数据集的获取与预处理方法;3) 全卷积网络(FCN)模型的构建;4) 图像分割评估指标的计算。实验使用VOC2012数据集,包含21个类别,通过FCN模型实现像素级分类。文中详细说明了环境设置、数据准备、模型训练等关键步骤,为计算机视觉领域的图像分割任务提供了实践指南。

2025-11-18 09:12:51 1461

原创 使用SOM进行图像颜色量化

本文介绍了使用自组织映射(SOM)进行图像颜色量化的方法,通过3×3的SOM网格将图像颜色减少到9种代表色。代码实现了图像预处理(支持RGBA/RGB格式、位深度自适应、亮度增强)、SOM训练(1000次迭代)和结果可视化(原始图像、量化图像、权重变化对比)。该方法能有效减少颜色数量同时保持主要视觉特征,适用于图像压缩和色彩分析等场景。使用MiniSom库实现,只需安装minisom、numpy和matplotlib即可运行。

2025-11-13 21:22:26 288

原创 贪心算法实验2

通过本次实验,我们成功解决了四个经典的贪心算法问题:柠檬水找零问题、分发饼干问题、加油站问题和无重叠区间问题。每个问题都采用了不同的贪心策略,但都成功地通过局部最优选择实现了全局最优解。

2025-11-13 21:15:40 1074

原创 贪心算法实验1

本次实验通过求解四个典型编程问题,系统实践了贪心算法的核心思想,深化了对"问题分析—策略设计—代码实现—结果验证"完整解题流程的理解。实验的核心收获在于明确了算法策略与问题特性的匹配原则:当问题可通过局部最优选择累积达成全局最优时,贪心算法是高效且简洁的解决方案。每个问题的策略设计都与问题的核心约束高度匹配,确保了结果的正确性与最优性。在解题过程中,问题核心约束的精准把握是关键前提。例如分发糖果问题需同时满足"相邻高分多糖果"和"最少糖果数"的双重要求,因此设计了两次遍历的贪心策略;

2025-11-13 21:00:21 660

原创 账单清洗与飞书上传脚本设计

智能适应性:能够自动处理不同格式、不同编码的账单文件高级清洗规则:实现了复杂交易模式的识别和处理高性能设计:采用多线程并行处理,大幅提高上传效率健壮性保障:完善的错误处理和重试机制用户友好:详细的日志和报告,便于监控和问题排查可扩展性:模块化设计,易于添加新的数据源或处理规则通过本系统,用户可以便捷地将分散在多个平台的账单数据整合到飞书表格中,实现统一管理和分析,为个人或企业财务管理提供有力支持。

2025-11-12 12:47:13 972

原创 在安全模式下迁移AppData数据并创建符号链接

通过本文介绍的方法,您可以安全地将AppData数据从C盘迁移到其他驱动器,有效解决C盘空间不足的问题。安全模式确保文件不被占用Robocopy保证数据完整复制符号链接维持系统兼容性备份策略提供安全保障这种方法已在多个环境中验证,能够在不影响系统功能的前提下成功迁移用户数据。

2025-11-12 12:46:43 917

原创 账单处理工具设计说明

本项目通过模块化设计、智能识别机制和高效的错误处理,实现了跨平台账单数据的处理与上传。智能表头识别:能够自动识别不同格式账单的表头结构多编码支持:通过多级尝试机制确保在不同环境下的兼容性高效并行上传:使用批处理和并发技术大幅提高上传效率完善的错误处理:多层次的错误处理和降级机制确保系统稳定性统一配置管理:集中式配置便于维护和扩展这些技术实现共同确保了系统能够高效、可靠地处理各类账单数据,满足用户的实际需求。

2025-11-11 21:08:32 399

原创 账单处理清洗集成工具

这是一个功能全面的账单处理集成工具,能够自动化处理来自支付宝、微信支付和京东的账单数据,实现数据清洗、格式标准化、数据合并以及可选的飞书多维表格数据上传。该工具通过模块化设计,提供了灵活的配置选项和完善的日志记录功能,适用于个人或企业的日常财务数据处理需求。

2025-11-11 21:06:54 524

原创 通过git上传项目到码云和GitHub操作手册

版本:1.0.0 - 更新时间:2024年11月10日。

2025-11-11 21:06:15 1316

原创 git仓库管理

版本:1.0.0 - 更新时间:2024年11月10日。

2025-11-11 21:03:31 1013

原创 MySQL 迁移总结报告

✅ MySQL 服务正常启动✅ root 账户可正常登录✅ 服务设置为自动启动✅ 端口 3306 正常监听。

2025-11-11 21:00:48 998

原创 AI项目开发提示词策略指南

基于账单处理清洗集成工具项目的实践经验,总结了一套完整的AI项目开发提示词策略。处理支付宝、京东、微信三个平台的账单数据智能数据清洗和标准化处理账单合并和统计分析飞书多维表格批量上传生成完整的处理报告和日志通过这个项目的实践,形成了从想法到完整项目的全流程AI协作方法论。目标:经验总结、优化建议、后续规划项目总结报告请帮我总结[项目]的开发经验,包括:1. 项目完成情况2. 技术难点和解决方案3. 性能表现和优化点4. 遇到的问题和经验教训5. 改进建议和后续规划。

2025-11-10 14:05:05 985

原创 账单处理集成工具项目开发全流程提示词策略总结

请为账单处理集成工具项目撰写项目总结报告,包括:- 项目成果概述- 技术架构亮点- 遇到的问题及解决方案- 性能优化经验- 后续改进方向- 项目价值评估明确需求→ 使用结构化提示词描述业务场景分步设计→ 按模块逐个实现,降低复杂度及时验证→ 每个步骤完成后进行测试验证文档驱动→ 保持代码与文档的同步更新人工介入→ 在关键业务逻辑和敏感环节人工审核这种策略确保了项目的成功交付,同时最大化了AI的开发效率,形成了人机协作的最佳实践。

2025-11-10 14:01:58 754

原创 飞书多维表格批量数据上传工具 - 技术文档

本工具是一个高性能、高可靠性的数据上传解决方案,专门用于将CSV格式的数据批量上传到飞书多维表格。通过多级优化策略,实现了在保证数据完整性的前提下最大化上传速度。数据流🎯 第一部分:数据结构对齐流程1.1 整体数据对齐架构#mermaid-svg-e3kjHsIxfvNwLYk6 {font-family:"trebuchet ms",verdana,arial,sans-serif;font-size:16px;fill:#333;}#mermaid-svg-e3kjHsIxfvNwLYk6

2025-11-10 00:25:38 686

原创 01Software 文件夹说明书

【代码】01Software 文件夹说明书。

2025-11-08 13:51:30 272

原创 Windows软件自动扫描与分类工具 - 技术文档

开发一个能够全面扫描Windows系统中所有已安装软件,并基于国际标准进行自动分类的工具,解决软件资产管理中的识别和分类难题。Windows系统中,已安装软件的信息主要存储在以下注册表位置:从注册表中提取的关键信息包括:采用基于软件名称的智能去重:自动分类原理1. 分类体系设计基于ISO/IEC TR 12182软件分类标准,设计了12个大类:采用多层级匹配策略:3. 关键词匹配机制为每个分类设计了专属的关键词库:代码结构设计核心模块1. 扫描模块 ()负责从注册表中扫描并提取软件信息:

2025-11-07 18:34:12 872

原创 五子棋项目Alpha-Beta剪枝与MCTS+神经网络实现人机对弈算法对比报告

此外,还可以考虑结合两种方法的优点,在简单局面使用Alpha-Beta剪枝,在复杂局面切换到MCTS搜索,以获得更好的综合性能。该系统用于快速检测关键威胁,优先处理能够直接获胜或必须防守的情况,避免不必要的MCTS搜索,提高决策效率。:使用预定义的棋型评分系统,对各种棋型(如连五、活四、冲四等)分配不同权重,实现快速有效的局面评估。该类实现了MCTS的并行化,通过多线程同时执行搜索,充分利用多核CPU资源,提高搜索效率。:用于评估棋盘状态,结合威胁评估、位置评估和战术评估,提供高质量的局面价值估计。

2025-11-06 12:48:11 984

原创 五子棋游戏软件设计与实现

五子棋游戏的核心逻辑主要包括棋盘表示、落子规则、胜负判定等关键部分。在本系统中,这些功能被封装在GameCore类中,实现了游戏状态的维护与更新。本研究成功设计并实现了一款功能完备、性能优良的五子棋游戏软件。系统采用模块化设计,具有良好的可扩展性和可维护性。AI决策系统基于极小极大搜索算法,结合Alpha-Beta剪枝、置换表优化、移动排序等多种优化技术,实现了不同难度级别的AI对手,满足了不同水平玩家的需求。通过算法复杂度分析和性能测试,验证了系统的高效性和稳定性。

2025-11-06 12:43:22 1038

原创 五子棋游戏人机对战模式技术分析

该五子棋人机对战系统实现了一套完整的AI决策框架,结合了传统搜索算法与现代神经网络评估技术。分层架构:清晰的模块划分,便于维护和扩展混合决策:结合MCTS搜索和神经网络评估,兼顾搜索深度和评估质量优化搜索:通过相关位置过滤、并行计算等技术优化搜索效率阶段感知:根据游戏进度动态调整策略难度分级:支持多种难度级别,适应不同水平的玩家系统在技术实现上展现了良好的工程实践,包括代码组织、性能优化、错误处理等方面。通过合理的算法选择和参数调优,实现了高效、智能的五子棋AI对手。

2025-11-06 12:38:20 620

原创 五子棋人机对弈项目

调整AI难度:修改中的和字典优化MCTS参数:修改中的等参数调整评估权重:修改中的WEIGHTS字典注意:修改配置参数可能会影响游戏性能和AI棋力,请谨慎调整。

2025-11-06 12:37:10 634

原创 Spark 文本分类实战经验总结

使用 Apache Spark 和逻辑回归算法对 AG 新闻语料库进行分类,实现自动识别新闻类别的功能。通过这个项目,我不仅掌握了 Spark 文本分类的完整流程,更重要的是积累了宝贵的实战经验。从环境配置到代码实现,从数据处理到模型训练,每一个环节都让我对大数据处理有了更深的理解。

2025-11-06 12:28:00 1054

原创 基于用户的协同过滤算法理解

协同过滤(Collaborative Filtering)是推荐系统中最经典的算法之一,其核心思想是 “相似的用户喜欢相似的物品”。算法有效性:基于用户的协同过滤算法在无评分二值数据场景下表现良好性能表现:用户 A 的 F1 分数达到 1.0,用户 D 达到 0.8,推荐效果理想算法对比:三种相似度算法在小规模数据集上表现基本一致参数影响:k 值(相似用户数量)对推荐结果影响较小。

2025-10-29 11:56:12 809

原创 Python数据可视化实战:matplotlib进阶技巧学习笔记

这段代码展示了如何使用matplotlib创建多个子图来展示不同指标的时间序列数据,包括规模以上工业、钢材、十种有色金属的同比增长速度。通过垂直排列的三个子图,实现了数据的清晰对比和展示。这段代码使用横向条形图对比展示了不同国家养猫和养狗人群的比例,通过双栏布局实现直观对比。横向条形图特别适合类别名称较长的情况,能够更好地展示国家名称。这段代码展示了如何创建复杂的组合图表,包括柱状图和条形图的混合布局,用于对比抖音和快手的用户分布数据。

2025-10-27 12:11:43 1021

原创 动态规划算法实践:从斐波那契到数字推理

动态规划本质理解分解子问题:将复杂问题分解为相似的子问题存储中间结果:通过dp表避免重复计算状态转移:建立子问题与原问题的关联动态规划三要素dp表定义:明确数组元素的含义边界条件:确定初始值状态转移方程:建立递推关系算法优势时间效率:从指数级降低到线性级空间换时间:通过存储中间结果提升效率可扩展性:易于处理问题变种。

2025-10-23 16:35:14 275

原创 聚类算法实战:从 KMeans 到 DBSCAN

KMeans 是一种基于距离的聚类算法,其基本思想是:随机选择 K 个初始聚类中心计算每个样本到各个聚类中心的距离将样本分配到距离最近的聚类中心更新每个聚类的中心(取该聚类所有样本的均值)重复步骤 2-4,直到聚类中心不再显著变化或达到最大迭代次数特点KMeansDBSCAN聚类数量需要预先指定自动发现聚类形状球形簇任意形状噪声处理不直接处理明确识别噪声点计算复杂度较低(O (n))较高(O (n²))参数敏感性对初始中心敏感。

2025-10-23 09:51:40 1063

原创 Matplotlib 数据可视化基础测试题

(单选题) 下列关于图表辅助元素的说法中,描述错误的是 ( )。A. 标题一般位于图表的顶部中心,可以帮助用户理解图表要说明的内容B. 参考区域是标记坐标轴上特殊值的一条直线C. 图例通常由标签和符号两部分组成D. 表格主要用于强调数据的具体细节(单选题) 下列选项中,用于设置坐标轴刻度标签的函数是 ( )。A. xlim ()B. grid ()(单选题) 当使用 pyplot 模块的 legend () 函数添加图例时,可以通过以下哪个参数控制图例的列数?( )A. loc。

2025-10-23 08:56:01 876

原创 Heroku 部署及问题解决

Heroku 部署流程规范但门槛较高,核心痛点集中在信用卡验证和环境适配。对于国内用户,若信用卡验证困难,优先选择 Render、Railway 等替代平台;若坚持使用 Heroku,需提前做好信用卡配置、依赖检查和日志排查,降低部署风险。

2025-10-22 23:41:30 1037

原创 深入浅出:两种经典分治算法的 Python 实现

时间复杂度:O (n²),其中 n=2^k。算法需要填充 n×n 的表格,每个元素都被处理一次。空间复杂度:O (n²),主要用于存储日程表矩阵。算法特点保证了每个选手与其他所有选手恰好比赛一次每个选手每天只比赛一次比赛安排具有对称性和规律性。

2025-10-16 19:44:01 755

项目案例1-贷款违约行为预测数据集

项目案例1-贷款违约行为预测数据集

2025-12-11

d2l-0.16.7-py3-none-any.whl,d2l稳定版

d2l-0.16.7-py3-none-any.whl,d2l稳定版

2025-11-18

paddle.py,放在d2l目录下面

paddle.py,放在d2l目录下面

2025-11-18

基于线性回归模型的数据分析与预测实践数据-二手车与医疗数据

基于线性回归模型的数据分析与预测实践数据-二手车与医疗数据

2025-10-14

通过指数基金实现复利的思想指南

复利

2025-10-13

github上的股票分析系统

github上的股票分析系统

2025-09-29

广州工商学院学生管理规定与行为准则实施办法

广州工商学院学生管理规定与行为准则实施办法

2025-09-15

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除