~~李木子~~-优快云博客

原创基于 MovieLens-100K 数据集的推荐算法设计与实现

理论层面：深入理解了协同过滤和矩阵分解算法的核心原理实践层面：成功实现了四种推荐算法的代码编写和模型训练评估分析：全面评估了不同算法的性能，分析了优缺点和适用场景报告撰写：形成了结构完整、逻辑严谨的实验报告实验结果表明，在 MovieLens-100K 数据集上，Item-CF 和 User-CF 算法的推荐效果最佳，LFM 算法表现良好，而 SVD 算法的性能有待进一步优化。这些结果为推荐系统的实际搭建提供了重要参考。

2025-12-16 18:51:30 1072

原创母婴商品销售数据可视化分析：从数据到洞察的完整实践

==================== 第十部分：分析总结 ====================print("📊 分析总结")# 总销量统计print(f"📈 总体销售情况：")print(f" 统计期间：{date_range}")print(f" 总销量：{total_sales:,} 件")print(f" 总订单数：{trade_df.shape[0]:,} 笔")print(f" 总用户数：{trade_df['user_id'].nunique():,} 人")

2025-12-15 23:04:54 869

原创法律RAG智能问答系统设计与实现

性能测试显示，系统检索响应时间小于1秒，系统初始化时间小于30秒，回答生成时间小于5秒，准确性测试通过人工评估200个法律问题，结果显示回答准确性达85%，相关性达90%，法律依据完整性达88%，回答格式规范性达95%，充分证明了系统的专业性和可靠性。收集的数据包括唯一哈希、时间戳、问题、思考过程、回答、参考来源、检索时间、思考时间、回答时间、总时间、问题分类、交互方式、状态、法律关键词、会话ID、检索数量、来源IP、回答质量评分、LLM模型、嵌入模型、系统版本、错误信息等。

2025-12-11 21:46:01 723

原创贷款违约预测实战：四种机器学习模型的全面对比分析

本项目基于某金融机构脱敏历史数据，通过系统化的数据预处理和特征工程，对比分析了四种机器学习模型在贷款违约预测任务中的表现。未来，随着更多数据源的整合和算法的进步，智能风控系统的能力将进一步提升，为金融行业的健康发展保驾护航。通过系统化的方法，我们不仅构建了有效的预测模型，更重要的是深入理解了不同算法的特性及其适用场景。清晰展示了四种模型的性能差异，Logistic回归以微弱优势领先，但所有模型均超过0.83的AUC值，表明本项目的数据预处理和特征工程相当成功。ROC曲线直观展示了模型在不同阈值下的表现。

2025-12-11 21:25:23 816

原创矩阵分解算法实验：隐语义模型与 SVD 的实现与对比

通过本次实验，我们深入理解了隐语义模型的原理和实现过程，并验证了其在评分预测场景下的有效性。实验结果表明，隐语义模型能够准确地重构原始评分矩阵，预测误差很小。与 SVD 相比，隐语义模型具有更好的灵活性和扩展性，能够自然地处理缺失值，计算复杂度更低，更适合实际的推荐系统应用。结合内容特征：可以将用户和物品的内容特征（如用户年龄、性别、物品类别、标签等）与隐特征结合起来，进一步提高模型的性能。时间动态性：用户的偏好和物品的流行度会随着时间变化，可以在模型中加入时间因素，使推荐更加及时准确。

2025-12-03 12:52:25 568

原创数据可视化：App Store数据分析：价格、类别与用户评分的深度洞察

本次数据分析项目展示了Python在数据科学领域的强大能力。通过pandas进行数据处理，matplotlib和seaborn进行数据可视化，我们能够从原始数据中提取有价值的商业洞察。两种可视化库各有优势：matplotlib提供了更高的自定义灵活性，适合需要精细控制的场景；而seaborn则提供了更美观的默认样式和更简洁的API，适合快速生成统计图表。数据清洗与预处理的基本方法统计描述与探索性数据分析多种数据可视化技术的应用场景从分析结果中提取商业洞察的能力。

2025-12-01 12:10:28 992

原创 AI实现账单预算分析报告

原则执行彻底：条目级的调整严格遵循了“必要增5%，非必要减25%”的原则，仅在极个别有特殊计划的条目（如礼金、电器）上有例外。结构性变化显著支出削减主力学费(-36,515元)是绝对主力。在非必要支出中，购物(-606元)、夜宵(-347元)、礼品(-542元)是削减的重点领域。支出增长主力：必要支出条目因“小幅增长”和“频率增加”双重驱动而增长，如晚餐(+762元)、午餐(+604元)、出行（通勤）(+922元)和住宿费(+875元)。预算编制方式变化住宿费从分次支付改为一次性年度预算，礼金。

2025-11-29 04:43:23 368

原创中文社交媒体情感分析实战：基于B站评论的机器学习与深度学习对比

评论内容：用户原始评论文本（核心分析对象）评论时间：发布时间戳（用于时间趋势分析）类别：情感标签（-1=负面，0=中性，1=正面）视频标题/网址：评论所属内容上下文数据预处理是关键：去重、分词、停用词过滤三步使数据质量提升30%特征工程决定上限：1-gram+2-gram的TF-IDF特征比单纯1-gram提升5%准确率模型选择需适配场景：SVM适合追求高精度的离线分析，朴素贝叶斯适合实时部署。

2025-11-29 04:33:15 1172 1

原创贝叶斯网络学习总结与实践

通过本次学习和实践，我深入理解了贝叶斯网络的基本概念和原理，掌握了朴素贝叶斯分类模型的实现方法，并成功完成了课堂作业。实验结果表明，朴素贝叶斯分类模型在处理简单分类问题时具有较高的准确性和效率。贝叶斯网络作为一种强大的概率图模型，在处理不确定性问题方面具有独特的优势。它不仅可以用于分类问题，还可以用于推理、预测和决策支持等多个领域。在未来的学习和工作中，我将继续深入研究贝叶斯网络的理论和应用，探索其在更复杂问题中的潜力。通过本次实践，我也深刻体会到了理论与实践相结合的重要性。

2025-11-27 17:50:56 367

原创基于多层感知器的手写数字识别实战：从原理到实现

多层感知器是一种前馈神经网络，包含输入层、一个或多个隐藏层以及输出层。与单层感知器不同，MLP能够学习非线性特征，这得益于隐藏层中的激活函数。60,000张训练图像10,000张测试图像每张图像为28×28像素的灰度图对应0-9共10个数字类别通过这个项目，我们不仅实现了一个功能完整的手写数字识别系统，还深入理解了多层感知器的工作原理。这个项目是深度学习入门的绝佳起点，为我们后续学习更复杂的神经网络架构奠定了坚实基础。

2025-11-20 12:17:36 1023

原创中文垃圾短信分类实验报告

准确率: 96.02%精确率: 96.52%召回率: 97.28%F1分数: 96.90%

2025-11-19 15:20:24 1014

原创基于邻域的评分预测：User-Based协同过滤算法实践

在电商、影视等推荐场景中，预测用户对未体验物品的评分是推荐系统的核心任务之一。本文将分享我在《推荐算法与应用》课程中完成的**基于用户的协同过滤（User-Based CF）**实验，详细拆解如何通过余弦相似度和Pearson相似度实现评分预测，并分析不同参数对预测效果的影响。完整代码和实验数据已开源，建议边读边动手实践。

2025-11-19 12:43:58 1006

原创飞桨AI Studio使用d2l进行VOC2012图像分割实验完全指南

本文介绍了在飞桨AI Studio平台上使用PaddlePaddle 2.5.2框架和d2l库进行VOC2012图像分割实验的完整流程。主要内容包括：1) 飞桨AI Studio环境配置与d2l库安装；2) VOC2012数据集的获取与预处理方法；3) 全卷积网络(FCN)模型的构建；4) 图像分割评估指标的计算。实验使用VOC2012数据集，包含21个类别，通过FCN模型实现像素级分类。文中详细说明了环境设置、数据准备、模型训练等关键步骤，为计算机视觉领域的图像分割任务提供了实践指南。

2025-11-18 09:12:51 1461

原创使用SOM进行图像颜色量化

本文介绍了使用自组织映射(SOM)进行图像颜色量化的方法，通过3×3的SOM网格将图像颜色减少到9种代表色。代码实现了图像预处理(支持RGBA/RGB格式、位深度自适应、亮度增强)、SOM训练(1000次迭代)和结果可视化(原始图像、量化图像、权重变化对比)。该方法能有效减少颜色数量同时保持主要视觉特征，适用于图像压缩和色彩分析等场景。使用MiniSom库实现，只需安装minisom、numpy和matplotlib即可运行。

2025-11-13 21:22:26 288

原创贪心算法实验2

通过本次实验，我们成功解决了四个经典的贪心算法问题：柠檬水找零问题、分发饼干问题、加油站问题和无重叠区间问题。每个问题都采用了不同的贪心策略，但都成功地通过局部最优选择实现了全局最优解。

2025-11-13 21:15:40 1074

原创贪心算法实验1

本次实验通过求解四个典型编程问题，系统实践了贪心算法的核心思想，深化了对"问题分析—策略设计—代码实现—结果验证"完整解题流程的理解。实验的核心收获在于明确了算法策略与问题特性的匹配原则：当问题可通过局部最优选择累积达成全局最优时，贪心算法是高效且简洁的解决方案。每个问题的策略设计都与问题的核心约束高度匹配，确保了结果的正确性与最优性。在解题过程中，问题核心约束的精准把握是关键前提。例如分发糖果问题需同时满足"相邻高分多糖果"和"最少糖果数"的双重要求，因此设计了两次遍历的贪心策略；

2025-11-13 21:00:21 660

原创账单清洗与飞书上传脚本设计

智能适应性：能够自动处理不同格式、不同编码的账单文件高级清洗规则：实现了复杂交易模式的识别和处理高性能设计：采用多线程并行处理，大幅提高上传效率健壮性保障：完善的错误处理和重试机制用户友好：详细的日志和报告，便于监控和问题排查可扩展性：模块化设计，易于添加新的数据源或处理规则通过本系统，用户可以便捷地将分散在多个平台的账单数据整合到飞书表格中，实现统一管理和分析，为个人或企业财务管理提供有力支持。

2025-11-12 12:47:13 972

原创在安全模式下迁移AppData数据并创建符号链接

通过本文介绍的方法，您可以安全地将AppData数据从C盘迁移到其他驱动器，有效解决C盘空间不足的问题。安全模式确保文件不被占用Robocopy保证数据完整复制符号链接维持系统兼容性备份策略提供安全保障这种方法已在多个环境中验证，能够在不影响系统功能的前提下成功迁移用户数据。

2025-11-12 12:46:43 917

原创账单处理工具设计说明

本项目通过模块化设计、智能识别机制和高效的错误处理，实现了跨平台账单数据的处理与上传。智能表头识别：能够自动识别不同格式账单的表头结构多编码支持：通过多级尝试机制确保在不同环境下的兼容性高效并行上传：使用批处理和并发技术大幅提高上传效率完善的错误处理：多层次的错误处理和降级机制确保系统稳定性统一配置管理：集中式配置便于维护和扩展这些技术实现共同确保了系统能够高效、可靠地处理各类账单数据，满足用户的实际需求。

2025-11-11 21:08:32 399

原创账单处理清洗集成工具

这是一个功能全面的账单处理集成工具，能够自动化处理来自支付宝、微信支付和京东的账单数据，实现数据清洗、格式标准化、数据合并以及可选的飞书多维表格数据上传。该工具通过模块化设计，提供了灵活的配置选项和完善的日志记录功能，适用于个人或企业的日常财务数据处理需求。

2025-11-11 21:06:54 524

原创通过git上传项目到码云和GitHub操作手册

版本：1.0.0 - 更新时间：2024年11月10日。

2025-11-11 21:06:15 1316

原创 git仓库管理

版本：1.0.0 - 更新时间：2024年11月10日。

2025-11-11 21:03:31 1013

原创 MySQL 迁移总结报告

✅ MySQL 服务正常启动✅ root 账户可正常登录✅ 服务设置为自动启动✅ 端口 3306 正常监听。

2025-11-11 21:00:48 998

原创 AI项目开发提示词策略指南

基于账单处理清洗集成工具项目的实践经验，总结了一套完整的AI项目开发提示词策略。处理支付宝、京东、微信三个平台的账单数据智能数据清洗和标准化处理账单合并和统计分析飞书多维表格批量上传生成完整的处理报告和日志通过这个项目的实践，形成了从想法到完整项目的全流程AI协作方法论。目标：经验总结、优化建议、后续规划项目总结报告请帮我总结[项目]的开发经验，包括：1. 项目完成情况2. 技术难点和解决方案3. 性能表现和优化点4. 遇到的问题和经验教训5. 改进建议和后续规划。

2025-11-10 14:05:05 985

原创账单处理集成工具项目开发全流程提示词策略总结

请为账单处理集成工具项目撰写项目总结报告，包括：- 项目成果概述- 技术架构亮点- 遇到的问题及解决方案- 性能优化经验- 后续改进方向- 项目价值评估明确需求→ 使用结构化提示词描述业务场景分步设计→ 按模块逐个实现，降低复杂度及时验证→ 每个步骤完成后进行测试验证文档驱动→ 保持代码与文档的同步更新人工介入→ 在关键业务逻辑和敏感环节人工审核这种策略确保了项目的成功交付，同时最大化了AI的开发效率，形成了人机协作的最佳实践。

2025-11-10 14:01:58 754

原创飞书多维表格批量数据上传工具 - 技术文档

本工具是一个高性能、高可靠性的数据上传解决方案，专门用于将CSV格式的数据批量上传到飞书多维表格。通过多级优化策略，实现了在保证数据完整性的前提下最大化上传速度。数据流🎯 第一部分：数据结构对齐流程1.1 整体数据对齐架构#mermaid-svg-e3kjHsIxfvNwLYk6 {font-family:"trebuchet ms",verdana,arial,sans-serif;font-size:16px;fill:#333;}#mermaid-svg-e3kjHsIxfvNwLYk6

2025-11-10 00:25:38 686

原创 01Software 文件夹说明书

【代码】01Software 文件夹说明书。

2025-11-08 13:51:30 272

原创 Windows软件自动扫描与分类工具 - 技术文档

开发一个能够全面扫描Windows系统中所有已安装软件，并基于国际标准进行自动分类的工具，解决软件资产管理中的识别和分类难题。Windows系统中，已安装软件的信息主要存储在以下注册表位置：从注册表中提取的关键信息包括：采用基于软件名称的智能去重：自动分类原理1. 分类体系设计基于ISO/IEC TR 12182软件分类标准，设计了12个大类：采用多层级匹配策略：3. 关键词匹配机制为每个分类设计了专属的关键词库：代码结构设计核心模块1. 扫描模块 ()负责从注册表中扫描并提取软件信息：

2025-11-07 18:34:12 872

原创五子棋项目Alpha-Beta剪枝与MCTS+神经网络实现人机对弈算法对比报告

此外，还可以考虑结合两种方法的优点，在简单局面使用Alpha-Beta剪枝，在复杂局面切换到MCTS搜索，以获得更好的综合性能。该系统用于快速检测关键威胁，优先处理能够直接获胜或必须防守的情况，避免不必要的MCTS搜索，提高决策效率。：使用预定义的棋型评分系统，对各种棋型（如连五、活四、冲四等）分配不同权重，实现快速有效的局面评估。该类实现了MCTS的并行化，通过多线程同时执行搜索，充分利用多核CPU资源，提高搜索效率。：用于评估棋盘状态，结合威胁评估、位置评估和战术评估，提供高质量的局面价值估计。

2025-11-06 12:48:11 984

项目案例1-贷款违约行为预测数据集

d2l-0.16.7-py3-none-any.whl，d2l稳定版

paddle.py，放在d2l目录下面

基于线性回归模型的数据分析与预测实践数据-二手车与医疗数据

通过指数基金实现复利的思想指南

github上的股票分析系统

广州工商学院学生管理规定与行为准则实施办法

空空如也