- 博客(279)
- 资源 (15)
- 收藏
- 关注
原创 关联规则学习算法案例
1. **购物篮分析**:发现顾客购买习惯,优化商品摆放和促销策略。2. **推荐系统**:基于用户行为数据,为用户提供个性化推荐。3. **医疗诊断**:分析症状与疾病之间的关联,辅助医生做出更准确的诊断。4. **网络安全**:识别异常行为模式,帮助检测潜在的网络攻击。5. **广告投放**:根据用户特征,投放相关度更高的广告,提高点击率和转化率。
2025-07-18 05:34:07
430
原创 五种聚类算法应用场景案例
五种常见聚类算法在不同生活场景中的应用案例:1. K-Means聚类:模拟顾客细分场景,根据消费频率和平均消费金额将顾客分为不同群体。2. DBSCAN聚类:模拟地理数据点分析,识别城市热点区域并发现偏远离群点。3. 层次聚类:模拟物种分类,根据多种特征对生物进行层级聚类。4. 高斯混合模型:模拟客户购买行为分析,考虑数据的概率分布进行聚类。5. 密度峰值聚类:模拟社交网络分析,识别网络中的核心节点和社区结构。每个案例都包含数据模拟、模型应用和可视化展示,并配有详细的中文注释。
2025-07-17 06:25:22
853
原创 随机森林算法
随机森林可以理解为"一群决策树专家"共同做判断:比如你想判断一个瓜甜不甜,单棵决策树可能只看"颜色"和"形状"随机森林会找100个"决策树专家",每个专家随机看不同的特征(有的看颜色+硬度,有的看形状+纹路),而且每个专家只看一部分数据最后投票决定:多数专家说甜,就判断为甜核心优势:避免"偏见":单棵树可能固执己见(过拟合),一群树投票更客观抗干扰:数据里有噪音(比如一个歪瓜很甜),不会影响整体判断能告诉你哪个特征最重要(比如判断瓜甜不甜时,"糖度"比"大小"更重要)
2025-07-16 14:59:46
243
原创 决策树算法
1. **医疗诊断**:医生根据症状(如是否发烧、咳嗽、头痛等)来判断病人可能患的疾病。2. **贷款审批**:银行根据申请人的收入、信用记录、负债情况等来决定是否批准贷款。3. **购物推荐**:电商平台根据用户的购买历史、浏览记录、年龄、性别等来推荐商品。4. **游戏策略**:在玩游戏时,根据当前游戏状态(如敌人位置、自己的血量、武器情况等)来决定下一步行动。
2025-07-16 14:44:57
647
原创 K近邻算法的分类与回归应用场景
K近邻(K-Nearest Neighbors, KNN)算法是一种基础但强大的机器学习方法,它既可以用于分类问题,也能解决回归问题。两者的核心思想都是基于"近朱者赤,近墨者黑"的原理,但应用场景和输出形式有所不同。
2025-07-16 10:18:38
958
原创 逻辑回归案例
逻辑回归是一种用于分类的机器学习算法,尽管名字中有“回归”,但它主要用于二分类问题。1. 游戏账号安全风险2. 客户购买预测3. 判断病人是否患病4. 水果供应链管理5. 癌症患者生存状态预测
2025-07-15 11:42:55
578
原创 销售数据可视化分析项目
使用 Python 进行销售数据的模拟生成、加载、分析和可视化,通过一系列实际需求案例,让学员掌握 Pandas、NumPy、Matplotlib 和 Seaborn 等库的基本使用方法。
2025-07-11 17:06:22
695
原创 matplotlib基本绘图
Matplotlib 是 Python 中一个流行的绘图库,用于创建各种静态、动态和交互式的图表。本文将通过一系列完整的案例来教授如何使用 Matplotlib 进行数据可视化。
2025-07-11 14:28:52
682
原创 Hadoop WordCount 程序实现与执行指南
下面是使用 Python 实现的 Hadoop WordCount 程序,包含完整的 Mapper 和 Reducer 部分。这个程序可以在 PyCharm 中本地测试,也可以部署到远程 Hadoop 集群上运行。
2025-06-30 11:29:50
430
原创 pyhdfs 操作 HDFS
以下是一个使用 pyhdfs 库与 HDFS 进行交互的完整代码示例。这个示例展示了 pyhdfs 的基本用法,包括连接 HDFS、创建目录、上传 / 下载文件、列出目录内容、读取文件内容以及删除文件和目录等操作。在使用前,请确保已经安装了 pyhdfs 库(pip install pyhdfs),并根据你的 HDFS 环境修改连接配置。
2025-06-30 11:11:23
142
原创 脱发因素机器学习数据分析
随着年龄增长,脱发成为影响外貌与健康的重要问题。本数据集包含遗传、荷尔蒙变化、医疗状况、药物治疗、营养缺乏、心理压力等12个可能导致脱发的因素,旨在通过数据分析挖掘各因素与脱发的潜在关联,为健康管理和医疗干预提供参考。
2025-05-30 10:12:18
1766
原创 基于心理健康与数字行为数据的多维度分析
随着数字设备的普及,人们在日常生活中的数字行为(如屏幕时间、社交媒体使用、通知数量等)与心理健康之间的关系逐渐受到关注。本案例旨在通过机器学习方法,分析数字行为与心理健康指标之间的关系,并探索潜在的模式和趋势。
2025-05-27 15:02:56
1283
原创 使用 scikit-learn 库对乌克兰冲突事件数据集进行多维度分类分析
在现代冲突研究中,对冲突事件进行多维度分析和可视化可以帮助我们更好地理解冲突的模式、趋势和影响因素。本次作业将使用开源冲突数据,构建一个完整的机器学习分类流程,从数据预处理到模型构建,再到结果可视化,全面展示如何使用`scikit-learn`库处理多维度分类问题。
2025-05-27 08:53:11
2390
原创 基于 Ollama + LangChain 的 AI 旅行计划生成器开发教程
使用本地部署的 Ollama DeepSeek 模型和 LangChain 框架,开发一个能根据用户输入生成旅行计划的 AI 应用。通过本教程,你学会了:1. 本地部署和使用 Ollama 模型2. 使用 LangChain 最新 API 开发应用3. 处理库版本变更带来的兼容性问题4. 基于大模型构建实用工具的基本流程
2025-05-16 09:31:19
2558
原创 tensorflow-cpu
intel优化版本可以执行以下命令。intel优化版本可以执行以下命令。intel优化版本可以执行以下命令。intel优化版本可以执行以下命令。intel优化版本可以执行以下命令。
2025-05-12 08:20:53
2620
原创 基于文本的情感分析
1. 数据加载与特征转换2. 数据集划分3. 模型训练4. 模型测试5. 输出信息量较大的特征6. 对输入的句子进行情感分析7. 使用SnowNLP进行情感分析8. 主函数
2025-04-15 08:39:44
3489
原创 Pandas 中透视表(`pivot_table`)和交叉表(`crosstab`)的区别
**核心区别**1. **透视表 (`pivot_table`)** - 用于对数据进行 **聚合计算**(如求和、均值、计数等)。 - 支持多维度分组(行、列、甚至多层索引)。 - 可以指定 `values`(要聚合的值)和 `aggfunc`(聚合函数)。2. **交叉表 (`crosstab`)** - 专门用于 **计算频率分布**(即列联表,统计不同组合的出现次数)。 - 默认行为是计数,但也可通过参数自定义聚合函数。 - 语法更简洁,适合快速生成
2025-04-13 17:22:41
3614
原创 pandas 关于 `merge` 和 `join` 的区别
1. **`merge`**: - 更通用的合并方法,支持基于**列**或**索引**的合并。 - 可以指定左右DataFrame的合并键(`left_on`, `right_on`)。 - 支持多种合并方式(内连接、外连接、左连接、右连接)。2. **`join`**: - 是 `merge` 的简化版,默认基于**索引**合并。 - 只能基于**左DataFrame的索引**和**右DataFrame的索引或指定列**合并。 - 语法更简洁,适合快速操作。
2025-04-13 17:18:49
3271
原创 django数据迁移操作受阻
错误信息:django.db.utils.OperationalError: (1227, 'Access denied; you need (at least one of) the SYSTEM_VARIABLES_ADMIN or SESSION_VARIABLES_ADMIN privilege(s) for this operation')该问题是由于MySQL用户缺乏SYSTEM_VARIABLES_ADMIN或SESSION_VARIABL_ADMIN权限导致的Django数据迁移受阻
2025-04-11 11:24:08
3816
原创 seaborn基本绘图
# 导入绘图库 matplotlib 的 pyplot 模块,用于绘制图形。from matplotlib import pyplot as plt# 导入 pandas 库,用于数据处理和分析。import pandas as pd# 导入 seaborn 库,用于绘图import seaborn as sns
2025-04-01 18:00:16
5043
原创 matplotlib完整案例
Matplotlib 是 Python 中一个流行的绘图库,用于创建各种静态、动态和交互式的图表。本文将通过一系列完整的案例来教授如何使用 Matplotlib 进行数据可视化。
2025-03-25 16:34:16
5651
pandas销售数据分析
2025-07-11
脱发因素机器学习数据集
2025-05-30
基于文本的情感分析数据集 pos.txt 积极评论数据集 neg.txt 消极评论数据集
2025-04-15
finebi6.0 服务器版
2024-07-16
Javaweb Layui RBAC 项目 小金库
2022-06-13
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人