数据挖掘与机器学习
文章平均质量分 88
all kinds
反方向的钟儿
站在能分割时间的桥
展开
专栏收录文章
- 默认排序
- 最新发布
- 最早发布
- 最多阅读
- 最少阅读
-
数据挖掘与机器学习(part 10)推荐算法Recommendation Algorithm & 隐语义模型(LFM)& 协同过滤算法 & SVD
假设:用户兴趣的连贯性(用户未来喜欢的东西,与过去喜欢的东西是相似的优点:直观,可解释;缺点:覆盖率、多样性、新颖度、惊喜度均不高协同过滤推荐(Collaborative Filtering)优点:简单,预测准确度高;缺点:对数据稀疏性非常敏感对策:矩阵分解技术(降维)原创 2024-12-17 00:04:26 · 2698 阅读 · 0 评论 -
数据挖掘与机器学习DM&ML(part 8)K近邻(KNN)
KNN 概念简单,却能解决复杂问题能在信息相对较少的情况下工作学习简单(根本无需学习!内存和 CPU 成本-特征选择问题对表示敏感受维度诅咒的困扰。原创 2024-12-13 22:51:37 · 1145 阅读 · 1 评论 -
数据挖掘与机器学习DM&ML(part 8)聚类分析Clustering&K-Means
密度式--基于密度概念;网格式--基于多级网格结构;模型式--为每个聚类假设一个模型,其目的是找到最适合彼此的模型原创 2024-12-12 17:55:53 · 941 阅读 · 0 评论 -
数据挖掘与机器学习(DM&ML)(part 7 ANN 人工神经网络)
拟合 ANN 的问题--数据准备预处理步骤-将变量刻度为 0-1-分类变量-如果类别相等,则映射到 0-1 范围内的等距区间点-否则,创建虚拟变量-转换(如对数)倾斜变量原创 2024-12-10 22:37:03 · 2013 阅读 · 0 评论 -
数据挖掘与机器学习(DM&ML)(part 5)(支持向量机)
支持向量机原创 2024-10-22 14:14:22 · 1208 阅读 · 0 评论 -
数据挖掘与机器学习(DM&ML)(PART3) (DATA)
给定一个有序或连续属性\(x\)以及一个介于 0 到 100 之间的数字p,第p百分位数是一个x的值,使得x的观测值中有p%小于这个值。如果数据集中存在异常值,箱线图中的 whiskers(箱线图的上下须)会相应地变长,并且可能会有一些数据点超出 whiskers 的范围。丢失数据、噪声数据、重复数据(不一定都不好有时是人为设置):可以在数据输入阶段进行数据验证,确保输入的数据是唯一的。p.s. 数据挖掘的操作过程步骤会有很多经验性的,关于数据智能与人的交互。一个属性的众数是出现最频繁的属性值。原创 2024-09-26 13:57:26 · 877 阅读 · 0 评论 -
数据挖掘与机器学习(DM&ML)(PART 1)
1956 dartmounth conference------2007 DBN(深度信念网络) (hinton et ai 2007) -----2016 XGboost ResNet ------ (以前是模型表征)2017 Attention/Transforms。将底层的分布式信息在前端按需求调用出来(赋用) -------仪表盘展示。早期商业智能与分析:使用硬数据,统计模型进行客户画像---------发展成使用软数据(非结构化数据)、深度学习、可视化、AIGC。原创 2024-09-21 15:09:02 · 672 阅读 · 0 评论 -
数据挖掘与机器学习(DM&ML)(PART2)
的定义: 给定一组数据点,每个数据点都有一组属性,以及它们之间的一种相似性度量,找到聚类使得: 一个聚类中的数据点彼此之间更加相似。•其他特定问题的度量。找到相似客户的聚类-----------------------------------------------------------------------------------------------------------------------------------通过观察同一聚类中的客户与不同聚类中的客户的购买模式来衡量聚类质量。原创 2024-09-24 14:59:43 · 908 阅读 · 0 评论
分享