
数据挖掘课程笔记
文章平均质量分 55
垆边人似月v
“You,look as good as the day I met you”
展开
-
数据挖掘week8
推荐算法原创 2021-12-02 10:08:01 · 928 阅读 · 0 评论 -
数据挖掘week7
关联规则一.什么是关联规则关联规则是一种基于规则的机器学习方法,用于从数据集中寻找物品之间的隐含关系。可用来寻找购物篮数据之间的联系,方便进行交叉销售;可以进行文本挖掘;也可使用在其他领域比如生物信息学、医疗诊断、地球科学等,发现一些有趣的联系。二.关联规则的基本概率(1)关联分析(Association Analysis):在大规模数据集中寻找有趣的关系。(2)频繁项集(Frequent Item Sets):经常出现在一块的物品的集合,即包含0个或者多个项的集合称为项集。支持度(Suppo原创 2021-12-02 09:49:36 · 1484 阅读 · 0 评论 -
数据挖掘week6
聚类算法1、聚类概念聚类就是按照某个特定标准(如距离准则)把一个数据集分割成不同的类或簇,使得同一个簇内的数据对象的相似性尽可能大,同时不在同一个簇中的数据对象的差异性也尽可能地大。即聚类后同一类的数据尽可能聚集到一起,不同数据尽量分离。2、聚类和分类的区别聚类技术通常又被称为无监督学习,因为与监督学习不同,在聚类中那些表示数据类别的分类或者分组信息是没有的。Clustering (聚类),简单地说就是把相似的东西分到一组,聚类的时候,我们并不关心某一类是什么,我们需要实现的目标只是把相似的东西原创 2021-11-17 14:23:51 · 142 阅读 · 0 评论 -
数据挖掘week5
支持向量机什么是SVM,SVM产生的意义1.1什么是SVM?SVM(Support Vector Machine)译为支持向量机,又名最大间隔分类器。它不是一种机器,而是一种机器学习算法。它在解决小样本、非线性及高维模式识别中表现出许多特有的优势,并能够推广应用到函数拟合等其他机器学习问题中。支持向量机方法是建立在统计学理论的VC 维理论和结构风险最小原理基础上的,根据有限的样本信息在模型的复杂性和学习能力之间寻求最佳折中,以期获得最好...原创 2021-11-03 08:35:02 · 296 阅读 · 0 评论 -
数据挖掘week4
原创 2021-10-28 09:27:53 · 142 阅读 · 0 评论 -
数据挖掘week3
一.决策树二.贝叶斯分类贝叶斯分类算法是统计学的一种分类方法,它是一类利用概率统计知识进行分类的算法。在许多场合,朴素贝叶斯分类算法可以与决策树和神经网络分类算法相媲美,该算法能运用到大型数据库中,而且方法简单、分类准确率高、速度快。1.贝叶斯公式的推导(1)条件概率公式设A,B是两个事件,且P(B)>0,则在事件B发生的条件下,事件A发生的条件概率为:P(A|B)=P(AB)/P(B)(2)乘法公式由条件概率公式得:P(AB)=P(A|B)P(B)=P(B|A)P(A)上式即为原创 2021-10-09 11:39:13 · 320 阅读 · 0 评论 -
数据挖掘week1
Week 1 走进数据科学DRIP的全称是Data Rich Information Poor,中文全称为数据丰富的信息差,指的是现实生活中普遍存在的“数据充沛而信息不足”的问题,原因在于对原始数据没有进行必要的处理和分析,没有发挥出其应有的价值。数据挖掘是一门跨学科(interdisciplinary)的领域知识,英文又称Data Mining,它涉及了很多的领域,如机器学习,模式识别,人工智能等等。具体如下图所示。数据挖掘在社会生活中也有着十分广泛的应用,体现在各行各业,如下图所示。数据是一原创 2021-09-19 08:47:45 · 362 阅读 · 0 评论