
信息检索与数据挖掘
SmarTongs
这个作者很懒,什么都没留下…
展开
专栏收录文章
- 默认排序
- 最新发布
- 最早发布
- 最多阅读
- 最少阅读
-
2021-10-12《数据挖掘-实用机器学习工具与技术》—— 学习笔记 第四章 算法: 基本方法
第四章 算法: 基本方法八种不同的数据集形式:1、只有一种属性承担了所有工作,其他属性都是无关或冗余属性;2、所有属性是独立地,均等地对最终结果做出贡献;3、拥有一个包含多个属性的简单逻辑结构,可由决策树得到;4、存在一些独立的规则,将实例划分到不同的类5、不同属性子集具有依赖性6、不同数值属性间有线性依赖关系,权值问题7、归类到实例空间具体区域,受控于实例间的距离8、没有提供类别标签,无监督学习4.1 推断基本规则1规则(1-rule,1 R)选择单个属性作为决策依据,并且选择其中原创 2021-10-12 22:10:24 · 310 阅读 · 0 评论 -
2021-10-12 《数据挖掘-实用机器学习工具与技术》—— 学习笔记 第三章 输出: 知识表达
第三章 输出: 知识表达3.1 表 (决策表)3.2 线性模型回归:预测数值型变化的过程可用来回归预测,也可用来分类。(高维空间是超平面)3.3 树在叶子节点上包含平均数值型值得决策树称为回归树3.4 规则分类规则将规则转换成决策树时,关联规则包含例外的规则从逻辑上,基于例外的规则可以简单地用if…then…else语句改写。表达能力更强的规则归纳逻辑编程 inductive logic programming3.5 基于实例的表达(instan原创 2021-10-12 22:02:48 · 212 阅读 · 0 评论 -
2021-10-12 数据挖掘-实用机器学习工具与技术》—— 学习笔记 第二章 输入:概念、实例和属性
第二章 输入:概念、实例和属性机器学习的输入采用概念、实例、和属性的形式2.1 概念四种不同的学习方式分类学习:用一个已分类的样本集表示学习方案,学习对未来样本分类的方法;关联学习:寻找任何特性之间的关联,不仅仅预测类值;聚类:聚合相似性的分组数值预测:预测出的结论不是离散值而是数值量2.2 样本每一个数据都可以表示成实例与属性的矩阵,单一关系(数据库)、平面文件;数据收集:数据必须集中、整合和清理,大型数据整合的思想称为数据仓库。提供访问成组数据的接口。ARFF原创 2021-10-12 21:59:45 · 174 阅读 · 0 评论 -
《数据挖掘-实用机器学习工具与技术》学习笔记 第一章 绪论
第一章 绪论数据挖掘被定义为找出数据中的模式的过程,过程为自动或半自动,数据量客观,发现的模式使有意义的,并能产生效益。学习:事物以令其在将来表现更好为标准来改变其行为。在学习中,目的是学习者的目的,在训练中,目的是老师的目的。数值属性问题: 对数值属性建立不等式;混合属性问题: 属性类型不止一种简单例子: 天气问题、隐形眼镜、鸢尾花类型预测、CPU性能:介绍数值预测、劳资协商好坏预测、大豆疾病分类预测。应用领域: Web挖掘、包含评判的决策、图像筛选、负载预测、诊断、市场和销售(购物篮分析)。原创 2021-10-12 21:56:29 · 241 阅读 · 0 评论 -
SDU信息检索考试复习
对着ppt手写了一份精简版文章目录1. 大纲2. 索引构建3. 排名检索和评价指标4. 语言模型5. Link Analysis6. Machine Learning7. Clustering 、Hierarchical Clustering、DBSCAN8. Topic Model、LDA、PLSA、MCMC1. 大纲2. 索引构建3. 排名检索和评价指标4. 语言模型5. Link Analysis6. Machine Learning7. Clustering 、Hiera原创 2021-01-04 22:54:09 · 293 阅读 · 0 评论