
数据挖掘
齐风
认真做好当下
展开
-
数据挖掘
数据挖掘是利用多种计算机技术,从数据中自动分析并提取信息的处理过程,目的是发现数据中潜在的和有价值的信息、知识、规律、联系、模式,从而为解释当前行为和预测未来结果提供支持。数据挖掘技术:机器学习、统计学、联机分析、专家系统、模式识别,涉及数据库技术、人工智能、统计学方法、可视化技术、并行计算数据挖掘围绕商业目标,对大量数据进行抽取、转换、分析和处理,提取出辅助商业决策的关键性数据,解释隐藏的或...翻译 2018-10-01 16:22:33 · 249 阅读 · 0 评论 -
机器学习
机器学习是模拟人类的学习方法来解决计算机获取知识问题的方法。通过对大量的实例进行训练、从中发现经验化规律的过程。机器最擅长的是学习概念,概念是具有某些共同特征的对象,符号或事件的集合。可分为传统角度、概率角度、样本角度。传统角度:概念被非常明确的定义,无歧义。概率角度:没有明确的定义,提供了一个判断的参考。样本角度:将某个概念组成一个集合,将新实例与该集合进行比对,得出结果。机器学习分为...翻译 2018-10-01 21:30:00 · 454 阅读 · 0 评论 -
Weka
相关会议:ACM SIGKDD国际会议Weka,基于Java,开源,集成了大量有关数据挖掘的机器学习算法和统计技术,具有数据预处理、分类、聚类、关联分析、属性选择和交互式可视化等功能。Weka还有一个通用的API,可以像嵌入其他库一样将Weka嵌入应用程序以实现诸如服务器端自动进行数据挖掘。Weka的github地址https://github.com/Waikato/weka-trunk...原创 2018-10-01 23:03:17 · 1097 阅读 · 0 评论 -
决策树
摘自《数据挖掘与数据化运营实战,思路、方法、技巧与应用》决策树:建模过程类似一颗树的成长过程,即从根部开始,到树干、到分枝,再到细枝末节的分叉,最终生长出一片片的树叶。在决策树里,所分析的数据样本先是集成为一个树根,然后经过层层分支,最终形成若干个结点,每个节点代表一个结论。最常用的3中决策树算法分别是CHAID、CART和ID3。CHAID:卡方自动相互关系检测,依据局部最优原则、利用卡方检...转载 2018-10-06 19:19:14 · 314 阅读 · 0 评论 -
数据挖掘技术
摘自《数据挖掘与数据化运营实战,思路、方法、技巧与应用》神经网络:通过输入多个非线性模型以及不同模型之间的加权互联(加权的过程在隐蔽层完成),最终得到一个输出模型。其中,隐蔽层所包含的就是非线性函数。神经网络作为分类、预测问题的重要技术支持、在用户划分、行为预测、营销响应等诸多方面具有广泛的应用前景。以下5个因素对模型结果有重大影响:1、层数2、每层输入变量的数量3、联系的种类4、联系...转载 2018-10-06 20:19:23 · 392 阅读 · 0 评论