- 博客(7)
- 收藏
- 关注
原创 经典ID3算法
经典ID3算法1.背景知识: 决策树是对数据进行分类,以此达到预测的目的。该决策树方法先根据训练集数据形成决策树,如果该树不能对所有对象给出正确的分类,那么选择一些例外加入到训练集数据中,重复该过程一直到形成正确的决策集。决策树代表着决策集的树形结构。 决策树由决策结点、分支和叶子组成。决策树中最上面的结点为根结点,每个分支是一个新的决策结点,或者是树的叶子。每个决
2007-09-11 09:06:00
2043
原创 员工忠诚度分析
一、什么是员工忠诚度企业通过管理所形成的一种新的内部秩序。在这种新的秩序下,员工不仅能够认识到企业所面临的竞争性挑战,而且愿意承担迎接这种挑战的任务以换取相应的报酬,但是有一点是肯定的,即他们不会再一味地承诺对企业的忠诚终身不变了。二、为什么要进行员工忠诚度管理员工的忠诚是企业发展的基石,对于企业弥足珍贵。忠诚的员工必然在工作中释放他们的最大潜能,为企业创造更大的价值。是衡量企业管理好
2007-08-17 23:53:00
940
原创 聚类分析
聚类分析---谱科聚类分析一、基本思想及意义意义:聚类分析是研究分类问题的多元数据分析方法。聚类分析有极其广泛的应用背景。在经济学中,为了了解不同地区的城镇居民的收入及消费情况,往往需要划分不同的类型去研究;在产品质量管理中,要根据各产品的某些重要指标而将其分为一等品、二等品等;在生物学中,要根据各生物体的综合特征进行分类;又如在考古中,要将某些古生物化石进行科学的分类等等。
2007-08-07 20:17:00
2137
原创 离差
一、概念 数值型数据围绕其平均值分布的分数与集中程度,称为数据的离差或者变差。二、根据不同的度量可以定义不同的离差(或者变差) 最常用的有:全距、平均偏差、半内四分位数间距、10-90百分位数间距和标准差。 1)全距:一组数中的最大数与最小数和差。 2)平均偏差:N个数x1,x2,……,xn的平均偏差,简记为MD 3)半内四分位数间距:Q*=(Q3-Q1)/2
2007-08-05 00:13:00
1768
原创 四天oracle亚太地区体会
1、虽然这几天的气温是上海73年来的最高记录,但是一点也没有影响这次展会.2、感觉这次是oracle想展示自己,而且还把小的公司拉来提供赞助,同时还要把他们比下去。3、做软件,也要有品牌效应,对于纯数据挖掘的东西,未必是oracle的最好,但是像一些大的企业他们如果想用BI这块东西的话,他们一定会是首先oracle,当时发现国内的中海油还有外国的一些客户只去光顾oracle的展区,至少其
2007-08-03 23:31:00
658
原创 数据挖掘在零售行业中的应用
1、主要使用OLAP技术对商品销售和库存进行分析.>2、使用关联规则对销售单据(用户交易记录进行关联分析,既可以得到当地用户消费特性,也可以得到商品之间的关联性,进行捆绑销售、决定货架摆放等。3、使用聚类对客户进行细分,分析细分后的客户特征,进行针对性的销售和服务。4、可以对N条交易单据进行分析,求某两种商品之间的相关性,可能为正也可能为负。5、使用线性回归,对一些条件进行0-1量
2007-07-27 22:21:00
1667
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人