
数据挖掘
文章平均质量分 66
夜空骑士
我是一名数据玩家,对数据行业的知识有着极大的学习热情,在数据分析、数据挖掘、大数据、人工智能等多个方面均有所涉猎,致力于将数据技术应用于各个行业领域,不断提升自我、完善自我、充实自我,并与数据爱好者共同分享、共同进步、共同成长!数据之路,前路漫漫,你我同在,互动前行!
展开
-
商务智能
商务智能指利用数据仓库、数据挖掘技术对客户数据进行系统地储存和管理,并通过各种数据统计分析工具对客户数据进行分析,提供各种分析报告,如客户价值评价、客户满意度评价、服务质量评价、营销效果评价、未来市场需求等,为企业的各种经营活动提供决策信息。 “商务智能是企业利用现代信息技术收集、管理和分析结构化和非结构化的商务数据和信息,创造和累计商务知识和见解,改善商务决策水平,采取有效的商务行动,完善各转载 2013-12-19 12:37:33 · 1508 阅读 · 0 评论 -
机器学习经典书籍介绍
机器学习经典书籍小结博客第一篇文章[1]是转载的,也算是开始写博客不经意的表露了自己对机器学习的兴趣吧!那篇文章总结了机器学习的一些经典算法的论文与数学基础理论的一些书籍,对于开始学习机器学习的话恐怕太过深入,正好最近在买书,看了很多经典书籍的总结与评论,我再拾人牙慧,稍稍总结一下吧。先说一下我看过的和正在看的一些书吧!《数学之美》;作者吴军大家都很熟悉。这本书主要的作用是转载 2014-09-15 10:14:06 · 1368 阅读 · 0 评论 -
数据挖掘的方法有哪些?
利用数据挖掘进行数据分析常用的方法主要有分类、回归分析、聚类、关联规则、特征、变化和偏差分析、Web页挖掘等,它们分别从不同的角度对数据进行挖掘。1、分类分类是找出数据库中一组数据对象的共同特点并按照分类模式将其划分为不同的类,其目的是通过分类模型,将数据库中的数据项映射到某个给定的类别。它可以应用到客户的分类、客户的属性和特征分析、客户满意度分析、客户的购买趋势预测等,如一个汽车转载 2015-05-17 11:46:34 · 1307 阅读 · 0 评论 -
数据挖掘十大经典算法
国际权威的学术组织the IEEE International Conference on Data Mining (ICDM) 2006年12月评选出了数据挖掘领域的十大经典算法:C4.5, k-Means, SVM, Apriori, EM, PageRank, AdaBoost, kNN, Naive Bayes, and CART. 不仅仅是选中的十大算法,其实参加评选的18种算法原创 2015-05-18 16:59:01 · 844 阅读 · 0 评论 -
【机器学习】机器学习算法总结
找工作时(IT行业),除了常见的软件开发以外,机器学习岗位也可以当作是一个选择,不少计算机方向的研究生都会接触这个,如果你的研究方向是机器学习/数据挖掘之类,且又对其非常感兴趣的话,可以考虑考虑该岗位,毕竟在机器智能没达到人类水平之前,机器学习可以作为一种重要手段,而随着科技的不断发展,相信这方面的人才需求也会越来越大。 纵观IT行业的招聘岗位,机器学习之类的岗位还是挺少的,转载 2015-11-12 09:39:16 · 1527 阅读 · 1 评论 -
数据挖掘训练题
数据挖掘练习题,单选、多选和判断题三种类型!原创 2015-12-15 09:28:03 · 6217 阅读 · 0 评论 -
数据挖掘十大经典算法(详解)
数据挖掘十大经典算法转载 2016-01-18 15:32:57 · 3058 阅读 · 0 评论 -
数据挖掘工程师是做什么的?
数据挖掘,从字面上理解,就是在数据中找到有用的东西,哪些东西有用就要看具体的业务目标了。最简单的就是统计应用了,比如电商数据,如淘宝统计过哪个省购买泳衣最多、哪个省的女生胸罩最大等,进一步,可以基于用户的浏览、点击、收藏、购买等行为推断用户的年龄、性别、购买能力、爱好等能表示一个人的画像,就相当于用这些挖掘出来的属性来刻画一个人,这些还是最简单的东西,更深层次的比如预测(股票预测),但是比较难。原创 2016-08-09 10:04:09 · 6316 阅读 · 4 评论 -
数据分析师,数据挖掘工程师和数据研发工程师有什么区别?
数据分析师:基于业务,通过数据分析手段发现和分析业务问题,为决策作支持。数据挖掘工程师:偏技术,通过建立模型、算法、预测等提供一些通用的解决方案,当然也有针对某业务的。数据研发工程师:一般也叫数据开发,搭建仓库搭建、数据的存储、处理、计算处理、报表开发等。原创 2016-08-09 10:40:22 · 13372 阅读 · 0 评论 -
利用 Python学习数据挖掘【1】
覆盖使用Python进行数据挖掘查找和描述数据结构模式的实践工具。第一节介绍数据挖掘是一个隐式提取以前未知的潜在有用的数据信息提取方式。它使用广泛,并且是众多应用的技术基础。本文介绍那些使用Python数据挖掘实践用于发现和描述结构模式数据的工具。近些年来,Python在开发以数据为中心的应用中被用的越来越多。感谢大型科学计算社区的支持以及大大丰富的数据分析函数库。尤其是,我们可以...转载 2018-10-12 14:42:30 · 754 阅读 · 0 评论 -
利用Python学习数据挖掘【2】
本文结合代码实例待你上手python数据挖掘和机器学习技术。 本文包含了五个知识点:1. 数据挖掘与机器学习技术简介 2. Python数据预处理实战 3. 常见分类算法介绍 4. 对鸢尾花进行分类案例实战 5. 分类算法的选择思路与技巧 一、数据挖掘与机器学习技术简介 什么是数据挖掘?数据挖掘指的是对现有的一些数据进行相应的处理和分析,最终...转载 2018-10-12 14:44:43 · 924 阅读 · 0 评论 -
CRM客户细分的价值
随着互联网络的迅猛发展,市场的不断成熟,世界经济进入了电子商务时代,产品和服务的差异越来越小。以生产为中心、以销售产品为目的的市场战略逐渐被以客户为中心、以服务为目的的市场战略所取代。谁能掌握客户的需求趋势,加强与客户的关系,有效发掘和管理客户资源,谁就能获得市场竞争的优势,在激烈的竞争中立于不败之地。以“客户为中心”的客户关系管理(Customer Relationship Manageme转载 2014-07-04 14:05:02 · 1925 阅读 · 0 评论 -
weka –Apriori算法 关联规则挖掘实验
一、Apriori算法参数含义本次共进行了9组实验,使用了weka安装目录data文件夹下的contact-lenses.arff数据。 ToolsàArffViewer,打开contact-lenses,可以看到实验数据contact-lenses共有24条记录,5个属性值。具体内容如下: 结合实验结果阐释下列12个参数的含义1. car 如转载 2014-06-05 20:54:01 · 4989 阅读 · 0 评论 -
你不了解的数据:大数据信息与数据
全球 微软合作伙伴在大数据上的潜力将达到每年600亿美元。 目前大部分的企业所分析的数据量一般以TB为单位。按照目前数据的发展速度,很快将会进入PB时代。特别是目前在100-500TB和500+TB范围的分析数据集的数量会呈3倍或4倍增长。 2012年7月到9月一项来自欧洲针对184名IT和业务专业(数据)人士所作的调查报告显示,企业在数据管理和BI方面愿意投入更多的资金。5转载 2014-02-12 11:50:54 · 1463 阅读 · 0 评论 -
OLAP联机分析处理介绍
作用 联机分析处理是共享多维信息的、针对特定问题的联机数据访问和分析的快速软件技术。它通过对信息的多种可能的观察形式进行快速、稳定一致和交互性的存取,允许管理决策人员对数据进行深入观察。决策数据是多维数据,多维数据就是决策的主要内容。OLAP专门设计用于支持复杂的分析操作,侧重对决策人员和高层管理人员的决策支持,可以根据分析人员的要求快速、灵活地进行大数据量的复杂查询处理,并且以一种直观转载 2013-12-19 12:40:23 · 2763 阅读 · 0 评论 -
数据挖掘工程师发展方向浅谈
数据挖掘在国外很好 在国内,还处于起步阶段,真正的数据挖掘运用还比较少,找工作也不是很容易,学这个方向的,基本上出来是做数据处理、数据分析,或是有些干脆做软件开发师。 不过有兴趣的话,这也是不错的方向,毕竟,再过上十来年,应该都能发展得起来的。应该说现状艰辛,但前途还是光明的。 如果找数据挖掘的工作,地点也很重要,国内发展比较好的城市是北京和上海,广东也有少数。一般来说,比较大型的企才有投原创 2013-12-19 12:21:56 · 2648 阅读 · 0 评论 -
数据挖掘技术
数据挖掘是从大量的、不完全的、有噪声的数据中提取隐含在其中的、人们事先不知道的、但又是潜在有用的信息和知识的过程。1. 引言 数据挖掘(data mining)是从大量的、不完全的、有噪声的、模糊的、随机的数据中提取隐含在其中的、人们事先不知道的、但又是潜在有用的信息和知识的过程。随着信息技术的高速发展,人们积累的数据量急剧增长,动辄以tb计,如何从海量的数据中提取有用的知识转载 2013-12-19 12:27:05 · 1555 阅读 · 0 评论 -
2013百度校园招聘数据挖掘工程师
百度2012校园招聘机器学习/数据挖掘工程师(北京)笔试题目 2011.10.16 一.简单题 1. C++中STL vector 相关 (1).push_back函数的内存分配是怎样的? (2).clear函数的内存分配是如何实现的? 2转载 2014-01-03 19:18:18 · 1604 阅读 · 0 评论 -
2013网易实习生数据挖掘工程师
2013网易实习生招聘 岗位:数据挖掘工程师 一、问答题 a) 欠拟合和过拟合的原因分别有哪些?如何避免? b) 决策树的父节点和子节点的熵的大小?请解释原因。 c) 衡量分类算法的准确率,召回率,F1值。 d) 举例序列模式挖掘算法有哪些?以及他们的应用场景。 二、计算题 1) 给你一组向量a,b a) 计算二者欧氏距离 b) 计算二者曼哈顿距离 2) 给转载 2014-01-03 19:26:22 · 1193 阅读 · 0 评论 -
数据挖掘apriori算法Java代码实现
[java] view plaincopyprint?package apriori; import java.util.*; import java.io.*; public class Aprioti { public static int K_Item=3;//产生的频繁项集数,但其实在我这里不是真正的项集数,只转载 2014-01-04 12:08:00 · 1670 阅读 · 0 评论 -
数据挖掘中分类算法小结
数据挖掘中分类算法小结数据仓库,数据库或者其它信息库中隐藏着许多可以为商业、科研等活动的决策提供所需要的知识。分类与预测是两种数据分析形式,它们可以用来抽取能够描述重要数据集合或预测未来数据趋势的模型。分类方法(Classification)用于预测数据对象的离散类别(Categorical Label);预测方法(Prediction )用于预测数据对象的连续取值。分转载 2014-01-03 21:19:16 · 1171 阅读 · 0 评论 -
百度数据挖掘工程师实习生笔试面试题
笔试题:一、简答题30分1. extern”C”{}的作用好应用场景;2.写出两者你熟悉的设计模式,及应用场景,可以给出伪代码;3.TCP中time_wait是表示那种状态,及应用场景,以及起好处和坏处;二、算法题40分1. 有一个任务执行机,任务数N但是任务之间没有循环依赖,请给出适当的任务执行顺序。算法、伪代码,并分析其时间复杂度和空间复杂度。2.转载 2014-01-03 17:32:19 · 3036 阅读 · 0 评论 -
机器学习与数据挖掘基本算法初步介绍
随着互联网技术的发展,特别是web2.0时代的到来,互联网为我们提供了丰富的数据来源,如何充分的利用这些数据,挖掘用户信息,是下一代互联网急需解决的问题。机器学习和数据挖掘主要是解决以下几个方面的问题,分类与预测,优化,独立特征提取等。机器学习的很多算法都是基于以下图1中模型来进行设计。 图1 学习系统模型我们应对外界环境的刺激输入,在实践的过程中不转载 2014-01-03 21:29:59 · 3176 阅读 · 0 评论 -
weka学习入门笔记
目录 1. 简介2. 数据格式3. 数据获取与预处理3. 关联规则(购物篮分析)4. 分类与回归5. 聚类分析1. 简介 WEKA的全名是怀卡托智能分析环境(Waikato Environment for Knowledge Analysis),它的源代码可通过http://www.cs.waikato.ac.nz/ml/weka 得到。同时weka也是转载 2014-01-09 22:03:39 · 1369 阅读 · 0 评论 -
spss中文视频教程下载
看到有关SPSS的视频教程,看了一下还挺流畅的,有操作演示、也有讲解,还是不错的(是MM在讲,还有背景音乐,学着也不累),特发在这里与与大家共享,愿学习愉快、天天进步!IE视频文件播放示范:http://ishare.iask.sina.com.cn/cgi-bin/fileid.cgi?fileid=4396004本地播放软件下载:http://ishare.iask.sina.转载 2014-01-20 23:01:36 · 2807 阅读 · 0 评论 -
利用Python学习数据挖掘【0】
相信看到这篇文章的你一定是对数据分析,数据挖掘有兴趣,或者想从事和方面。本文不再累述python对数据分析的重要,数据分析这门的由来之类的。在这里,我单刀直入,已我学习数据挖掘3年来的经历告诉大家怎么去学,以让大家少走弯路。纯个人见解,如有不对,还请各位留言指教。话不多说,直接放图。一 学好工具python语言推荐看廖雪峰的python3教程。数据分析python基础...转载 2018-10-12 14:50:56 · 421 阅读 · 0 评论