
Data Mining
文章平均质量分 61
丑大狗
不想成为
数据科学家
的DBA
不是好开发
展开
-
什么是数据挖掘?
什么是数据挖掘?数据挖掘通过对大量的数据进行搜索来发现模式和趋势,超越了单纯分析的做法。数据挖掘使用复杂的数学算法来分割数据,并评估未来事件的概率,数据挖掘也被称为KDD( Knowledge Discovery in Data)数据挖掘的主要特性为:1、自动发现模式2、预测可能的结果3、创建可操作的信息4、专注于大型数据集和数据库数据挖掘可以用来解决那些无法使用简单查翻译 2015-03-18 14:09:16 · 1003 阅读 · 0 评论 -
数据挖掘编程语言选择(Python与R的PK)
数据挖掘技术日趋成熟和复杂,随着互联网发展以及大批海量数据的到来,之前传统的依靠spss、SAS等可视化工具实现数据挖掘建模已经越来越不能满足日常需求,依据美国对数据科学家(datascientist)的要求,想成为一名真正的数据科学家,编程实现算法以及编程实现建模已经是必要条件;目前很多从事数据挖掘工作的人,大多都是出身非计算机专业,本身对编程基础比较低,所以找到一门快速上手而又高效的编程语言是转载 2016-08-04 16:08:56 · 3377 阅读 · 0 评论 -
IBM SPSS modeler 17 无限使用
1. 删除C:\Users\All Users\SafeNet Sentinel\Sentinel RMS Development Kit\System下的所有文件;2. 用管理员身份运行D:\Program Files\IBM\SPSS\Modeler\17\bin\licenseinit.exe,提示输入Base product feature code:和Version (wit原创 2015-10-13 20:32:39 · 4832 阅读 · 2 评论 -
数据挖掘的一个例子
干货来啦~数据库版本:oracle database 11.2.0.1.0sqldeveloper版本:3.0例子的目标是预测SH用户下customer拥有信用卡的概率首先你要有一个建立一个用于data mining的用户,然后通过sqldeveloper图形界面创建data mining资料库资料库建好之后准备工作也就基本完成了(别跟我说没装oracle da原创 2015-03-23 21:53:21 · 1789 阅读 · 0 评论 -
数据挖掘函数之回归(regression)
数据挖掘函数之回归(regression)回归是一种用来预测连续数值的数据挖掘函数。利润,销售,抵押贷款利率,房价,面积,温度,距离都可以使用这种回归函数来预测。例如,一个回归模型基于地理位置,房间数,面积大小和其他一些因素来预测房价。一个回归任务开始于一个目标值已知的数据集。例如,一个预测房价的模型基于一段时间内很多房子的数据开发出来。除了一些简单的数值,房价可能会跟房子的年龄,面积,房原创 2015-03-21 21:24:27 · 4211 阅读 · 0 评论 -
Oracle Data Mining PL/SQL API
Oracle数据挖掘PL/SQL API由以下的PL/SQL包实现:包名称功能描述DBMS_DATA_MINING构建,测试,应用数据挖掘模型DBMS_DATA_MINING_TRANSFORM 在构建应用数据模型之前对数据集进行转换。你可以使用这些程序对数据进行转换,或者也可以使用一些基于SQL的程序来实现转换注意:用户定义的转换原创 2015-03-21 14:28:30 · 1770 阅读 · 0 评论 -
如何进行ORACLE数据挖掘 ?
如何使用oracle data mining ? Oracle data mining 提供了PL/SQL, SQL, R 的编程接口。(PL/SQL API和SQL API后面将进行详细介绍)PMML标准的模型可以导入到oracle数据库中进行模型的评分。Oracle data miner图形化用户界面提供了oracle data mining的数据库内部功能的全方位访问能力。使原创 2015-03-21 13:54:56 · 3303 阅读 · 0 评论 -
数据挖掘常用函数简介
Oracle数据挖掘函数有监督的Oracle数据挖掘函数函数描述属性重要性找出用来预测目标的一组属性中最重要的属性。分类将各个事项分为若干类,然后预测这些事项属于哪个类中回归不断的近似预测出连续的值无监督的Oracle数据挖掘函数函数描述异常检测原创 2015-03-21 11:18:17 · 1027 阅读 · 0 评论 -
数据挖掘常用算法简介
数据挖掘常用算法简介有监督的数据挖掘算法算法功能描述Decision Tree (DT) 决策树分类决策树以人类语言可读懂的信息提供预测结果,规则是if-then-else表达式,他们会解释导致了预测结果的决定。Generalized Linear Models (GLM) 广义线性模型分类和回归GLM为二进制目标原创 2015-03-21 11:34:29 · 1391 阅读 · 0 评论 -
有监督的数据挖掘
有监督的数据挖掘 监督学习也被称为指导学习。我们使用一个先前已知的属性或者目标来指导学习过程。定向的数据挖掘试图着去将目标的行为解释为一组拥有独立属性、可进行预测的函数。监督学习在预测模型中产生结果。相对无监督的学习这种方式的目标是模式的匹配。建立有监督的模型需要包含训练,就是一个用软件分析目标值已经得知的事件。例如,如果一个模型试图寻找出客户群体中更可能对一次促销原创 2015-03-20 15:12:10 · 2064 阅读 · 0 评论 -
ODM(Oracle data mining)的简介
在数据库内部进行数据挖掘Oracle数据库内部提供了理解力强,高水平的数据挖掘功能。ODM在数据库内核中得到实现,而且数据挖掘模型就是一种数据库的对象。ODM过程使用oracle数据库的内置功能,以求最大化的可拓展性和系统资源的使用效率。 Oracle中的数据挖掘提供了很多优势 没有数据的迁移。一些数据挖掘项目需要将数据从企业数据库中导出来,而且为了达到挖掘原创 2015-03-20 14:45:00 · 4494 阅读 · 0 评论 -
数据挖掘可以做什么不可以做什么?
数据挖掘可以做什么不可以做什么? 数据挖掘是一个强大的工具,可以帮助你找到数据中的模式和关系。但是数据挖掘自己本身不会工作,它还是需要了解你的业务、你的数据和懂得一些分析方法。数据挖掘可以发现数据中的一些隐藏的信息,但是它无法告诉你所在的企业这些数据的价值。通过你自己一段时间的工作,你可能已经意识到了一些重要的模式。数据挖掘不仅可以证实这些经验性的结论,而且可以发现一些凭简单观察无法辨识出原创 2015-03-18 21:48:20 · 2807 阅读 · 0 评论 -
数据挖掘的流程
数据挖掘的流程如图所示,当一个特定的解决方案部署后数据挖掘工程并没有停止。数据挖掘的结果触发新的业务问题,反过来又可以用来开发更具针对性的模型。 问题定义数据挖掘的最初阶段将问题集中于理解项目的目标和要求。一但你从业务角度指定了项目,你就可以将他形成一个数据挖掘问题并制定初步实施方案。 例如,你的业务问题可能是“我如何才能向客户出售更多我的这个产品”,你应该先将这个问题转化为数原创 2015-03-19 14:11:02 · 1304 阅读 · 0 评论 -
常见数学符号
大写 小写 英文注音 国际音标注音 中文注音 Α α alpha alfa 阿耳法 Β β beta beta 贝塔 Γ γ gamma gamma 伽马 Δ δ deta delta 德耳塔 Ε ε epsilon epsilon 艾普西隆 Ζ ζ zeta zeta 截塔 Η η eta eta 艾塔 Θ θ theta θita 西塔 Ι原创 2017-08-06 15:21:24 · 3232 阅读 · 0 评论