- 博客(5)
- 资源 (21)
- 收藏
- 关注
转载 Hive基础之Hive是什么以及Hive使用场景
Hive是什么1)Hive 是建立在Hadoop (HDFS/MR)上的用于管理和查询结果化/非结构化的数据仓库;2)一种可以存储、查询和分析存储在Hadoop 中的大规模数据的机制;3)Hive 定义了简单的类SQL 查询语言,称为HQL,它允许熟悉SQL 的用户查询数据;4)允许用Java开发自定义的函数UDF来处理内置无法完成的复杂的分析工作;5)Hive没有
2014-08-10 23:18:17
2291
转载 数据挖掘的数据集资源
1、气候监测数据集 http://cdiac.ornl.gov/ftp/ndp026b2、几个实用的测试数据集下载的网站http://www.cs.toronto.edu/~roweis/data.htmlhttp://www.cs.toronto.edu/~roweis/data.htmlhttp://kdd.ics.uci.edu/summary.task.type.htm
2014-04-18 10:45:41
1038
转载 26种数据挖掘软件比较及介绍
1、数据挖掘软件之ANGOSS软件公司KnowledgeSTUDIO平台:NT , Windows 9X功能:CHAID算法,支持PMML,留有与SAS、S-Plus的接口,能够灵活地导入外部模型和产生规则,包含神经网络建模的能力优点:响应快,模型、文档易于理解,决策树分析直观/性能良好,SDK中容易加入新的算法缺点:决策树不能编辑打印,SDK缺乏数据预处理阶段的函数,没有示例
2014-04-18 09:27:06
14922
1
转载 浅析十三种常用的数据挖掘的技术&五个免费开源的数据挖掘软件
一、前 沿 数据挖掘就是从大量的、不完全的、有噪声的、模糊的、随机的数据中,提取隐含在其中的、人们事先不知道的但又是潜在有用的信息和知识的过程。数据挖掘的任务是从数据集中发现模式,可以发现的模式有很多种,按功能可以分为两大类:预测性(Predictive)模式和描述性(Descriptive)模式。在应用中往往根据模式的实际作用细分为以下几种:分类,估值,预测,相关性分析,序列,时间序列,
2014-04-18 08:55:07
1878
转载 开源数据挖掘工具Orange简介
开源数据挖掘工具Orange简介 02 January 2014 Orange是一款底层基于C++,并且提供了Python接口的开源数据挖掘工具。与Sklearn,pyml这 类数据挖掘包相比,Orange的历史更加悠久,在上面实现的算法也更加丰富,此外,除了以python模块的形式使用之外,Orange还提供了GUI,可以用通过预先 定义好的多种模块组成工作流来完成复杂的数据
2014-04-18 08:46:59
13856
2
PYTHON自然语言处理【最新中文版,高清】.pdf
2017-10-15
模式识别(张学工)第三版.pdf
2017-04-25
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人