
时空大数据挖掘
文章平均质量分 80
经纬方略
工业互联,智能制造
展开
-
Hadoop的伪分布式与分布式环境配置
Hadoop【亲自测试没问题 于是分享给初学者】 1、Hadoop简介1、hadoop的诞生Nutch和Lucene之父Doug Cutting在2006年完成Hadoop项目。Hadoop并不是一个单词,它来源于DougCutting小儿子对所玩的小象玩具牙牙学语的称呼。就像是google也是由小孩子命名一样。后又经过5年的开发,hadoop在所有云计算系统是稳居第一。原创 2014-03-27 22:59:44 · 1320 阅读 · 0 评论 -
Hadoop中map/reduce之WordCount实例——分解vs汇总
间Hadoop中map/reduce之WordCount实例——分解vs汇总一般的hadoop的编写,主要是编写Map和Reduce函数,也就是所谓的Map分解,Reduce汇总的过程,WordCount就是其典型。3、程序示例及注释 package test;import java.io.IOException;import jav原创 2014-03-27 22:43:49 · 1375 阅读 · 0 评论 -
R树空间索引
R树在数据库等领域做出的功绩是非常显著的。它很好的解决了在高维空间搜索等问题。举个R树在现实领域中能够解决的例子吧:查找20英里以内所有的餐厅。如果没有R树你会怎么解决?一般情况下我们会把餐厅的坐标(x,y)分为两个字段存放在数据库中,一个字段记录经度,另一个字段记录纬度。这样的话我们就需要遍历所有的餐厅获取其位置信息,然后计算是否满足要求。如果一个地区有100家餐厅的话,我们就要进行100次位置原创 2014-04-09 21:52:17 · 1363 阅读 · 1 评论 -
大数据分析工具简介
6个用于大数据分析的最好工具目录(?)[-]一Hadoop二HPCC三Storm四Apache Drill五RapidMiner六 Pentaho BI大数据是一个含义广泛的术语,是指数据集,如此庞大而复杂的,他们需要专门设计的硬件和软件工具进行处理。该数据集通常是万亿或EB的大小。这些数据集收集自各种各样的来源:传感器,气候信息,公开的信息原创 2014-12-10 19:15:00 · 1470 阅读 · 0 评论 -
机器学习中的范数规则化
机器学习中的范数规则化之(一)L0、L1与L2范数zouxy09@qq.comhttp://blog.youkuaiyun.com/zouxy09 今天我们聊聊机器学习中出现的非常频繁的问题:过拟合与规则化。我们先简单的来理解下常用的L0、L1、L2和核范数规则化。最后聊下规则化项参数的选择问题。这里因为篇幅比较庞大,为了不吓到大家,我将这个五个部分分成两篇博文。原创 2014-12-10 19:29:39 · 1554 阅读 · 0 评论 -
空间数据挖掘常用方法
问题1:空间数据挖掘有哪些常用方法,举例说明一种方法的原理及应用.答:空间数据挖掘的常用方法有:统计法,聚类方法,关联规则发掘方法,Rough集方法,神经网络方法,云理论,证据理论,模糊集理论,遗传算法等算法(出自丁信宙,仇环,苏晓庆. 基于云理论的缺损数据推理和预测 山东理工大学学报 2006年11月)。除此以外还有老师课件上提到的聚类检测,决策树方法等。 以下对于一原创 2014-12-10 21:55:45 · 13404 阅读 · 0 评论 -
GIS Tools For Hadoop
GIS Tools for HadoopBig Data Spatial Analytics for the Hadoop FrameworkView project onGitHubLooking at data without location, most of the time seems like look原创 2014-12-29 03:52:44 · 2400 阅读 · 0 评论