
数据分析&数据挖掘
文章平均质量分 73
chszs
这个作者很懒,什么都没留下…
展开
-
用R绘制交互式3D图
1. 安装rgl包、evd包和MASS包:> install.packages("rgl")Installing package(s) into ‘D:/program/R/library’(as ‘lib’ is unspecified)试开URL’http://cran.dataguru.cn/bin/windows/contrib/2.15/rgl_0.92.892.zip'Cont原创 2012-09-24 22:57:47 · 13704 阅读 · 1 评论 -
用R绘制网格
1. 用grid包,下面展示其用法。library(grid)dat <- data.frame(x = rep(seq(0, 0.8, 1/5), 5), y = rep(seq(0, 0.8, 1/5), each = 5), val = rnorm(25, 20, 5))# making relative val原创 2012-09-24 23:07:48 · 7036 阅读 · 0 评论 -
应该在什么时候使用Hadoop
应该在什么时候使用Hadoop作者:chszs,转载需注明。博客主页:http://blog.youkuaiyun.com/chszs有人问我,“你在大数据和Hadoop方面有多少经验?”我告诉他们,我一直在使用Hadoop,但是我处理的数据集很少有大于几个TB的。他们又问我,“你能使用Hadoop做简单的分组和统计吗?”我说当然可以,我只是告诉他们我需要看一些文件格式的例子。他们递给我一个包含600MB数据原创 2013-09-28 00:49:43 · 10390 阅读 · 5 评论 -
数据清洗工具OpenRefine
数据清洗工具OpenRefine作者:chszs,转载需注明。博客主页:http://blog.youkuaiyun.com/chszs数据经常被称为一座金矿,尤其是在当今数据驱动的经济环境下更是如此。怎样把数据集在OpenRefine中进行转换,优化数据的质量以便于在真实场景下重用它们。一、介绍OpenRefine我们来看一个残酷的现实:你的数据是杂乱无章的。错误会散步到你的大数据集中,无论你有多么细心,错原创 2014-02-27 13:39:31 · 37656 阅读 · 0 评论 -
用Grafana为Elasticsearch做日志分析
用Grafana为Elasticsearch做日志分析.Grafana是一个开源的、功能强大的指标仪表板和图形编辑器工具,它面向Graphite、Elasticsearch、OpenTSDB、Prometheus和InfluxDB等数据源。目前Grafana的最新版本为2.6版。原创 2015-12-21 17:49:18 · 38380 阅读 · 7 评论 -
MariaDB AX开源分析解决方案
MariaDB AX开源分析解决方案版权声明:本文为博主chszs的原创文章,未经博主允许不得转载。MariaDB公司推出了新的增强产品——MariaDB AX,它为数据仓库提供了一种现代化的方法,使得客户能够更经济高效地执行快速可扩展的分析。MariaDB AX扩展了MariaDB服务器,提供了一个解决方案,支持使用分布式存储和并行处理的高性能分析,并可以在线或在任何云平台上的现有硬件环境上进原创 2017-11-24 14:01:38 · 3184 阅读 · 0 评论 -
数据湖
数据湖2018.2.21版权声明:本文为博主chszs的原创文章,未经博主允许不得转载。我们生活在数据时代,根据Gartner的报告,全球信息数据量每年以59%的速度递增。管理海量数据是一个重大挑战,数据的品种和增长速度使管理变得更加困难。而且非常明显的是,越来越巨量的数据随着时间在继续生成,特别是在手持设备和互联网连接设备数量的指数增长的背景下。对于参与其中的组织来说,这是事实...原创 2018-02-22 19:15:00 · 2332 阅读 · 0 评论