
数据挖掘
文章平均质量分 64
奋斗啊哈
每篇博文都有待完善,不足之处请各位多多指教!
展开
专栏收录文章
- 默认排序
- 最新发布
- 最早发布
- 最多阅读
- 最少阅读
-
R笔记
R是用于统计计算和绘图函数语言。R语言主要包括两个概念:对象和函数。基本对象所有对象都有模式(mode)和长度属性向量,分别指示对象中元素的类型和元素的个数。 向量矩阵和数组矩阵是二维数组矩阵增加行或列rbind(mymatrix[1:2,], 0, mymatrix[3:4,]) 插入一行0 cbind(mymatrix[,1:3], 1, mymatrix[,4:5]) 插入一列1删除行或列m原创 2016-04-23 15:36:04 · 548 阅读 · 0 评论 -
时间序列分析
基于事件序列的随机过程平稳性趋势根据时间序列的时域均值函数是否为常数,分为平稳随机过程和非平稳随机过程,后者的时间趋势又分为随机的和确定的。 常见的非常数的均值趋势模型有:线性趋势、二次趋势、季节性均值趋势和余弦趋势。原创 2016-04-17 15:08:02 · 1455 阅读 · 0 评论 -
weka笔记
数据预处理离散化weka.filters.unsupervised.attribute包下 StringToNominal 应用场景如将产品Id的数值表示先转换为字符串类型,再表示变成离散的ID原创 2016-04-15 13:00:18 · 496 阅读 · 0 评论 -
数据挖掘:概念与技术 笔记
认识数据对于含有标称属性的数据对象的相似性度量方式:计算匹配数或者采用特定的编码,如01,这样转化为计算编码之间的数据预处理技术数据清理:处理缺失值 ,清除数据中的噪声 数据集成:多个数据源合并成一个一致的数据存储,即数据仓库 数据归约:通过聚集、删除冗余特征或聚类降低数据规模,包括数据规约和维规约 数据变换:如规范化,将数据压缩到较小区间,还有数据离散化、概念分层原创 2016-04-21 23:31:25 · 522 阅读 · 0 评论 -
R作图
plot做散点图ggplot2qplot是ggplot2的一个作图函数。原创 2016-07-12 16:06:18 · 559 阅读 · 0 评论