
5.数据挖掘
数据挖掘
dudu00100
这个作者很懒,什么都没留下…
展开
-
数据挖掘简要介绍
一、定义: 数据挖掘是指从大量的数据中搜索隐藏于其中的有着特殊关系性的信息的过程。二、挖掘对象: 概括为:关系数据库、文本、图像与视频数据、Web数据等。三、挖掘过程: 主要分为:数据收集、数据清洗转换、模型建立与评估、应用集成、模型管理。四、数据挖掘任务: 1、关联分析:分析两个或两个以上变量取值之间存在的某种规原创 2016-04-13 21:15:58 · 501 阅读 · 0 评论 -
聚类方法
一、目的: 粗略的说,按照一定的标准,将相似的数据分为一类,同类之间相异度低,不同类之间相异度低。二、聚类方法: 基于距离方法进行聚类(欧氏距离、曼哈顿距离、明考斯距离) 基于概率方法进行聚类三、k-means算法介绍: k-means算法也称为平均算法。 实现过程: 导入或随机抽取若...原创 2016-04-15 19:56:12 · 474 阅读 · 0 评论 -
R 数字 字符 向量
(5)字符型向量:“a”Paste(“MY”,”GOD”)=>”MY GOD”将自变量连成字符串,中间用空格分开x<-c(1,2,3,4,5);y<-c(4,5,6,7)> paste(x,y)[1] "1 4" "2 5""3 6" "4 7" "5 4" 重复使用Y中4 (6)复数向量Z<-compl原创 2016-04-24 18:56:43 · 1068 阅读 · 0 评论 -
R 数字 字符 向量
(1)向量 运算中向量+1,是对所有的分量均+15%/%3整除取整,5%%3取余exp函数:y=exp(x)=e^x(e的x次幂)sqrt函数:开平方abs:绝对值expm1:当x的绝对值比1小很多的时候,能更加准确计算exp(x)-1log:对数函数asin:反正弦函数acos,atantsinh,cosh,tanh,超越正弦函数~asinh,acos...原创 2016-04-20 16:50:10 · 1427 阅读 · 0 评论 -
R 数据读入
将数据读入R A:excel表格: 将excel另存为csv或文本文档(txt)格式,后 1.a<-read.csv(“途径.文件名.csv”,header=T/F) (header=T,自动加上序号,F不加序号) 2.a<-read.delim(“途径.文件名.txt”,header=T/F)...原创 2016-04-24 19:06:29 · 833 阅读 · 0 评论 -
R 画图
画图函数中的参数:图形元素参数: pch:用于显示点的坐标,可以是一个字符,也可以是0到25的一个整数。如:pch=“+”,pch=1 lty:线条类型。如:lty=2,lty=1 lwd:线条宽度。如:lwd=2 col:点,线,文本,填充区域的颜色设置,col.axis, col.sub, col.main分别对应坐标轴标注,...转载 2016-05-05 20:34:14 · 567 阅读 · 0 评论 -
R 软件包
原文地址:R语言中包的操作作者:zjl_Notes1. 列出包所在库的路径.libPaths()[1] "C:/Program Files/R/R-3.0.2/library"2. 安装包,括号里面包的名称要加英文引号,在列出的CRAN镜像站点列表中选择一个进行下载,我一般选的是China(Hefei)install.packages()例如,install.packages...转载 2016-05-22 19:36:33 · 1965 阅读 · 0 评论 -
R语言与网站分析
主要分为以下几种数学思维:(1)细分分析:使用某一特定因素,将变量分为多个变量,用于找出数据之间的规律。细分变量服从正太分布,所以可使用相应理论进一步研究。(2)对比分析:可用于细分分析之后,用于找出指标变量变化的真实原因。可使用特定变量均值、最大/小值、中值等进行对比分析。继而找出影响因素、影响程度等,从而帮助决策者抓住问题本质。(3)趋势分析:研究指标变量的上升下降及周期性等趋势性...原创 2016-06-02 20:59:12 · 1023 阅读 · 0 评论 -
了解R软件
(1)工作目录getwd() 获取工作目录位置信息setwd(paste())更改目录信位置 paste(getwd(),“/r”,seq=""):字符串函数 seq:设置合并连接符【用于UNIX】sink("D:\\######workspace\\Rworkspace\\result\\result.txt") #将所有后续的输出由终端传向一个外部文件。(2)命令脚本文...原创 2016-06-02 21:52:36 · 601 阅读 · 0 评论