
Statistics
Eunice_33
这个作者很懒,什么都没留下…
展开
-
数据基本参数
数据来源:学生成绩排名预测>setwd("C:/Users/fss/Desktop")> data > head(data,2) 学期 学号 书号 图书馆门禁_时间 地点消费_时间金额 日期 排名1 1 55 1297346 92854 图书馆 104218 0.64 916 232 1 55 1297346原创 2015-01-13 20:45:52 · 1145 阅读 · 0 评论 -
不同方法的正态性检验及R语言实现
统计学中的t检验法和F检验法的应用条件是样本都来自正态总体或近似正态总体,只有符合这个条件,才能用它们来检验各样本所属的总体参数的差异显著性。一、非参数检验1、Kolmogorov-Smirnov正态性检验(单样本)检验单一样本是否来自某一特定分布。比如检验一组数据是否为正态分布。它的检验方法是以样本数据的累积频数分布与特定理论分布比较,若两者间的差距很小,则推论该样本取自原创 2015-01-13 20:47:36 · 32151 阅读 · 1 评论 -
聚类分析——K-Means算法
K-Means算法这是基于划分的聚类算法,该算法效率较高,对大规模数据进行聚类时被广泛使用。基本思路:把数据集划分成k个簇,每个簇内部的样本非常相似,不同簇之间的差异非常大。K-Means算法是一个迭代算法,先随机选择k个对象,每个对象代表了起中心,对于剩下的对象,将其赋给最近的簇,然后重新计算簇的中心。不断重复,直到准则函数收敛。算法:1 数据预处理l 连续属性:标准化原创 2015-03-12 20:47:21 · 1184 阅读 · 0 评论