
r语言
cutwind
白身红尘客/风起水无波/仗剑欲饮酒/看人间不朽
qq:1246467060(加Q备注优快云)
展开
-
R————KNN
KNN(最近邻分类) 它是数据挖掘算法中 可以说是最简单的一种算法了,所谓近邻,乃是以K个最近的邻居代表某个样本。KNN算法的核心思想是,样本在特征空间中的K个邻居大多属于一个类别,则该样本也属于该类别,并具有该类别的样本特性。KNN算法在分类决策中只依据样本的一个或多个邻近值来决定待测样本的类别。由于KNN算法的分类决策只和极少量的样本有关,它不同于靠区间域分类。所以在处理 区间域交叉重叠较多原创 2017-08-27 15:43:30 · 625 阅读 · 0 评论 -
数据前处理---dplyr包
用dplyr 包处理数据时原创 2017-10-09 20:16:25 · 365 阅读 · 0 评论 -
R---岭回归 & lasso回归
岭回归lasso回归原创 2017-09-06 21:47:25 · 3584 阅读 · 0 评论 -
R----简述时间序列(ARIMA)
时间序列原创 2017-09-19 22:35:28 · 1185 阅读 · 0 评论 -
R----决策树
决策树算法可以分成两块:1. 基于信息增益率的分类C5.0算法;2. 基于基尼系数分类的CART(Classification And Regression Tree)原创 2017-09-02 19:25:52 · 671 阅读 · 0 评论 -
R---randomForest
随机森林(randomForest)原创 2017-09-07 17:46:29 · 1961 阅读 · 1 评论 -
R--NaiveBayes
朴素贝叶斯算法是基于贝叶斯定理和假设条件独立的分类方式。可以说贝叶斯定理是算法的核心。原创 2017-08-29 16:58:15 · 2594 阅读 · 1 评论 -
R---简单线性回归
简单线性回归:OLS(最小二乘法)原创 2017-09-05 16:47:54 · 796 阅读 · 0 评论 -
R----kmeans
K-means 算法是很经典的基于距离的无监督硬聚类算法。算法认为对象距离近的, 其相似度越大。算法最终会得到一个,簇内距离尽量小,不同簇间距离尽量大的一个分类结果。1.对样本进行初始聚类(离哪个近就归到那类)。 2.然后计算每个簇中的中心值。在对样本重新聚类(离哪个近就归到那类)。一直迭代重复,直到两次得到的中心值相同或达到设定的阈值,迭代结束。此时的聚类结 果为最终的聚类结果。 ...原创 2017-08-28 17:06:45 · 333 阅读 · 0 评论 -
R----简述logistic回归
逻辑回归是用来解决二分类问题的,即案例标签不是A就是B原创 2017-09-05 18:26:47 · 559 阅读 · 0 评论 -
数据处理--reshape2包(长宽数据)
宽数据长数据转载 2017-10-09 20:46:54 · 2109 阅读 · 0 评论