
数据挖掘
clover_daisy
心有猛虎,细嗅蔷薇。
展开
专栏收录文章
- 默认排序
- 最新发布
- 最早发布
- 最多阅读
- 最少阅读
-
sklearn基本用法----knn
K-nn算法 在模式识别中,k-邻近算法(k-nn)是用于分类和回归的非参数方法。所谓K邻近,就是k个最近的邻居,意思是每个样本都可以用它最接近的k个邻居来代表。 knn算法的核心思想是如果一个样本在特征空间中的k个最相邻的样本中的大多数属于某一个类别,则该样本也属于这个类别,并具有这个类别上样本的特性。原创 2017-01-26 13:11:41 · 5964 阅读 · 0 评论 -
Facebook页面受欢迎程度分析
使用jupyder,sklearn,pandas,numpy,matplotlib等工具分析Facebook帖子的受欢迎程度与xxx特征的关系。原创 2017-01-21 10:52:43 · 1469 阅读 · 0 评论 -
sklearn基本用法----K-means
K-means(K-均值) k-means算法源于信号处理中的一种向量量化方法,现在则更多地作为一种聚类分析方法流行于数据挖掘领域。原创 2017-01-19 20:34:19 · 4994 阅读 · 1 评论 -
sklearn基本用法----SVM
——sklearn(Google公司开始投资,是大数据战略的一个步骤)是python的机器学习模块,可用于模式识别,用在一般知识发现,例如户外参与人口的类型。sklearn包自带数据集。 svm1.定义 支持向量机(SVM)是一组用于分类,回归和异常值检测的监督学习方法。 ...原创 2017-01-19 15:18:24 · 19983 阅读 · 3 评论