
机器学习
Weize Tang
Stop thinking,worrying,wondering,doubting,fearing,hurting,struggling,itching,scratching,rumbling,gambling,nit-picking.Stop it and just do it
展开
专栏收录文章
- 默认排序
- 最新发布
- 最早发布
- 最多阅读
- 最少阅读
-
聚类(1)----DBSCAN实例
DBSCAN算法是一种基于密度聚类算法: - 聚类的时候不需要预先指定簇的个数 - 最终簇的个数不一定DBSCAN算法将数据点分为三类: - 核心点:在半斤EPS内含有超过MinPts数目的点 - 边界点:在半斤EPS内点的数量小于MinPts,但是落在核心点的领域内 算法流程: 1. 对所有点计算其领域Eps=distance内的点的集合 2. 集合内的点个数超过MinP原创 2017-05-22 23:22:26 · 4149 阅读 · 1 评论 -
聚类(2)--KMeans算法
K-means聚类算法也称作K均值算法。以k为参数,把n个对象分成k个簇,使簇内具有较高的相似度,簇间相似度较低,随机选择k个点作为初始聚类中心对于剩下的点,根据其与聚类中心的距离,将其归入最近的簇对每个簇,计算所有点的均值作为新的聚类中心重复2,3直到聚类中心不再发生改变 import numpy as npfrom sklearn.cluster import KMeansimpor原创 2017-05-23 11:33:44 · 824 阅读 · 0 评论 -
sklern使用之通用模版(以iris为数据集,knn,PCA)
import matplotlib.pyplot as pltfrom sklearn.decomposition import PCAfrom sklearn.datasets import load_irisfrom sklearn.neighbors import KNeighborsClassifierfrom sklearn.cross_validation import trai原创 2017-05-23 14:48:20 · 806 阅读 · 0 评论 -
交叉验证 cross_validation
from sklearn.datasets import load_boston, load_irisfrom sklearn.linear_model import LinearRegressionfrom sklearn.neighbors import KNeighborsClassifierimport numpy as npfrom sklearn import preproces原创 2017-05-23 21:34:00 · 471 阅读 · 0 评论 -
利用KMeans算法对图片进行分割
from sklearn.cluster import KMeansimport numpy as npimport PIL.Image as imagedef loadData(filePath): f = open(filePath, 'rb') data = [] img = image.open(f) #PIL.Image.open(图片路径) m, n原创 2017-05-31 11:42:28 · 2993 阅读 · 0 评论 -
利用Knn, 决策树, 高斯朴树贝叶斯,对行为进行预测
import numpy as npimport pandas as pdfrom sklearn.preprocessing import Imputer #预处理函数 处理缺失值from sklearn.model_selection import train_test_split #自动分成训练集和测试集from sklearn.metrics import classificati原创 2017-06-01 16:10:20 · 1097 阅读 · 0 评论