
python
霸都汤抖森
这个作者很懒,什么都没留下…
展开
-
爬虫
兴趣是最好的导师。 看中一个免费的美漫网站,但是被墙起来了,除了校门不能看 打算把上面的图片爬下来。# -*- coding: utf-8 -*-import urllib2from bs4 import BeautifulSoupimport socketbaseurl = "http://www.readcomics.tv/loki-agent-of-asgard/chapter-1/fu原创 2016-09-22 20:58:47 · 371 阅读 · 0 评论 -
数据挖掘实战之 K-means算法
K-means 算法作为聚类算法中比较重要的入门算法, 1.算法具体过程如下 创建k个点作为起始质心(经常是随机选择) 当任意一个点的簇分配结果发生改变时 对数据集中的每个数据点 ·对每个质心 计算质心与数据点之间的距离 将数据点分配到距其最近的簇 对每一个簇,计算簇中所有点的均值并将均值作为质心原创 2016-12-21 11:03:52 · 713 阅读 · 0 评论 -
数据集预处理,划分为测试数据集合验证数据集
在一个数据集中随机选出80%的记录作为训练数据集,训练得到相应的数学模型之后,将剩余的20%的记录作为验证,测试模型的准确性。原有数据集形式: 1::1193::5::978300760 1::661::3::978302109 1::914::3::978301968 1::3408::4::978300275 1::2355::5::978824291 1::1原创 2016-12-25 13:50:46 · 9947 阅读 · 0 评论