
机器学习实战笔记
文章平均质量分 59
偷嘴的小猴子
这个作者很懒,什么都没留下…
展开
-
机器学习实战:第二章KNN中的一些问题
第一:书中file2matrix函数可能无法通过编译。函数如下:解决问题:把其中语句classLabelVector.append(listFromLine[-1])第二.在使用matplotlib模块进行画图颜色区分时,也可能无法编译成功这个问题和第一个问题源于同一个原因,即作者数据集的问题:Label是字符串,无法使用int("abc"),arr原创 2016-01-19 21:47:31 · 834 阅读 · 0 评论 -
tensorflow实现knn算法
knn算法介绍knn算法是机器学习中最简单的算法。其原理类似于古语“近朱者赤近墨者黑”,即同类物体的差异性小,异类差异性大,而这种差异往往是用“距离”表示。“距离”的度量一般采用欧氏距离。 算法思路 1.计算待分类的样本和样本空间中已标记的样本的欧氏距离。(如图中绿点为待分类样本,要计算绿点与图中所有点的距离) 2.取距离最短的k个点,k个点进行投票,票数最多的类为待测样本的类。(若k为3,则原创 2017-03-12 19:40:11 · 3321 阅读 · 4 评论 -
爬虫学习记录一
爬虫技术对于进行数据处理的相关研究者来说是非常重要的。要进行数据处理,首先我们必须要获取大量的数据,爬虫技术正好可以解决这个问题。对于计算机视觉方面的研究者来说,爬虫技术可以帮助我们快速构建数据集。1.第一爬虫脚本如下:from urllib2 import urlopenhtml = urlopen("http://pythonscraping.com/pages/page1.html")pr原创 2017-04-21 21:53:51 · 479 阅读 · 0 评论 -
贝叶斯文本分类
利用贝叶斯算法进行数据分类操作,并统计其预测正确率数据集:汽车评估数据集(learn作为学习集,test作为测试集合) 待续。。。原创 2018-08-30 17:24:54 · 569 阅读 · 0 评论