
机器学习实战
bwcxljsm
这个作者很懒,什么都没留下…
展开
-
机器学习实战——KNN算法预测电影类型
预测电影类型 现有爱情片和动作片(不是爱情动作片,雾)的打斗场面和接吻场面的次数统计,然后给出一个电影打斗场面和接吻场面出现的次数,预测其类型。那么如何预测呢?当然用KNN了。 KNN算法的原理就是,存在一个训练样本集,我们知道样本集中每一数据与其所属分类的对应关系,然后输入没有标签的新数据,我们可以通过将它的特征与样本集中数据的特征进行比较,提取样本中最相似的分类标签,一般...原创 2018-05-23 10:54:30 · 3752 阅读 · 2 评论 -
机器学习实战——KNN算法改进约会网站配对效果
背景: 将约会网站的人分为三种类型:不喜欢的,魅力一般的,极具魅力的,分别用数字1,2,3表示,这些是样本的标签。样本特征为,每年飞行里程,玩视频游戏占百分比,每周消费冰淇淋公升数。 文件格式如下:首先要解析文本。代码如下:def file2matrix(filename): fr=open(filename) arrayOLines=fr.readlines(...原创 2018-05-24 10:50:31 · 860 阅读 · 2 评论 -
机器学习实战——KNN算法手写数字识别
数据源我们的文本是形如这样的,每个数字都有很多txt文件,TXT里面是01数字,表示手写数字的灰度图。现在我们要用knn算法实现数字识别。数据处理每个txt文件都是32*32的0,1矩阵,如果要使用knn,那么还得考虑行列关系,如果能把它拉开,只有一行,就可以不必考虑数字是第几行了,会更加方便。#手写数字识别#将32*32矩阵转化为1*1024def img2vector(filename):...原创 2018-05-24 11:35:11 · 1167 阅读 · 0 评论 -
机器学习实战——文本分类
朴素贝叶斯优点:在数据较少的情况下仍然有效,可以处理多类别问题。缺点:对输入数据的准备方式较为敏感。适用数据类型:标称型数据核心思想:选择高概率对应的类别。条件概率:代码:from numpy import *def loadDataSet(): postingList=[['my','dog','has','flea',\ ...原创 2018-07-22 15:13:53 · 532 阅读 · 0 评论