
机器学习
陈多鱼
路在心中,路在脚下
展开
-
python实现简单的词形统计
用python正则表达式实现简单的词形统计需求如下: 交流了好长时间才知道她要的是词形统计,如AA.AAB,AABB...编码如下import refrom matplotlib import font_managerimport matplotlib.pyplot as pltimport numpy as npdef read_file_gbk(filename): with open(filename,'r',encoding='GBK') as f: s原创 2021-01-23 14:19:15 · 558 阅读 · 2 评论 -
达摩院视觉智能平台API初体验---表情识别
引言 闲来无事,翻了翻阿里云平台,还真发现一个挺有意思的东西,达摩院视觉智能开发平台ai接口内测中。本着不嫖白不嫖的心态,决定试试就试试。项目架构后端接口实现思路1. MultipartFile 转 file(需要将前端传来的文件流转成file)2 .上传图片到阿里云OSS3.调用阿里视觉计算平台接口 获取返回结果// 开始进行图片标注4.图片下载5.根据像素坐标进行标注6.本地图像上传到OSS7.返回图片路径给前端引入Maven配置 <dependency>原创 2020-10-10 19:22:13 · 1397 阅读 · 1 评论 -
python数据可视化demo
引言在对数据进行处理之时,我们往往会通过绘图来可视化我们的数据,从而利于分析数据处理之前以及之后的一般的规律。下面来实战一下!Demo等高线图import numpy as npimport matplotlib.pyplot as pltdef f(x,y): return (1-x/2+x**5+y**3)*np.exp(-x**2-y**2)n = 256x = np.linspace(-3,3,n)y = np.linspace(-3,3,n)X,Y = np.me原创 2020-09-19 18:22:41 · 723 阅读 · 1 评论 -
浅谈决策树
引言 本文需要些许信息论的知识,不了解的可以去看下相关博文,还是比较容易的,虽然本科学过信息与编码的相关知识,但也是没有实际应用过,所以并不懂其真正的内涵所在,学习了决策树,补了下信息论相关的知识,在此记录一下。什么是决策树 决策树(decision tree)是一种基本的分类与回归方法。举个相亲的例子,某一天小C和他的相亲对象小K在咖啡馆里,他们之间有这样一段对话:小C问: 家里有房吗?小K答: 有,也就十几套小C心想:还不错,可以进行下一步小C继续问:家里有车吗?小K答:有原创 2020-09-03 13:44:29 · 1145 阅读 · 0 评论 -
Python科学计算神器---Numpy初步
引言 最近在学习机器学习的算法,发现在用代码实现诸如KNN,朴素贝叶斯,决策树等基本算法时,经常用到矩阵的相关操作。python语言虽相比java,因其数据类型规定比较松散,且语法糖较多,在进行矩阵加减乘除方面编码较为简单,但也必须用的大量的循环操作,如进行矩阵的reshape操作。于是就开始学习了numpy,其不仅操作简单,且因其底层用C语言实现,运行速度相比原生py也更快,下面来总结下近期所学。什么是NumpyNumPy是Python中科学计算的基础包。它是一个Python库,提供多维原创 2020-09-01 15:37:44 · 1205 阅读 · 0 评论 -
朴素贝叶斯决策理论
引言 虽然本科学过概率论,但是也就会用点公式,知道点皮毛,知其然却不知其所以然,最近看了大佬的博客,有些心得,在此记录一下。个人理解,概率即是可能性,实际问题中好多问题因其复杂性不容易对其进行精确的度量,因此往往采用求概率的形式来进行估计判断,如天气预报。贝叶斯决策理论 如上图,我们现在用p1(x,y)表示数据点(x,y)属于类别1(图中红色圆点表示的类别)的概率,用p2(x,y)表示数据点(x,y)属于类别2(图中蓝色三角形表示的类别)的概率,那么对于一个新数据点(x,y),可以用下面原创 2020-08-28 16:19:01 · 8035 阅读 · 0 评论 -
K近邻算法经典案例实现之海伦约会
引言 上文实现了简单的K近邻算法,本文来介绍下完整的K近邻算法,将实际需求与算法进行结合,先介绍数据预处理以及可视化。K近邻算法的一般流程如下:收集数据:可以使用爬虫进行数据的收集,也可以使用第三方提供的免费或收费的数据。一般来讲,数据放在txt文本文件中,按照一定的格式进行存储,便于解析及处理。准备数据:使用Python解析、预处理数据。分析数据:可以使用很多方法对数据进行分析,例如使用Matplotlib将数据可视化。测试算法:计算错误率。使用算法:错误率在可接受范围内,就可以运行k原创 2020-08-27 23:44:19 · 5082 阅读 · 3 评论 -
简单的K近邻算法实现(python)
引言 学了两天python基础之后,以及简单了解了一下简单的机器学习算法,以及py的第三方库numpy之后,python做数值计算相比java果然无比的方便通过所学知识简单地实现了一下最基础的K近邻分类算法,在此写篇博客记录一下此次学习。算法原理 初中时我们就学过两点间的距离公式,横纵坐标越相近的点,其类别也必然相似,举个极端的例子,相同事物的坐标必定相同,当然反之可能并不成立。因此如果我们可以将一个事物的特征抽象成一个二维或者多维的坐标,运用两点间的距离公式,就可以判断某个未知点的类别。原创 2020-08-26 17:22:33 · 1773 阅读 · 0 评论