
AI与数据分析
文章平均质量分 81
AI与数据分析
down_dawn
这个作者很懒,什么都没留下…
展开
-
文本相似度算法的对比及python实现
文本相似度算法的对比及python实现前言通常我们有这样的需求:对两篇文章或者产品内容进行重复率查询。为了解决类似的问题,罗列了一些常见的相似度算法,用python代码实现。五种常见的相似度算法:余弦相似度(cosine_similarity)、jaccard相似度、编辑距离(Levenshtein)、MinHash、SimHash + 海明距离。代码是一位前辈留下的,做一下整理分享出来...原创 2019-11-01 15:02:21 · 15144 阅读 · 16 评论 -
机器学习笔记(二)——Numpy
机器学习笔记(二)——Numpy介绍Numpy(Numerical Python)是一个开源的Python科学计算库,用于快速处理任意维度的数组。Numpy支持常见的数组和矩阵操作。对于同样的数值计算任务,使用Numpy比直接使用Python要简洁的多。Numpy使用ndarray对象来处理多维数组,该对象是一个快速而灵活的大数据容器。意义ndarray与Python原生list运算效...原创 2019-11-01 09:48:05 · 507 阅读 · 0 评论 -
机器学习笔记(一)——基础环境
机器学习笔记(一)——基础环境前言机器学习基础阶段会用到Matplotlib、Numpy、Pandas等库,为了方便可以统一安装Anacond,利用Jupyter Notebook来学习。Anacond介绍Anaconda指的是一个开源的Python发行版本,其包含了conda、Python等180多个科学包及其依赖项。 因为包含了大量的科学包,Anaconda 的下载文件比较大(约 5...原创 2019-11-01 09:46:33 · 204 阅读 · 0 评论