
机器学习
文章平均质量分 85
I_am_overflow
这个作者很懒,什么都没留下…
展开
-
Python计算豆瓣热门电影分类TF-IDF
Python计算豆瓣热门电影分类TF-IDF环境PyCharm 2020.2.4 (Professional Edition)bs4==0.0.1urllib3==1.24.2MongoDB 3.4.10Python 3.7.4pymongo 3.11.3TF词频(Term Frequency, TF)反映语料库中的词条termiterm_itermi在文档documentjdocument_jdocumentj中出现的频率TFi,j=countitotal_countTF_{i原创 2021-02-27 20:32:19 · 467 阅读 · 0 评论 -
Python Spark实现协同过滤算法
Python Spark实现协同过滤算法环境Python 3.7.6CentOS Linux release 8.1.1911 (Core) Spark version 3.0.0Scala version 2.12.10 (Java HotSpot(TM) 64-Bit Server VM, Java 14.0.2)实现代码from pyspark import SparkContext# $example on$from pyspark.mllib.recommendation i原创 2020-11-22 18:22:20 · 747 阅读 · 0 评论 -
Python Spark 实现逻辑回归算法
Python Spark 实现逻辑回归算法环境Python 3.7.6CentOS Linux release 8.1.1911 (Core) Spark version 3.0.0Scala version 2.12.10 (Java HotSpot(TM) 64-Bit Server VM, Java 14.0.2)实现代码from pyspark import SparkContextfrom pyspark.mllib.regression import LabeledPoint原创 2020-11-21 21:32:56 · 819 阅读 · 0 评论 -
PaddleHub OCR实现文字识别
PaddleHub OCR实现文字识别环境paddlehub==1.8.3paddleocr==1.0.1paddlepaddle==1.8.5Shapely==1.7.1pip安装pip install paddlehub --upgrade -i https://pypi.tuna.tsinghua.edu.cn/simple pip install shapely -i https://pypi.tuna.tsinghua.edu.cn/simple pip install pyc原创 2020-11-14 23:05:50 · 4552 阅读 · 8 评论 -
Logistic回归分类器
Logistic回归分类器logistic回归是一种广义的线性回归分析模型,logistic回归的模型与线性回归分析模型基本相同,对于自变量xxx和因变量w∗x+bw * x + bw∗x+b,通过逻辑回归函数将因变量的值映射到(0,1)(0, 1)(0,1),logistic回归模型试图学得一个通过属性的线性组合来进行预测的函数f(x)=xT+bf(\pmb{x}) = \pmb{x}^T + bf(xxx)=xxxT+bLogistic回归试图学得合适的权重向量w\pmb{w}www和实数bbb,原创 2020-11-13 22:33:16 · 666 阅读 · 0 评论 -
感知机
感知机感知机由两层神经元组成,输入层接收输入信号后传递给输出层,输出层是M-P神经元,感知机可以轻易地实现逻辑与或非运算from numpy.core.fromnumeric import shapeimport numpy as npX = [[1, 1, 0], [1, 1, 1], [1, 0, 1], [1, 0, 0]]for x in X: x.append(-1)X = np.array(X)y = np.array([0, 1, 0, 0])data_set =原创 2020-11-13 09:55:53 · 364 阅读 · 0 评论 -
k邻近学习分类算法 —— k-Nearest Neighbor
k邻近学习算法 —— k-Nearest Neighbor python实现环境Python 3.7.4numpy==1.18.1matplotlib==3.1.1k邻近学习K邻近算法(K-Nearest Neighbor, KNN)是一种常用的、简单的监督学习方法,KNN算法对于给定的训练数据样本集和待分类样本数据,基于某种距离度量策略(欧氏距离、余弦相似度等)得出与待分类样本数据最近的k个样本,待分类样本类别的预测结果即为k个最近的邻居中出现最多的类别,采用投票法得出出现最多的类别并将待分原创 2020-07-23 16:08:40 · 527 阅读 · 0 评论