
机器学习
机器学习
凌逆战
保持真诚和善良,学会成熟,早睡早起,寻回热爱与运动,实现自我成就。关注我,我们就是朋友,互相进步呀
展开
-
稀疏
机器学习的很多领域中存在很多稀疏矩阵,比如用来表示分类数据的独热编码、用于表示文档中词汇频率的计数编码、用于表示词汇中标准化的单词频率得分的TF-IDF编码。稀疏矩阵稀疏矩阵:在矩阵中,若数值中为0的元素数目远远多于非0元素的数目,并且非0元素分布没有规律。稠密矩阵:在矩阵中,若数值中为0的元素数目远远少于非0元素的数目。$$矩阵的稠密度=\frac{非零元素的总数}{矩...原创 2019-09-26 11:11:00 · 270 阅读 · 0 评论 -
机器学习——聚类算法
本文主要讲解的聚类算法有:k均值算法、均值漂移算法、凝聚层次算法、DBSCAN密度聚类算法,还介绍了聚类算法性能指标——轮廓系数。 聚类(cluster)与分类(class)不同,分类是有监督学习模型,聚类属于无监督学习模型。聚类讲究使用一些算法把样本划分为n个群落。一般情况下,这种算法都需要计算欧几里得距离。$$P(x_1) - Q(x_2): |x_1-x_2| = \...原创 2020-02-29 17:19:00 · 551 阅读 · 0 评论 -
OpenCV图像处理以及人脸识别
OpenCV基础OpenCV是一个开源的计算机视觉库。提供了很多图像处理常用的工具批注:本文所有图片数据都在我的GitHub仓库读取图片并显示import numpy as npimport cv2 as cvoriginal = cv.imread('../machine_learning_date/forest.jpg')cv.imshow('Or...原创 2019-11-10 16:24:00 · 1709 阅读 · 0 评论 -
机器学习——分类问题
人工分类特征1>特征2 输出 0特征1<特征2 输出 1特征1特征2输出3102511816405203514714-10.........681...原创 2019-09-10 15:01:00 · 411 阅读 · 0 评论 -
机器学习——支持向量机(SVM)
支持向量机原理支持向量机要解决的问题其实就是寻求最优分类边界。且最大化支持向量间距,用直线或者平面,分隔分隔超平面。基于核函数的升维变换通过名为核函数的特征变换,增加新的特征,使得低维度空间中的线性不可分问题变为高维度空间中的线性可分问题。线性核函数:linear,不通过核函数进行维度提升,仅在原始维度空间中寻求线性分类边界。基于线性核函数的SVM分类相...原创 2019-09-12 11:46:00 · 408 阅读 · 0 评论 -
机器学习
《人工智能》学习顺序1.Python语言2.数学课程3.机器学习4.深度学习5.量化交易6.数据挖掘7.Kaggle课程8.openCV 计算机视觉课程9.NLP课程10.算法进阶 优快云微博--人工智能学习方法:https://blog.youkuaiyun.com/lixiaowei16/article/details/727704460...原创 2018-07-07 00:00:00 · 258 阅读 · 0 评论 -
机器学习中的python常用函数
lstrip()方法lstrip() 方法用于截掉字符串左边的空格或指定字符str.lstrip([chars]) 截掉指定的字符char返回截掉指定字符的字符串str = " this is string example....wow!!! ";print( str.lstrip() );# this is string example...原创 2019-01-06 10:17:00 · 374 阅读 · 0 评论 -
机器学习——神经网络
神经元模型 神经网路中最基本的成分是“神经元”模型,在生物神经网络中,每个神经元与其他神经元相连,当他“兴奋”时,就会向相连的神经元发送化学物质,从而改变这些神经元类的电位;如果某神经元的电位超过一个“阈值”,那么他就会被激活。将上述描述当成一个数学模型——M-P神经元模型,神经元接收来自n个神经元传递过来的输入信号,这些输入信号通过带权重的连接进行...原创 2018-10-26 00:58:00 · 2139 阅读 · 0 评论 -
机器学习——线性回归
线性回归输入x:0.5 0.6 0.8 1.1 1.4输出y:5.0 5.5 6.0 6.8 7.0$w_0$和$w_1$是模型参数预测函数:$y=w_0+w_1 x$所谓模型训练,就是根据已知的x和y,找到最佳的模型参数$w_0$和$w_1$,尽可能精确地描述出输入和输出的关系。5.0 = w0 + w1 × 0.5 5.5 = w0 + w1 × 0.6单...原创 2019-09-08 15:52:00 · 279 阅读 · 0 评论 -
机器学习——决策树
决策树是根据树结构来进行决策的,决策树的最终结果对应了我们所希望的判定结果。一般的一棵树包含一个根节点、若干个内部节点和若干个叶节点;叶结点对应了决策树的结果,其他每个节点对应于一个属性测试;每个结点根据属性测试的结果别划分到子结点中;根结点包含样本的全集。 决策树的生成是一个递归过程,有三种情况会导致递归返回(也就是出结果): 1...原创 2018-10-16 17:53:00 · 268 阅读 · 0 评论 -
机器学习——模型评估与选择
经验误差与过拟合 错误率为分类错误的样本数占样本总数的比例,相应的精度=1-错误率,模型的实际预测输出与样本的真实输出之间的差异称为“误差”,模型在训练集上的误差称为“训练误差”,在新样本上的误差称为“泛化误差”。我们希望得到在新样本上表现好的学习器,也就是泛化误差小的学习器,但是并不是泛化误差越小越好,我们应该尽可能出训练样本中学出适用于所有潜在样本的“普遍规律”,然而模型把训练...原创 2018-09-23 22:03:00 · 100 阅读 · 0 评论 -
机器学习菜单
机器学习 一、机器学习绪论 机器学习和深度学习资源 python 科学计算库Numpy Python 数据处理库 pandas 生成式对抗网络(GAN) &原创 2018-09-19 23:52:00 · 179 阅读 · 0 评论 -
机器学习——数据预处理
数据预处理数据预处理的过程: 输入数据 -> 模型 -> 输出数据如下图所示为数据样本矩阵,则一行一样本,一列一特征。机器学习中有一个数据预处理的库,是一个解决机器学习问题的科学计算工具包 sklearn.preprocessing。年龄学历经验性别月薪25硕士2女1000020本科3男8000.................原创 2019-09-01 14:24:00 · 475 阅读 · 0 评论 -
机器学习绪论
一、引言 从历史发展来说,在二十世纪八十年代的时候,符号学习可能还是机器学习的主流,到二十世纪九十年代,就一直是统计学习的天下。 符号机器学习主要以离散方法处理问题,统计机器学习时代主要以连续方法处理问题。 深度学习并不是机器学习未来的新方向,深度学习掀起的热潮大过于它本身的真正贡献,在理论和技术上并没有太多的创新,只不过是由于硬...原创 2018-09-17 17:30:00 · 520 阅读 · 0 评论 -
NLTK自然语言处理库
自然语言处理,通常简称为NLP,是人工智能的一个分支,处理使用自然语言的计算机与人之间的交互。NLP的最终目标是以有价值的方式阅读,解读,理解和理解人类语言。大多数NLP技术都依靠机器学习来从人类语言中获取含义。实际上,使用自然语言处理的人与机器之间的典型交互可以如下:人与机器对话机器捕获音频进行音频到文本的转换处理文本数据进行数据到音频的转换机器通过...原创 2019-10-27 10:48:00 · 654 阅读 · 0 评论