
机器学习
文章平均质量分 91
闲不下来的王小C
闲不下来,只是闲不下来
展开
-
机器学习实战读书笔记(1)--k邻近算法
kNN算法kNN算法概述kNN算法和kmeans算法的比较knn工作原理: 存在一个样本数据集合(训练样本集),并且每个样本都具有标签,输入新的样本后,我们将样本的特征与训练样本集中的数据特征比较,算法提取特征最相似的k个样本的标签,采用少数服从多数的形式,认为新样本的标签就是最相似的k个样本中的主要标签.def classify0(inX,dataSet,label...原创 2018-07-17 19:45:21 · 291 阅读 · 0 评论 -
机器学习实战读书笔记(2)--决策树
决策树决策树的一个重要任务是为了数据中所蕴含的知识信息,因此决策树可以使用一系列不熟悉的数据集合,并从中提取系列规则,在这些机器根据数据集创建规则时,就是机器学习的过程.专家系统中经常使用决策树决策树的构造 优点:计算复杂度不高,输出结果易于理解,对中间值缺失不敏感,可以处理不相关特征数据 缺点:可能会产生过度匹配的问题(overfit) 适用数据类型:数值...原创 2018-07-17 19:56:32 · 715 阅读 · 0 评论 -
机器学习实战读书笔记(3)--朴素贝叶斯
基于贝叶斯决策理论的分类方法 优点:在数据较少的情况下仍然有效,可以处理多类别问题 缺点:对输入数据的准备方式比较敏感,需要标称数据.确定贝叶斯最优假设的计算代价较大朴素贝叶斯是贝叶斯决策理论的一部分.贝叶斯决策理论的核心思想:一个数据集包括2类(或两类以上)数据,这些数据有一些维度,如果已知一个数据的特征,由该特征得到其属于第一类的可能性p1(x,y)p1(x,y)p1(...原创 2018-07-25 21:20:53 · 189 阅读 · 0 评论 -
机器学习实战读书笔记(4)--logistic回归
Logistic回归假设我们有一些数据点,用一条直线对这些点进行拟合,这个拟合的过程成为回归.在计量经济学中我们大量的使用过线性回归,线性回归的模型试图得到一个通过属性的线性组合来进行预测的函数,即 f(x)=WTX+bf(x)=WTX+bf(x)=W^TX+b 式中的W和b通过学习获得,模型就被标定了.而logistic回归的思想是,回归的结果不是一个实值,而是一个二分类的概率.这个变量...原创 2018-07-25 21:27:10 · 212 阅读 · 0 评论 -
ML神器:sklearn的快速使用
传统的机器学习任务从开始到建模的一般流程是:获取数据 -> 数据预处理 -> 训练建模 -> 模型评估 -> 预测,分类。本文我们将依据传统机器学习的流程,看看在每一步流程中都有哪些常用的函数以及它们的用法是怎么样的。希望你看完这篇文章可以最为快速的开始你的学习任务。1. 获取数据1.1 导入sklearn数据集 sklearn中包含了大量的优质的数据集,在你学...转载 2019-03-14 16:54:35 · 176 阅读 · 0 评论 -
pandas 快速教程
pandas和numpy的区别numpy对数据进行了序列化, pandas在numpy的基础上对数据进行了字典化.在pandas中, 一维数据的创建(带有字典型索引的ndarray)import pandas as pdimport numpy as nparray = pd.Series(data, index, dtype, name, copy)# data 可以是array-...原创 2019-03-24 10:38:23 · 176 阅读 · 0 评论 -
Pytorch快速教程
张量Tensor是pytorch中最基本的数据类型, 相当于numpy中的ndarray, 是具有追踪运算, 自动求导功能的多维数组.1. 创建x = torch.rand(5, 3) # 随机二维数组x = torch.empty(5, 3) # 创建二维数组但不进行初始化x = torch.zeros(5, 3) # 创建全零的二维数组x = torch.tensor([1...原创 2019-07-19 13:50:57 · 728 阅读 · 0 评论