
机器学习
dongcidacigogogo
这个作者很懒,什么都没留下…
展开
-
机器学习基础——逻辑回归与K-means(笔记六)
一、分类算法—逻辑回归与二分类逻辑回归的应用场景:广告点击率 是否为垃圾邮件 是否患病 金融诈骗 虚假账号特点:都属于俩个类别之间的判断。逻辑回归就是解决二分类问题的利器。逻辑回归的原理:输入:h(w)=w1*x1+w2*x2+…+b逻辑回归的输入就是一个线性回归的结果激活函数:sigmoid函数分析:回归的结果输入到sigmoid函数当中输出结果:[0,1]区间中的一个概率值,默认为0.5位阈值损失函数:(Y_predict-y_true)^2/总数逻原创 2020-11-19 22:06:51 · 781 阅读 · 0 评论 -
机器学习基础——线性回归(笔记五)
一、线性回归回归问题:目标值——连续型的数据线性回归应用场景:房价预测、销售额度预测、金融:贷款额度预测、利用线性回归以及系数分析因子定义与公式:线性回归(Linear regression)是利用回归方程(函数)对一个或多个自变量(特征值)和因变量(目标值)之间关系进行建模的一种分析方式。特点:只有一个自变量的情况称为单变量回归,多于一个自变量情况叫多元回归通用公式h(w)=w1*x1+w2*x2+w3*x3+…+b=wT x+b广义线性模型——非线性关系线性关系一定是线性原创 2020-11-18 22:15:03 · 566 阅读 · 0 评论 -
机器学习基础——决策树和随机森林(笔记四)
一、决策树原理:信息熵、信息增益等 需要用到信息论的知识信息熵的定义:H的专业术语称之为信息熵,单位为比特 决策树的划分依据之一——信息增益定义与公式:特征A对训练数据集D的信息增益g(D,A),定义为集合D 的信息熵H(D)与特征A给定条件下D的信息条件熵H(D|A)之差,公式为: ...原创 2020-11-18 19:47:30 · 285 阅读 · 0 评论 -
机器学习基础——KNN和朴素贝叶斯(笔记三)
一、sklearn转化器和预估器 转换器——特征工程的父类:实例化(实例化的是一个转化器类(Transformer)) 调用fit_transform(对于文档建立分类词频矩阵,不能同时调用)估计器(sklearn机器学习算法的实现):1.用于分类的估计器:Sklearn.neughbors k-近邻算法 Sklearn.naive_bayes 贝叶斯 Sklearn.linear_model.LogisticRegression 逻辑回归 Sklearn.tree 决策树与随机森原创 2020-11-17 21:34:14 · 719 阅读 · 1 评论 -
机器学习基础——特征预处理及降维(笔记二)
一、特征预处理通过一些转换函数将特征数据转换成更加适合算法模型的特征数据过程包含内容:数值型数据的无量纲化: 归一化 标准化 特征的单位或者大小相差较大,或者某特征的方差相比其他的特征要大出几个数量级,容易影响(支配)目标结果,使得一些算法无法学习到其他的特征。使用无量纲化使不同规格的数据转换到同一规格API:sklearn.preprocessing归一化: 定义:通过把原始数据进行变换把数据映射到(默认为[0,1])之间公式: ...原创 2020-11-17 15:41:25 · 344 阅读 · 0 评论 -
机器学习基础——特征提取(笔记一)
1.机器学习简介定义:机器学习是从数据中自动分析获得模型,并利用模型对未知数据进行预测数据集的构成:特征值+目标值对于每一行的数据可以成为样本,有些数据集可以没有目标值机器学习算法分类: 目标值:类别——分类问题 算法:K-近邻算法、贝叶斯分类、决策树与随机森林、逻辑回归 目标值:连续型的数据——回归问题 算法:线性回归,岭回归 目标值:无——无监督学习 ...原创 2020-11-16 21:57:53 · 832 阅读 · 0 评论