
机器学习
文章平均质量分 96
老板来碗小面加蛋~
计算机硕士在读
展开
-
机器学习算法 10 —— HMM模型(马尔科夫链、前向后向算法、维特比算法解码、hmmlearn)
文章目录系列文章隐马尔科夫模型 HMM1 马尔科夫链1.1 简介1.2 经典举例2 HMM简介2.1 简单案例2.2 案例进阶问题二解决问题一解决问题三解决3 HMM模型基础3.1 什么样的问题需要HMM模型3.2 HMM模型的定义4 前向后向算法评估观察序列概率4.1 回顾问题一:求观测序列的概率4.2 ⽤前向算法求HMM观测序列的概率4.3 ⽤后向算法求HMM观测序列的概率5 维特⽐算法解码隐藏状态序列5.1 HMM最可能隐藏状态序列求解概述5.2 维特比算法概述6 鲍姆-韦尔奇算法简介7 HMM模型A原创 2021-08-30 15:19:29 · 6015 阅读 · 2 评论 -
机器学习算法 09 —— EM算法(马尔科夫算法HMM前置学习,EM用硬币案例进行说明)
文章目录系列文章EM算法1 初识EM算法2 EM算法介绍2.1 最大似然估计2.2 EM算法实例描述2.3 EM算法流程3 EM算法实例3.1 一个简单案例3.2 加入隐变量z后的求解3.3 EM初级版3.4 EM进阶版系列文章机器学习算法 01 —— K-近邻算法(数据集划分、归一化、标准化)机器学习算法 02 —— 线性回归算法(正规方程、梯度下降、模型保存)机器学习算法 03 —— 逻辑回归算法(精确率和召回率、ROC曲线和AUC指标、过采样和欠采样)机器学习算法 04 —— 决策树(ID原创 2021-08-28 11:30:10 · 2210 阅读 · 1 评论 -
机器学习算法 08 —— 支持向量机SVM算法(核函数、手写数字识别案例)
文章目录系列文章支持向量机SVM算法1 SVM算法简介1.1 引入1.2 算法定义2 SVM算法原理2.1 线性可分支持向量机2.2 SVM计算过程与算法步骤(有点难,我也没理解透,建议跳过)推导目标函数目标函数求解拉格朗日乘数法对偶问题整体流程确定3 SVM的损失函数4 SVM的核方法4.1 什么是核函数4.2 常见核函数5 SVM回归6 SVM算法API介绍6.1 SVM算法API综述6.2 SVC6.3 NuSVC6.4 LinearSVC7 案例:数字识别器7.1 案例背景介绍7.2 数据介绍7.3原创 2021-08-26 10:44:13 · 23706 阅读 · 1 评论 -
机器学习算法 07 —— 朴素贝叶斯算法(拉普拉斯平滑系数、商品评论情感分析案例)
文章目录系列文章朴素贝叶斯1 什么朴素贝叶斯分类2 概率复习2.1 朴素贝叶斯2.2 文章分类举例2.3 拉普拉斯平滑系数3 案例:商品评论情感分析4 朴素贝叶斯算法总结4.1 优缺点4.2 内容汇总朴素贝叶斯(NB)原理朴素⻉叶斯朴素在哪⾥?为什么引⼊条件独⽴性假设?在估计条件概率**P(X**∣**Y)**时出现概率为**0**的情况怎么办?为什么属性独⽴性假设在实际情况中很难成⽴,但朴素⻉叶斯仍能取得较好的效果?朴素贝叶斯和逻辑回归(LR)的区别系列文章机器学习算法 01 —— K-近邻算法(数原创 2021-08-23 11:10:53 · 9125 阅读 · 4 评论 -
机器学习算法 06 —— 聚类算法(k-means、算法优化、特征降维、主成分分析PCA)
文章目录系列文章聚类算法1 聚类算法简介2 聚类算法API初步使用3 聚类算法实现流程4 聚类模型评估4.1 误差平方和(SSE)4.2 肘方法4.3 轮廓系数法4.4 CH系数4.5 小结5 算法优化5.1 Canopy算法5.2 K-means++5.3 二分K-means5.4 K-medoids(K-中心聚类算法)5.5 Kernel K-means、ISODATA、(了解)6 特征工程-特征降维6.1 什么是特征降维6.2 特征选择低方差特征过滤皮尔逊相关系数斯皮尔曼相关系数6.3 主成分分析(P原创 2021-08-22 10:00:11 · 22157 阅读 · 0 评论 -
机器学习算法 05 —— 集成学习(Bagging、随机森林、Boosting、AdaBost、GBDT)
文章目录系列文章1 集成学习算法介绍2 Bagging和随机森林2.1 Bagging集成原理2.2 随机森林2.3 包外估计2.4 随机森林API3 案例:奥拓产品分类3.1 背景介绍3.2 数据集介绍3.3 评分标准3.4 实现过程4 Boosting介绍4.1 什么是Boosting4.2 实现过程4.3 Bagging集成和Boosting集成的区别5 AdaBost5.1 构成过程细节5.2 AdaBost API介绍6 GBDT介绍6.1 Decision Tree**:**CART回归树6原创 2021-08-19 18:42:21 · 2930 阅读 · 0 评论 -
机器学习算法 04 —— 决策树(ID3、C4.5、CART,剪枝,特征提取,回归决策树)
文章目录系列文章决策树1 决策树算法简介2 决策树分类的原理2.1 信息熵2.2 决策树划分依据—信息增益(ID3)2.3 决策树划分依据—信息增益率(C4.5)2.4 决策树划分依据—基尼值和基尼指数(CART)2.5 小结决策树各个公式各算法优缺点如何评估分割点的好坏?决策树变量的两种类型3 CART减枝3.1 为什么需要剪枝?3.2 常用的剪枝方法预剪枝后剪枝小结-预剪枝和后剪枝优缺点4 特征工程—特征提取4.1 字典特征提取4.2 文本特征提取英文文本中文文本TF-IDF5 决策树算法API6 案例原创 2021-08-16 23:24:48 · 3966 阅读 · 1 评论 -
机器学习算法 03 —— 逻辑回归算法(精确率和召回率、ROC曲线和AUC指标、过采样和欠采样)
文章目录系列文章逻辑回归1 逻辑回归介绍1.1 逻辑回归原理输入激活函数1.2 损失以及优化2 逻辑回归API介绍3 案例:肿瘤良性恶性预测4 分类模型的评估4.1 分类评估方法混淆矩阵准确率精确率召回率F1-score4.2 分类评估API4.3 ROC曲线和AUC指标TPR与FPRROC曲线AUC指标绘制ROC曲线补充:解决类别不平衡问题1 构造不平衡数据集2 解决类别不平衡的方法过采样欠采样系列文章机器学习算法 01 —— K-近邻算法(数据集划分、归一化、标准化)机器学习算法 02 —— 线原创 2021-08-14 16:56:10 · 12015 阅读 · 4 评论 -
机器学习算法 02 —— 线性回归算法(正规方程、梯度下降、模型保存)
文章目录系列文章线性回归1 线性回归简介2 线性回归API初步使用3 数学求导复习4 线性回归的损失和优化4.1 损失函数4.2 优化算法正规方程梯度下降梯度下降生动解释梯度的概念梯度下降公式小结5 梯度下降方法介绍(了解即可)5.1 详解梯度下降算法相关概念复习梯度下降法的推导5.2 梯度下降法家族全梯度下降算法(FG)随机梯度下降算法(SG)⼩批量梯度下降算法(Mini-Batch)随机平均梯度下降算法(SAG)6 线性回归API详解7 案例:波士顿房价预测7.1 数据集介绍7.2 回归模型评估7.3原创 2021-08-13 12:50:33 · 4573 阅读 · 1 评论 -
机器学习算法 01 —— K-近邻算法(数据集划分、归一化、标准化)
文章目录系列文章K-近邻算法1 什么是K-仅邻算法1.1 K-近邻算法(KNN)概念1.2 举例说明K-近邻算法1.3 K-近邻算法流程总结2 K-近邻算法API初步使用2.1 Scikit-learn工具介绍2.2 K-近邻算法API3 距离公式3.1 距离公式基本性质3.2 常见的举例公式欧式距离(Euclidean Distance)曼哈顿距离(Manhattan Distance)切⽐雪夫距离 (Chebyshev Distance)闵可夫斯基距离(Minkowski Distance)3.3 “连原创 2021-08-11 20:10:58 · 10249 阅读 · 0 评论 -
机器学习入门 06 —— Seaborn使用
文章目录系列文章6 Seaborn6.1 绘制单变量分布6.2 绘制双变量分布1 绘制散点图2 绘制二维直方图3 绘制核密度估计图4 绘制成对的双变量分布6.3 绘制分类数据图1 类别散点图striplot()swarmplot()2 箱型图和小提琴图箱型图小提琴图3 条形图和点图条形图点图6.4 案例:NBA球员数据分析1 基本数据介绍2 获取数据3 数据分析数据相关性分析数据排名分析球员薪资和年龄分布系列文章机器学习入门 01 —— 机器学习概述机器学习入门 02 —— 环境搭建(Jupyter原创 2021-08-09 22:30:57 · 2614 阅读 · 1 评论 -
机器学习入门 05 —— Pandas使用
文章目录系列文章5 Pandas5.1 Pandas介绍5.2 Pandas数据结构1 Series创建SeriesSeries属性2 DataFrame创建DataFrameDataFrame属性重置索引设置某列值为新索引3 MultiIndex5.3 基本数据操作1 索引操作直接操作loc和iloc2 赋值操作3 排序5.4 运算1 算数运算2 逻辑运算3 统计运算4 自定义运算5.5 画图5.6 文件读取与存储1 CSV2 HDF53 JSON5.7 缺失值处理5.8 数据离散化1 数据离散化介绍为什原创 2021-08-08 23:10:01 · 3639 阅读 · 1 评论 -
机器学习入门 04 —— Numpy使用
文章目录系列文章Numpy4.1 Numpy优势1 Numpy介绍2 ndarry介绍3 ndarray与Python原生list效率对比4 ndarray的优势5 小结4.2 N维数组—ndarray1 ndarray的属性2 ndarray的元素类型3 基本操作0/1数组拷贝数组等差/等比数组正态分布和均匀分布形状修改类型修改数组去重4 ndarray运算逻辑运算通用判断函数 all和any三元运算符 where统计运算5 数组间的运算数组与数进行运算数组与数组进行运算6 矩阵乘法系列文章机器学习原创 2021-07-29 19:32:18 · 1198 阅读 · 0 评论 -
机器学习入门 03 —— Matplotlib使用(折线图、散点图、柱状图、直方图、饼图、堆叠柱状图等)
文章目录系列文章3.1 Matplotlib之Hello World1 Matplotlib介绍2 Matplotlib画图流程3.2 基础绘图功能(以折线图为例)1 坐标刻度、标签、网格、图像保存2 在一个坐标系里绘制多个图3 在一个图里绘制多个坐标系3.3 常见图形绘制1 折线图2 散点图3 柱状图4 直方图5 饼图6 特殊柱状图两条柱状图水平柱状图堆叠柱状图系列文章机器学习入门 01 —— 机器学习概述机器学习入门 02 —— 环境搭建(Jupyter Notebook 及扩展库的安装与使用)原创 2021-07-27 22:02:29 · 4093 阅读 · 0 评论 -
机器学习入门 02 —— 环境搭建(Jupyter Notebook、默认路径 、扩展库的安装与使用)
机器学习基础环境安装与使用2.1 库的安装整个机器学习基础阶段会用到Matplotlib、Numpy、Pandas等库。如果是使用PyCharm开发,我们可以去PyCharm里直接安装。1、创建新项目并勾选下面两个选项2、在设置中找到当前项目,点击加号后搜索库名进行安装(matplotlib、numpy、pandas、tables、jupyter)3、后面新建的项目直接选刚刚创建的虚拟环境由于后面开发我是使用的jupyter notebook,所以这里使用了Anaconda。请看这两篇博原创 2021-07-27 10:47:31 · 4367 阅读 · 6 评论 -
机器学习概述扩展:完整机器学习项目的流程和独立同分布
完整机器学习项目的流程1 抽象成数学问题明确问题是进行机器学习的第一步。机器学习的训练过程通常都是一件非常耗时的事情,胡乱尝试时间成本是非常高的。这里的抽象成数学问题,指的明确我们可以获得什么样的数据,抽象出的问题,是一个分类还是回归或者是聚类的问题。2 获取数据数据决定了机器学习结果的上限,而算法只是尽可能逼近这个上限。数据要有代表性,否则必然会过拟合。而且对于分类问题,数据偏斜不能过于严重,不同类别的数据数量不要有数量级的差距。而且还要对数据的量级有一个评估,多少个样本,多少个特征,可以原创 2021-07-26 16:23:10 · 360 阅读 · 0 评论 -
机器学习入门 01 —— 机器学习概述
文章目录系列文章机器学习概述1.1、人工智能概述1 人工智能应用场景2 人工智能小案例3 人工智能发展必备三要素4 人工智能、机器学习和深度学习5 小结1.2、人工智能发展历程1.3、人工智能主要分支1 计算机视觉2 语音识别3 文本挖掘/分类4 机器翻译5 机器人6 小结1.4、机器学习工作流程1 什么是机器学习2 机器学习工作流程获取的数据集数据基本处理特征工程机器学习模型评估3 小结1.5、算法分类1 监督学习2 无监督学习3 半监督学习4 强化学习5 小结1.6、模型评估1 分类模型评估2 回归模型原创 2021-07-26 16:13:24 · 4020 阅读 · 0 评论