自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(7)
  • 收藏
  • 关注

原创 赛马问题

25匹马赛出前5,每次比赛最多上场5匹马,且没有计时只有名次问题

2019-08-15 00:36:09 1316

原创 常见机器学习问题解答(二)

为什么朴素贝叶斯如此朴素:  因为朴素贝叶斯认为样本中每个特征互相之间都是独立且同样重要的,而不是相关的。显然这与现实是不符合的,所以说它朴素。请大致对比下plsa和LDA(主题模型)的区别:  pLSA在确定了每篇文章的主题分布和每个主题的词分布后,通过p(z∣θd)p(z|\theta_d)p(z∣θd​)求得主题(θd\theta_dθd​是文章d的主题分布),再根据主题p(w∣z)...

2019-01-08 16:56:08 319

原创 LDA(线性判别回归)

LDA线性判别回归LDA降维的基本思想LDA计算LDA降维的基本思想  LDA和PCA一样都是降维算法,但不同的是LDA是有监督的降维算法,它的目的是将不同类别的数据降维后仍能较好的区别开。而PCA是无监督的算法,它的目的是将样本数据降维后仍保留样本数据间的方差。  LDA认为不同类的样本服从均值不同的高斯分布,主要根据均值作为降维的导向,所以它在处理非高斯分布的数据,或者不同类别的高斯分布...

2018-12-29 08:53:34 2296

原创 常见机器学习问题解答(一)

常见机器学习问题解答(一)本文是个人对机器学习问题的总结,问题的来源是七月在线、牛客网等。划有横线的部分是本人掌握不够熟练的部分,读者可以忽略。简要说说一个完整机器学习项目的流程一.将要解决的问题转化成数学模型  在工业界实际的任务每次尝试的代价都是非常大的。所以我们不能胡乱尝试,一开始就要明确解决该问题的数学模型。看看它是分类问题、回归问题、还是聚类问题。二.收集数据  数据决定...

2018-12-28 10:38:22 496

原创 机器学习笔记(三)LDA主题模型

机器学习笔记(三)LDA主题模型模型学习的目标数学理论基础Gibbs采样算法求解LDA的思路LDA求解之变分推断EM算法本文是对https://www.cnblogs.com/pinard/p/6831308.html此篇博客的自我理解和细节的补充。模型学习的目标学习M篇文章中每个文章的主题分布,和K个主题中每个主题中词的分布。例:我们想要知道一个文章中,它包含了哪些主题且主题的比重是怎...

2018-12-15 11:27:01 362

原创 机器学习笔记(二)模型评估

模型评估模型评估指标为什么需要不同的评估指标较为全面的衡量二分类模型的ROC曲线AUCP-R曲线和ROC曲线的相比较的特性余弦距离抽样检验方法超参数调优过拟合与欠拟合降低过拟合欠拟合的方法模型评估指标只有选择与问题相匹配的评估方法,才能有效的评估模型的好坏,有针对的对模型进行优化。模型评估分为线上和离线评估两个阶段。针对分类、标记、排序、序列预测、回归等问题,都有各自合适的模型评估方法。只...

2018-10-26 01:43:54 715

原创 机器学习学习笔记特征工程(一)

特征工程特征工程特征归一化类别型特征特征选择特征选择的原因特征选择和降维的区别特征选择的方法特征工程特征工程就是将原始数据进行一系列工程处理,去掉原始数据的冗余和错误,为模型提供对求解问题更高效的特征输入。输入数据分为1.结构化数据:结构化数据可以看作关系型数据库的一张表,每列都有清晰的定义,包含了数值型和类别型两类。每一行(或每一列)代表一个样本的各个特征的信息。2.非结构化数据:非结构...

2018-10-24 02:29:12 393

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除