
机器学习
文章平均质量分 54
Class_guy
目前对自然语言处理,问答系统和对话系统比较感兴趣。欢迎志同道合的朋友一起交流。
github:https://github.com/zhihao-chen
展开
-
特征选择
转载自:https://blog.youkuaiyun.com/adore1993/article/details/53980327什么是特征选择 特征选择也称特征子集选择,或者属性选择,是指从全部特诊中选取一个特征子集,使构造出来的模型更好。 为什么要做特征选择 在机器学习的实际应用中,特征数量往往较多,其中可能存在不相关的特征,特征之间也可能存在相互依赖,容易导致: ...转载 2018-07-23 22:05:53 · 561 阅读 · 0 评论 -
决策树模型 ID3/C4.5/CART三种算法的区别
转载自:https://www.cnblogs.com/wxquare/p/5379970.html 决策树模型在监督学习中非常常见,可用于分类(二分类、多分类)和回归。虽然将多棵弱决策树的Bagging、Random Forest、Boosting等tree ensembel 模型更为常见,但是“完全生长”决策树因为其简单直观,具有很强的解释性,也有广泛的应用,而且决策树是tree ense...转载 2018-07-25 17:46:46 · 11106 阅读 · 0 评论 -
刷题笔记2
1、若一序列进栈顺序为a1,a2,a3,a4,问存在多少种可能的出栈序列( )A 12 B 13 C 14 D 15答案:C2、下列属于有监督学习算法的是:()A 谱聚类 B 主成分分析PCA C 主题模型LDA D 线性判别分析LDA答案:D3、以下是产生式模型的...原创 2018-07-31 14:44:46 · 5461 阅读 · 0 评论 -
常用时间序列算法
时间序列中常用预测技术 一个时间序列是一组对于某一变量连续时间点或连续时段上的观测值。1. 移动平均法 (MA)1.1. 简单移动平均法设有一时间序列y1,y2,..., 则按数据点的顺序逐点推移求出N个数的平均数,即可得到一次移动平均数. 1.2 趋势移动平均法 当时间序列没有明显的趋势变动时,使用一次移动平均就能够准确地反映实际情况,直接用第t周期的一次移动平均数就可...转载 2018-08-08 09:13:19 · 3513 阅读 · 0 评论 -
神经网络模型优化方法(缓解过拟合)
转自:https://blog.youkuaiyun.com/chenyukuai6625/article/details/76922840一、背景简介 在深度学习和机器学习的各种模型训练过程中,在训练数据不够多时,自己常常会遇到的问题就是过拟合(overfitting),过拟合的意思就是模型过度接近训练的数据,使得模型的泛化能力降低,泛化能力降低表现为模型在训练集上测试的误差很低,但是真正在验证集...转载 2018-09-07 11:22:32 · 5959 阅读 · 0 评论 -
常见特征选择方法简要笔记
子集搜索,一般采用贪心算法:前向搜索,后向搜索,双向搜索子集评价,一般采用信息增益方法特征选择常用算法一般过程:1、生成子集:搜素特征子集,为评价函数提供特征子集2、评价函数:评价特征的好坏3、停止准则:与评价函数相关,一般是阈值。评价函数达到一定标准后就可停止搜索4、验证过程:在验证数据集上验证选出来的特征子集的有效性。 常见的特征选择方法:1、过滤式:过滤式...原创 2018-10-11 10:47:18 · 1092 阅读 · 0 评论