
机器学习
flyf000
这个作者很懒,什么都没留下…
展开
-
【机器学习笔记1】模型评估与线性学习
(先吐槽一下,csdn不输入密码的情况下,他的登录按钮就是灰色的,ctmd反人类的设计我看到那个灰按钮掉头就想走,谁知道他那个按钮不是不是有效。。。太沙雕了。导致最近学的东西都没往上放TAT虽然学的不多) 1.模型评估常用方法:我们已经剖析了模型评估的难解之处:模型在训练集数据上的误差不能反映其在新数据集上的误差情况。为了更好地估计模型在新数据集上的错误率,我们必须使用更复杂的方法,两...原创 2019-02-15 11:06:42 · 795 阅读 · 0 评论 -
【数据挖掘】weka平台的导入编码导致报错
weka平台默认的编码格式是cp1252,所有的中文都会变成乱码,所以在weka软件中找到runweka文件修改编码格式为gbk(utf-8也不行),如果没有管理员权限就百度一下手动添加。而输入进去的arff文件必须是ansi编码的,其他任何方式的都会导致不识别,报错“unable to determine structure as arff...”...原创 2019-02-21 18:05:39 · 1015 阅读 · 0 评论 -
【机器学习笔记2】ID3决策树学习
个人决策树学习两个难点:1.如何度量样本集合不确定度(纯度)以安排节点。2.如何实现信息的存储和有效利用。决策树学习(ID3)的重点其实是分类的思路,但是很多博客都写的很详细了便不再叨述,大体就是通过统筹分类建立一个多叉树,通过多个标签属性查找,来实现新样本数据的分类工作。而解决最开始说的两个问题只需明确一下几点。1.信息熵与信息增益1.1 概念(1)信息熵熵描述得是...原创 2019-02-18 18:00:58 · 346 阅读 · 0 评论 -
【机器学习笔记4】Octave(CLI)简易教程
零碎:1. hist(w)输出矩阵图形化数据直方图。2. PS1('>> ');能把前面octave版本号去掉。3. 末尾加;能使程序不执行例行输出。4.pwd工作区路径ls工作区目录查询矩阵:1. 对于A=[1 2; 3 4; 5 6] ,size(A)输出其行 列(即 3 2),size(A,1)输出3;而length将输出max(3,2),适用对象一般...原创 2019-03-30 12:39:59 · 1092 阅读 · 0 评论 -
【机器学习笔记3】多元线性回归的求解
这里主要理解一下代价函数,梯度下降,正规方程。(此文为难点的记录和理解,作为跟学教程来看显然是不可取的)假设有训练样本(x, y),模型为h,参数为θ。h(θ) =θTx(θT表示θ的转置)。关于代价函数J(θ)(如下图),目前的理解就是预测值和实际值之间的差值,这个差值越小越好,而实现这个差值优化最常用的方式就是梯度下降。这里的梯度就是代价函数J(θ)对θ1, θ2, ..., θ...原创 2019-03-28 17:02:53 · 742 阅读 · 0 评论