
机器学习
文章平均质量分 55
qq_27931977
这个作者很懒,什么都没留下…
展开
-
线性回归和梯度下降讲解与代码
本文也是根据吴恩达机器学习课程作业的答案。回归:预测值是连续的; 分类:预测值是离散的;建模误差:预测值与实际值之间的差距;目标:选择模型参数,使得建模误差的平方和能够最小,即代价函数最小;代价函数:选择平方误差函数,是解决回归问题最常用的手段;代价函数是帮助我们选择最优的参数的方法,即设定标准为参数使得建模误差最小;梯度下降:用来求函数最小值的算法,它背后的思想是,开始时随机...原创 2018-10-07 20:12:32 · 435 阅读 · 0 评论 -
决策树讲解和代码
决策树最关键的两个部分:1.面对一个实际的数据集,如何构建出一棵树 2.构建树的过程中,树分裂节点时,如何选择出最优的属性作为分裂节点。算法就是为了选出最优的属性。为什么要选择最优的属性,是因为不同的属性排列组合导致的算法能力的好坏不一样。决策树包含:根节点(样本全集)、叶节点(决策结果)、内部节点(属性测试)划分选择的决策树算法有:ID3(信息增益)、C4.5(增益率)、CART(基...原创 2018-10-09 16:17:38 · 250 阅读 · 0 评论 -
SVM的讲解和代码
支持向量机,因其英文名为support vector machine,故一般简称SVM,通俗来讲,它是一种二类分类模型,其基本模型定义为特征空间上的间隔最大的线性分类器,其学习策略便是间隔最大化,最终可转化为一个凸二次规划问题的求解。两个主要内容:1.原始公式怎么由实际问题产生;2.原始问题到对偶问题的数学推导;分类最基本的想法就是基于训练集的样本空间找到一个平面(划分超平面),...原创 2018-10-19 16:11:04 · 1164 阅读 · 0 评论 -
逻辑回归的讲解和代码
逻辑回归模型是由以下条件概率分布表示的分类模型。逻辑回归模型源自逻辑分布,其分布函数使S形函数;逻辑回归:用于分类问题中,预测值为离散值;算法的性质是输出值永远在0和1之间;逻辑回归的模型假设:,h(x)的作用:对于给定的输入变量,根据选择的参数计算输出变量=1的可能性,代价函数:梯度下降算法:高级优化算法:共轭梯度法、BFGS变尺度法、L-BFGS限制变尺...原创 2018-10-23 17:26:14 · 681 阅读 · 0 评论 -
各种书籍免费下载地址(持续更新中)
机器学习类《百面机器学习算法工程师带你去面试》https://pan.baidu.com/s/1mHdV0VXcfJxpOrdALRPuCAC++类C++程序设计原理与实践 链接: https://pan.baidu.com/s/1KQr_pVtc1hvOUhzx_6RHPQ 提取码: vcvqProgramming Principles and Practice Usin...原创 2019-02-25 09:48:05 · 5068 阅读 · 0 评论 -
Anaconda安装xgboost
conda install -c anaconda py-xgboost原创 2019-05-14 19:49:14 · 1868 阅读 · 0 评论 -
将dataframe中的某一行提取出来放到另一个dataframe中
因为训练集和测试集的特征是放在一个文件中的,所以需要把训练集的特征提取出来。最后才想到直接使用dataframe中的append方法,它的参数如下,可以传入dataframe,series,dict,Parameters: other:DataFrame or Series/dict-like object, or list of these The data t...原创 2019-05-30 17:14:46 · 18140 阅读 · 0 评论 -
Pandas 基本操作
Table of Contents创建 DataFrame读取整列读取整行删除行或列统计行/列名统计缺失值缺失值处理赋值上下合并(连接)数据集classpandas.DataFrame(data=None,index=None,columns=None,dtype=None,copy=False)Parameters: da...原创 2019-05-31 16:49:07 · 188 阅读 · 0 评论