da_journeyer
这个作者很懒,什么都没留下…
展开
-
01基本概念
在单元格模式下,第一行语句(与魔法命令在同一行的语句)为设置(初始化)语句,作用是可以用来定义变量供后续的代码使用。在单元格模式下,第一行语句(与魔法命令在同一行的语句)为设置(初始化)语句,作用是可以用来定义变量供后续的代码使用。但是,因为魔法命令具有最低的优先级,这意味着,但魔法命令与我们定义的命名冲突时,优先选择的是自定义的名称。因此,建议:当使用魔法命令时,总是使用%前缀。当automagic处于开启状态,如果我们定义了与魔法命令相同名称的变量(或方法,类)时,访问的将是我们自定义的名称。原创 2023-03-23 13:33:27 · 300 阅读 · 0 评论 -
01_机器学习概述
人工智能(Artificial Intelligence)是计算机科学的一个分支,目的是让计算机能够像人一样,对外界的环境做出反应。而机器学习,正是实现人工智能的一种方式。原创 2023-03-23 12:14:41 · 157 阅读 · 0 评论 -
02_线性回归
线性回归是回归分析的一种,评估的自变量X与因变量Y之间是一种线性关系。当只有一个自变量时,称为一元线性回归,当具有多个自变量时,称为多元线性回归。原创 2023-03-23 12:07:53 · 1710 阅读 · 0 评论 -
03_过拟合与欠拟合
拟合指的是构建的模型能够符合样本数据的特征。与拟合相关的两个概念是欠拟合与过拟合。欠拟合:模型过于简单,未能充分捕获样本数据的特征。表现为模型在训练集上的效果不好。- 过拟合:模型过于复杂,过分捕获样本数据的特征,从而将样本数据中一些特殊特征当成了共性特征。表现为模型在训练集上的效果非常好,但是在未知数据上的表现效果不好。原创 2023-03-23 12:04:31 · 317 阅读 · 0 评论 -
04_梯度下降
梯度是一个向量,表示函数在某一点处的方向导数。可以通过梯度指引的方向,进而求解函数的极值。过程为:1. 设定一个初始坐标点。2. 求解该坐标点的梯度值。3. 根据梯度值指定的方向,前进一段距离,更新坐标值。4. 重复步骤2-3,直到迭代到指定的次数,或者连续迭代两次的y值小于指定的阈值为止。原创 2023-03-23 09:33:44 · 84 阅读 · 0 评论 -
05_逻辑回归
逻辑回归是一个分类算法。其优点在于,逻辑回归不仅能够进行分类,而且还能够获取属于该类别的概率。这在现实中是非常实用的。例如,某人患病的概率,明天下雨的概率等。逻辑回归实现分类的思想为:将每条样本进行“打分”,然后设置一个阈值,达到这个阈值的,分为一个类别,而没有达到这个阈值的,分为另外一个类别。对于阈值,比较随意,划分为哪个类别都可以,但是,要保证阈值划分的一致性。原创 2023-03-23 09:31:39 · 153 阅读 · 0 评论 -
06_KNN
KNN(k-nearest neighbor),即K近邻算法。K近邻就是K个最近的邻居,当需要表示一个样本(值)的时候,就使用与该样本最接近的K个邻居来决定。KNN既可以用于分类,也可以用于回归。KNN算法的原理在于,样本映射到多维空间时,相似度较高的样本,其距离也会比较近,反之,相似度较低的样本,其距离也会比较远。我们可以将该算法理解为“近朱者赤,近墨者黑”。原创 2023-03-23 09:26:33 · 174 阅读 · 0 评论 -
07_决策树
决策树是一种非参数监督学习方法,用于分类与回归。 目标是创建一个模型,从数据特征中进行学习,进而推断出的简单决策规则,用来预测目标变量的值。决策树是一种树形结构,通过做出一系列决策(选择)来对数据进行划分,这类似于针对一系列问题进行选择。决策树的决策过程就是从根节点开始,测试待分类项中对应的特征属性,并按照其值选择输出分支,直到叶子节点,将叶子节点的存放的类别作为决策结果。原创 2023-03-23 08:37:02 · 184 阅读 · 0 评论 -
08_集成学习
集成学习(集成方法)是一种解决问题的思想(不是具体的算法)。操作为将若干个基本评估器(分类器&回归器)进行组合,然后使用这些基本评估器来综合对未知样本进行预测。通过这种“集思广益”的行为,比起使用单个基本评估器进行预测,集成学习具有更好的泛化能力与稳健性。原创 2023-03-23 08:28:27 · 115 阅读 · 0 评论