
成魔心酸路
一步一步走向大厂,我要进BAT,不要拦我
学习记录
我要成魔
达不刘。
展开
-
数据分析技能
分布图可视化方法python可视化48|最常用11个分布(Distribution)关系图 - pythonic生物人的文章 - 知乎 https://zhuanlan.zhihu.com/p/349365315原创 2021-04-27 20:07:43 · 186 阅读 · 0 评论 -
机器学习-支持向量机 2
线性支持向量机与软间隔最大化1.线性支持向量机线性可分问题是支持向量机学习方法,对线性不可分数据是不适用的。通常情况下,训练数据中有一些特异点,将这些特异点取出后,剩下的大部分的样本点组成的集合是线性可分的。线性不可分意味着不能满足硬间隔最大化约束条件,因此,可以对每个样本点引入一个松弛变量,使函数间隔加上松弛变量大于等于1,这样,约束条件变为 同时对每个松...原创 2020-08-04 15:42:17 · 473 阅读 · 0 评论 -
机器学习-支持向量机 1
1、线性可分支持向量机与硬间隔最大化1.1线性可分支持向量机 当训练数据集线性可分时,存在无穷个分类超平面。感知机利用误分类最小的策略,求得分类超平面;线性可分支持向量机利用间隔最大化求最有分离超平面,此时解是唯一的。1.2函数间隔和几何间隔函数间隔:在超平面确定的情况下,能够相对的表示点距离超平面的远近,的符号与类标记的符号是否一致表示分类是否正确。所以表示分类的正确性及确信度,称为函数间隔。函数间隔定义:对于给定的训练集,和超平面,定义超平面关于样本点的函数...原创 2020-08-04 10:28:47 · 329 阅读 · 0 评论 -
机器学习 - k-近邻模型
k-近邻法模型实际上对应于模型空间的划分。模型有三个基本要素:距离度量、值的选择、分类决策规则决定距离度量不同距离度量下得到的最近邻点是不同的。k值的选择值较小时,相当于较小的淋雨中的训练实例进行预测,学习的近似误差会减小,但是估计误差会增大,就是说只有输入详尽的训练实例才会对预测结果起作用。如果邻近的实例点恰巧是噪声,预测就会出错。这意味着整体模型变的复杂,容易发生过拟合。如果选择较大的值,其优点是可以减小学习的估计误差,缺点是近似误差会增大,与输入实例较远的(不相似...原创 2020-08-02 17:02:06 · 562 阅读 · 0 评论 -
机器学习-决策树
一种基本的分类与回归的方法定义在特征空间与类空间上的条件概率分布训练时,利用训练数据,根据损失函数最小化的原则建立决策树模型节点分为两种,内部节点和叶节点:内部节点表示一个特征,叶节点表示一个类决策树算法:特征选择—>决策树生成—>决策树剪枝决策树的生成只考虑局部最优,决策树的剪枝考虑全局最优。决策树常用的有三种:ID3、C4.5、CART特征选择特征选择在于选取对训练数据具有分类能力的特征。特征选区的准则时信息增益或信息增益比。信息增益:..原创 2020-07-22 21:07:33 · 623 阅读 · 0 评论 -
SQL 4
查询课程编号为“0001”的课程比“0002”的课程成绩高的所有学生的学号select a.学号from (select 学号,成绩 from score where 课程号='0001') as a inner join (select 学号,成绩 from score where 课程号='0002') as b on a.学号=b.学号where a.成绩=b.成绩原答案:select a.学号from (select 学号,成绩 from score where 课程号='.转载 2020-07-18 12:39:42 · 410 阅读 · 0 评论 -
机器学习笔记-Logistic
在跟着李航的统计学方法学习大多数情况下,概率密度函数f(x)就是分布函数F(x)的导数概率密度:考虑一个密度分布不均匀的小球,总质量为1,概率密度就相当于这个小球某处的密度,值是可以大于1的,但是这个密度乘以体积所得的质量(也就是概率)是恒小于等于1的。然后至于概率密度越大的点,说明单位体积落在该点的质量越大(也就是发生这个点附近事件的概率越大)。(这是看了别人的一个比较通俗易懂的解释)似然函数:有一定样本的数据集,取到每个样本都有一定的概率,似然函数为取到这一组样本值的概率的大小.原创 2020-07-20 15:25:12 · 483 阅读 · 0 评论 -
SQL 3
多表连接检索"0001"课程分数小于60,按分数降序排列的学生信息:select a.学号,a.姓名,b.成绩from student as a inner join score as b on a.学号=b.学号where b.课程号='0001' and b.成绩<60order by b.成绩 desc查询不同老师所教不同课程平均分从高到低显示with tmp as (select course.*,teacher.教师姓名from course inner join t转载 2020-07-17 12:41:52 · 215 阅读 · 0 评论 -
面试中遇到的问题,仅做记录
面试了滴滴的一个职位,sql答得屎一样,到最后,加上没有过统计学的基础。。。有一个sql题是这样的,一串有序时间点,要找出每两个相邻的时间点的间隔时间最大的间隔了多少先写在这里,后面再找答案去...原创 2020-07-16 22:27:46 · 159 阅读 · 0 评论 -
SQL 2
汇总分析查询学生的总成绩并进行排名:select 学号,sum(成绩) as 总成绩from scoregroup by 学号order by 总成绩查询平均成绩大于60分的学生的学号和平均成绩select 学号,avg(成绩) as 平均成绩from scoregroup by 学号having 平均成绩 >60 3.复杂查询查询所有课程成绩小于60分学生的学号、姓名我的答案:select 学号,姓名from studentwhere 学号 n.转载 2020-07-16 22:22:27 · 438 阅读 · 0 评论 -
SQL 1
创建四个表并添加数据student:insert into student(学号,姓名,出生日期,性别) values('0001' , '猴子' , '1989-01-01' , '男');insert into student(学号,姓名,出生日期,性别) values('0002' , '猴子' , '1990-12-21' , '女');insert into student(学号,姓名,出生日期,性别) values('0003' , '马云' , '1991-12-21'转载 2020-07-15 18:43:44 · 723 阅读 · 0 评论