- 博客(104)
- 收藏
- 关注
转载 RNN
循环神经网络是一种序列化的神经网络,它可以将已有的信息重复利用反向求导转载于:https://www.cnblogs.com/yinghuali/p/9283150.html
2018-07-09 11:57:00
189
转载 CNN
广泛应用于图像处理和图像识别等领域的一种多层神经网络卷积神经网络组成:传统BP网络存在的问题:1.权值太多,计算量太大 2.权值太多,需要大量样本进行训练卷积神经网络CNN: CNN的在于通过感受野和权值共享减少了神经网络需要训练的参数个数存在的问题:1.边缘过度不平滑 2....
2018-07-06 09:25:00
307
转载 孤立森林-iForest(Isolation Forest)-异常点检测
目的:对于无label数据,寻找异常数据孤立森林算法思想:1)用一个随机超平面来切割(split)数据空间(data space), 切一次可以生成两个子空间(想象拿刀切蛋糕一分为二)2)再继续用一个随机超平面来切割每个子空间,循环下去,直到每子空间里面只有一个数据点为止,直观上来讲,我们可以发现那些密度很高的簇是可以被切很多次才会停止切割,但是那些密度很低的点很容易很早...
2018-07-03 19:40:00
762
转载 打包与复制
tar -cvf data.tar datacp file1 file2cp –r file1 /user/file2转载于:https://www.cnblogs.com/yinghuali/p/9256046.html
2018-07-02 22:02:00
149
转载 后台运行.sh与python
nohup sh -x cancel_space.sh > 1.log 2>&1 &nohup python -u little.py > little.log 2>&1 &转载于:https://www.cnblogs.com/yinghuali/p/9256037.html
2018-07-02 22:01:00
378
转载 SVM
决策边界:支持向量机其实就是点集(正负类离超平面最近的点集)算法思想:1)求数据集到超平面间隔最小值 2)最小间隔最大化点到超平面距离:决策方程:优化目标:放缩变换:优化目标变为:求解过程:求解实例:低维度不可分解决办法:利用核函数将低纬数据映射到高纬度,超平面划分...
2018-07-02 19:03:00
90
转载 k-means聚类
算法流程:1) 随机指定k个点,将离k个点最近的一些点作为簇,划分k个簇2) 算法每个簇的中心点,继续迭代1),指导划分的簇不改变优缺点:K值确定:轮廓系数轮廓系数的值是介于 [-1,1] ,越趋近于1代表内聚度和分离度都相对较优转载于:https://www.cnblogs.com/yinghuali/p/9255278.html...
2018-07-02 18:48:00
119
转载 密度聚类DBSCAN
核心对象:圆内的点(条件:点数量大于等于设定阈值(minPts)的个数)阈值(minPts):圆的半径大小直接密度可达:点p在点q的圆内,且q是核心点,p-q是直接密度可达密度可达:若有一个点的序列q0、q1、...qk,对任意qi-qi-1是直接密度可达的 ,则称从q0到qk密度可达,这实际上是直接密度可达的“传播”。 边界点:属于某一个类的非核心点,不能发展下线了离群点:不属于任...
2018-07-02 18:18:00
106
转载 Adaboost
Adaboost(Adaptive Boosting 自适应增强的缩写)自适应表现及思路:前一个基本分类器分错的样本会得到加强,加权后的全体样本再次被用到来训练下一个基本分类器,同时,在每一轮中加入一个新的弱分类器,直达到某个预定的足够小的错误率或预先指定的最大迭代次数算法流程:1)初始化训练数据的权值分布,每个样本权值相同1/N3) 训练弱分类器(分类器可以是决策树,等等自...
2018-07-02 15:54:00
104
转载 xgboost
1) 如何防止过拟合加入惩罚项,惩罚项跟叶子结点个数,叶子结点权重平方和相关2) 基本原理:拟合残差的过程3) 目标函数如何求解:用泰勒展开式来近似原来的目标4) 建树过程及如何选择特征和特征值来作为分裂点定义好二阶可导的损失函数,遍历样本特征及该特征下的值,分别计算被该值作为分裂点后的Gain值,选择Gain值最大的该特征下的值作为分裂点来建树5)优缺点优点...
2018-07-02 15:46:00
155
转载 GBDT
算法思想:gbdt通过多轮迭代,每轮迭代产生一个弱分类器,每个分类器在上一轮分类器的残差基础上进行训练。对弱分类器的要求一般是足够简单,并且是低方差和高偏差的。因为训练的过程是通过降低偏差来不断提高最终分类器的精度1) GBDT如何选择特征gbdt的弱分类器默认选择的是CART TREE(回归)。其实也可以选择其他弱分类器的,选择的前提是低方差和高偏差,与CART TREE(回...
2018-07-02 14:00:00
145
转载 集成算法
概念:各种模型融合,结果取平均值或投票等项目经验:输出每个模型预测结果的情况,剔除预测效果差的模型(例如预测正样本比率是否符合原数据集正样本比率)Stacking(堆叠)模型:第一阶段最好交叉验证优点:使模型的边界更加平稳,效果更好,过拟合风险更低缺点:消耗时间大,不适合实时处理,只适合离线操作转载本博笔记须在文章明显处注明原文的链接和作者信息转载于...
2018-07-02 13:40:00
96
转载 随机森林
定义:随机森林是一个包含多个决策树的分类器, 并且其输出的类别是由个别树输出的类别的众数而定建树过程:随机性:1) 数据的随机性选取2)待选特征的随机选取待选特征:左决策树,右随机森林分裂特征:分裂特征(ID3算法,C4.5算法,CART算法等等)特征权重:破坏所有样本某个特征数据(0.1,0.2…),比较误差,误差相差很大,所以该特征重要优点:1)能够处理高纬度的数据,...
2018-07-02 13:11:00
175
转载 决策树
熵:表示随机变量不确定性度量 (X有n种取值)条件熵:表示已知随机变量X的条件下随机变量Y的不确定性 信息增益:g(D,A)=H(D)-H(D/A) 熵与条件熵之差(D可认为是label,H(D)认为label的熵,A认为是数据集其中一个feature)信息增益比:信息增益/条件熵(A特征信息增益/A特征下label条件熵),用于取值较多的特征基尼指数:表示不确定度量,基尼指数越大,...
2018-07-02 13:04:00
149
转载 逻辑回归
预测公式:损失函数(对数似然形式):该对数形式是应用极大似然估计法的到的公式需要对其求极大值求参数求导过程:参数更新:正则:L1(w绝对值和),L2(w平方和)优点:预测结果是界于0和1之间的概率,可以适用于连续性和类别性自变量,容易使用和解释缺点:容易欠拟合,分类精度可能不高逻辑回归损失函数如何求出的?应用极大似然估计法得出...
2018-07-02 12:55:00
95
转载 [1]栈,队列,链表
[1]栈,队列,链表栈(盘子)栈是一种特殊的列表,栈内的元素只能通过列表的一端访问,这一端称为栈顶。咖啡厅内的一摞盘子是现实世界中常见的栈的例子。只能从最上面取盘子,盘子洗净后,也只能摞在这一摞盘子的最上面。栈被称为一种后入先出(LIFO,last-in-first-out)的数据结构。由于栈具有后入先出的特点,所以任何不在栈顶的元素都无法访问。为了得到栈底的元素,必须先拿掉...
2017-11-12 21:07:00
124
转载 [24]SQL CREATE TABLE 语句
[24]SQL CREATE TABLE 语句CREATE TABLE 语句用于创建数据库中的表。表由行和列组成,每个表都必须有个表名。SQL CREATE TABLE 语法CREATE TABLE table_name(column_name1 data_type(size),column_name2 data_type(size),column...
2017-11-12 17:59:00
200
转载 [23]SQL CREATE DATABASE 语句
[23]SQL CREATE DATABASE 语句SQL CREATE DATABASE 语句CREATE DATABASE 语句用于创建数据库。SQL CREATE DATABASE 语法CREATE DATABASE dbname;SQL CREATE DATABASE 实例下面的 SQL 语句创建一个名为 "my_db" 的数据库:CREA...
2017-11-12 17:39:00
204
转载 [22]SQL INSERT INTO SELECT 语句
[22]SQL INSERT INTO SELECT 语句INSERT INTO SELECT 语句从一个表复制数据,然后把数据插入到一个已存在的表中。目标表中任何已存在的行都不会受影响。SQL INSERT INTO SELECT 语法我们可以从一个表中复制所有的列插入到另一个已存在的表中:INSERT INTO table2SELECT * FROM ta...
2017-11-12 17:36:00
83
转载 [21]SQL SELECT INTO 语句
[21]SQL SELECT INTO 语句通过 SQL,您可以从一个表复制信息到另一个表。SELECT INTO 语句从一个表复制数据,然后把数据插入到另一个新表中。SQL SELECT INTO 语法我们可以复制所有的列插入到新表中:SELECT *INTO newtable [IN externaldb]FROM table1;或者只复制希望的列...
2017-11-12 17:30:00
147
转载 [7]面向对象高级编程
[7]面向对象高级编程数据封装、继承和多态只是面向对象程序设计中最基础的3个概念。在Python中,面向对象还有很多高级特性,允许我们写出非常强大的功能。我们会讨论多重继承、定制类、元类等概念。使用__slots__正常情况下,当我们定义了一个class,创建了一个class的实例后,我们可以给该实例绑定任何属性和方法,这就是动态语言的灵活性。先定义class:&...
2017-11-12 00:10:00
92
转载 [20]SQL UNION 操作符
[20]SQL UNION 操作符SQL UNION 操作符合并两个或多个 SELECT 语句的结果。请注意,UNION 内部的每个 SELECT 语句必须拥有相同数量的列。列也必须拥有相似的数据类型。同时,每个 SELECT 语句中的列的顺序必须相同。SQL UNION 语法SELECT column_name(s) FROM table1UNIONSEL...
2017-11-11 22:10:00
48
转载 [19]SQL FULL OUTER JOIN 关键字
[19]SQL FULL OUTER JOIN 关键字FULL OUTER JOIN 关键字只要左表(table1)和右表(table2)其中一个表中存在匹配,则返回行.FULL OUTER JOIN 关键字结合了 LEFT JOIN 和 RIGHT JOIN 的结果。SQL FULL OUTER JOIN 语法SELECT column_name(s)FRO...
2017-11-11 21:40:00
86
转载 [18]SQL RIGHT JOIN 关键字
[18]SQL RIGHT JOIN 关键字RIGHT JOIN 关键字从右表(table2)返回所有的行,即使左表(table1)中没有匹配。如果左表中没有匹配,则结果为 NULL。SQL RIGHT JOIN 语法SELECT column_name(s)FROM table1RIGHT JOIN table2ON table1.column_name...
2017-11-11 21:28:00
100
转载 [17]SQL LEFT JOIN 关键字
[17]SQL LEFT JOIN 关键字SQL LEFT JOIN 关键字LEFT JOIN 关键字从左表(table1)返回所有的行,即使右表(table2)中没有匹配。如果右表中没有匹配,则结果为 NULL。SQL LEFT JOIN 语法SELECT column_name(s)FROM table1LEFT JOIN table2ON ta...
2017-11-11 20:36:00
117
转载 [16]SQL INNER JOIN 关键字
[16]SQL INNER JOIN 关键字INNER JOIN 关键字在表中存在至少一个匹配时返回行。SQL INNER JOIN 语法SELECT column_name(s)FROM table1INNER JOIN table2ON table1.column_name=table2.column_name;或:SELECT col...
2017-11-11 20:12:00
92
转载 [15]SQL 连接(JOIN)
[15]SQL 连接(JOIN)SQL join 用于把来自两个或多个表的行结合起来。SQL JOIN 子句用于把来自两个或多个表的行结合起来,基于这些表之间的共同字段。最常见的 JOIN 类型:SQL INNER JOIN(简单的 JOIN)。 SQL INNER JOIN 从多个表中返回满足 JOIN 条件的所有行。下面是选自 "Websites" 表的数据:+-...
2017-11-11 19:35:00
113
转载 [14]SQL 别名
[14]SQL 别名通过使用 SQL,可以为表名称或列名称指定别名。基本上,创建别名是为了让列名称的可读性更强。列的 SQL 别名语法SELECT column_name AS alias_nameFROM table_name;表的 SQL 别名语法SELECT column_name(s)FROM table_name AS alia...
2017-11-11 19:20:00
539
转载 [13]SQL BETWEEN 操作符
[13]SQL BETWEEN 操作符BETWEEN 操作符用于选取介于两个值之间的数据范围内的值。BETWEEN 操作符选取介于两个值之间的数据范围内的值。这些值可以是数值、文本或者日期。面是选自 "Websites" 表的数据:+----+--------------+---------------------------+-------+---------+|...
2017-11-11 11:09:00
132
转载 [12]SQL IN 操作符
[12]SQL IN 操作符下面是选自 "Websites" 表的数据:+----+--------------+---------------------------+-------+---------+| id | name | url | alexa | country |+----+-----------...
2017-11-11 00:54:00
82
转载 [11]SQL 通配符
[11]SQL 通配符通配符可用于替代字符串中的任何其他字符。SQL 通配符在 SQL 中,通配符与 SQL LIKE 操作符一起使用。SQL 通配符用于搜索表中的数据。在 SQL 中,可使用以下通配符:【演示数据库下面是选自 "Websites" 表的数据:+----+--------------+--------------------------...
2017-11-11 00:50:00
159
转载 [6]面向对象编程
[6]面向对象编程面向对象编程——Object Oriented Programming,简称OOP,是一种程序设计思想。OOP把对象作为程序的基本单元,一个对象包含了数据和操作数据的函数。面向过程的程序设计把计算机程序视为一系列的命令集合,即一组函数的顺序执行。为了简化程序设计,面向过程把函数继续切分为子函数,即把大块函数通过切割成小块函数来降低系统的复杂度。而面向对象的程...
2017-11-10 19:13:00
98
转载 [5]模块
[5]模块为了编写可维护的代码,我们把很多函数分组,分别放到不同的文件里,这样,每个文件包含的代码就相对较少,很多编程语言都采用这种组织代码的方式。在Python中,一个.py文件就称之为一个模块(Module)。你也许还想到,如果不同的人编写的模块名相同怎么办?为了避免模块名冲突,Python又引入了按目录来组织模块的方法,称为包(Package)。举个例子,一个abc...
2017-11-09 17:10:00
62
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人