- 博客(7)
- 收藏
- 关注
原创 net-tools与iproute的对比
如今许多系统管理员仍结合使用ifconfig、route、arp和netstat等命令行工具(它们统称为net-tools),管理和排查各种网络配置。这类工具原先起源于BSDTCP/IP工具箱,旨在配置老式Linux内核的网络功能。自2001年以后,它在Linux社区的发展就止步不前了。Arch Linux和CentOS/RHEL 7等一些Linux发行版已经弃用了net-tools,其他发行版计...
2019-05-20 11:09:07
312
原创 剑指offer题目:不修改数组找出重复的数字
没有在牛客网的OJ上找到这个题目所以写在博客里记录一下题目:在一个长度为n+1的数组里的所有数字都在1~n的范围内,所以数组中至少有一个数字是重复的。请找出数组中任意一个重复的数字,但不能修改输入的数组。例如,如果输入长度为8的数组{2,3,5,4,3,2,6,7},那么对应的输出是重复的数字2或者3.题目中说了不能改变输入的数组,那么方案一:可以创建一个长度为n+1的辅助数组,然后逐一把原...
2019-04-01 22:33:40
152
原创 关于《统计学习方法》中第三章构造kd树算法中的中位数问题
最近在看李航所著的《统计学习方法》,很不错的一本书。但在第三章构造平衡kd树时,原书中说的是“以T中所有实例的x(1)坐标的中位数为切分点”(p42),此处的中位数说法自认为不准确。根据随后给出的例3.2 给定一个二维空间的数据集:T={(2,3)T,(5,4)T,(9,6)T,(4,7)T,(8,1)T,(7,2)T}T={(2,3)T,(5,4)T,(9,6)T,(4,7)T,(8,1)...
2019-04-01 14:40:52
1231
1
原创 提升(boosting)方法基本思路
在PAC框架下,一个概念如果存在一个多项式的学习算法能够学习它,并且正确率很高,那么就称这个概念为强可学习的;一个概念如果存在一个多项式的学习算法能够学习它但正确率仅比随机猜测高一点,那么久城这个概念为弱可学习的。强可学习与弱可学习已被证明是等价的。这样一来,问题便成为,在学习中,如果已经发现了“弱学习算法”,能否将它提升为“强学习算法”。对于分类问题而言,给定一个训练样本集,求比较粗糙的分类...
2019-03-29 15:42:05
656
原创 CART生成算法
输入:训练数据集D,停止计算的条件;输出:CART决策树根据训练数据集,从根结点开始,递归地对每个节点进行以下操作,构建二叉决策树:(1)设结点的训练数据集为D,计算现有特征对该数据集的基尼指数。此时,对每一个特征A,对其可能取的每个值a,根据样本点对a的测试为“是”或“否”将D分为D1和D2两个部分,利用如下公式计算A=a时的基尼指数Gini(D,a)=|D1|/|D|*Gini(D1)...
2019-03-29 13:43:25
353
转载 决策树模型ID3/C4.5算法比较
两者都是决策树学习的经典算法一.ID3算法ID3由Ross Quinlan在1986年提出。ID3决策树可以有多个分支,但是不能处理特征值为连续的情况。决策树是一种贪心算法,每次选取的分割数据的特征都是当前的最佳选择,并不关心是否达到最优。在ID3中,每次根据“最大信息熵增益”选取当前最佳的特征来分割数据,并按照该特征的所有取值来切分,也就是说如果一个特征有4种取值,数据将被切分4份,一旦按某...
2019-03-28 12:10:16
1214
原创 数据库中的主键、外键和索引
一.主键、外键的定义若关系数据库中某一个属性组能唯一标识一条记录,则称该属性组为一个主键。比如学生表(学号,姓名,性别,班级)其中每个学生的学号是唯一的,学号就是一个主键课程表(课程编号,课程名,学分)其中课程编号是唯一的,课程编号就是一个主键成绩表(学号,课程号,成绩)成绩表中单一一个属性无法唯一标识一条记录,学号和课程号的组合才可以唯一标识一条记录,所以 学号和课程号的属性组是...
2019-03-28 10:56:03
213
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人