自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(8)
  • 收藏
  • 关注

原创 闭包与装饰器

标题闭包闭包闭包指延伸了作用域的函数。其中包含函数定义体中引用、 但是不在定义体中定义的非全局变量。 关键是它能访问定义体之外定义的非全局变量。通过这个特性可以做状态的记录比如对参数做记录。比如有个用类可调用化实现的函数avg()>>> avg(10)10.0>>> avg(11)10.5>>> avg(12)11.0class Averager():def __init__(self): self.series = []de

2020-07-25 17:48:23 303

原创 分类模型评估指标

目录准确率的局限性精确率(precision)和召回率(recall)PR曲线AUC参考准确率的局限性准确率=正类正类+反类准确率=\frac{正类}{正类+反类}准确率=正类+反类正类​准确率在一些特定的应用场景会有问题,比如在分类不均衡的分类中。比如在一个样本极不均衡的例子,想预测人群中患癌症的模型中,在训练样本时,1千个样本患癌症的人数为个位数,不患癌症的人数为990多人,在做其他操作...

2019-12-18 11:37:25 477

原创 RNN

背景RNN(循环神经网络) 相比其他类型的神经网络,rnn是由记忆的神经网络,会把之前的信息保存在网络中然后在之后的计算中反复使用。为什么会有这样的网络出现呢?在语言识别与自然语言处理中,输入的序列之间是有时间的联系的,或是说序列与序列之间是有联系的,比如文字处理中同一个词在不同的句子可能是不同的意思,这个时候就必须以这个词结合上下文关系来判别这个词的真正意思。比如一个语言识别的订票系统,输...

2019-11-29 15:36:35 262

原创 前馈神经网络

神经网络的引出逻辑回归得限制这里的逻辑回归所能做的分界线就是一条直线,没有办法将红蓝色用一条直线分开。没办法将红蓝色用一条直线分开特征转换可以将很多的逻辑回归接到一起,就可以进行特征转换。比如上图就用两个逻辑回归 对z1,z2z_1,z_2z1​,z2​ 来进行特征转换,然后对于 x1′,x2′x_1^{'},x_2^{'}x1′​,x2′​ ​ ,再用一个逻辑回归zz来进行分...

2019-11-22 14:45:00 990

转载 TF-IDF

#TF-IDFTF-IDF是Term Frequency - Inverse Document Frequency的缩写,即“词频-逆文本频率”。它由两部分组成,TF和IDF。前面的TF也就是我们前面说到的词频,我们之前做的向量化也就是做了文本中各个词的出现频率统计,并作为文本特征,这个很好理解。关键是后面的这个IDF,即“逆文本频率”如何理解。我们讲到几乎所有文本都会出现的"to"其词频虽...

2019-11-14 11:16:50 375

原创 正则项L1与L2的区别

定义L0范数指向量中非零元素的个数L1范数:向量中每个元素绝对值的和 ∣∣x∣∣1=∑i=1N∣xi∣||x||_1=\sum_{i=1}^{N}{|x_i|}∣∣x∣∣1​=∑i=1N​∣xi​∣L2范数:向量元素绝对值的平方和再开平方∣∣x∣∣2=∑i=1Nxi2||x||_2=\sqrt{\sum_{i=1}^{N}{x_i^2}}∣∣x∣∣2​=∑i=1N​xi2​​为什么需要正则...

2019-10-31 11:30:38 363

原创 决策树与随机森林

决策树模型简介决策树算法在机器学习中算是很经典的一个算法系列了。它既可以作为分类算法,也可以作为回归算法,同时也特别适合集成学习比如随机森林。决策树的学习通常包括3个步骤:特征选择、决策树的生成和决策树的修剪。决策树算法:ID3(利用信息增益对特征做选择),C4.5(利用信息增益率对特征做选择),CART(CART生成与CART剪枝)ID3算法ID3算法的特征选择与信息增益特征选择在于...

2019-10-17 16:38:30 606

转载 Adaboost总结

Adaboost总结回顾boosting算法的基本原理Adaboost算法的基本思路AdaBoost分类问题的损失函数优化(推导过程)AdaBoost二元分类问题算法流程Adaboost小结回顾boosting算法的基本原理    从图中可以看出,Boosting算法的工作机制是首先从训练集用初始权重训练出一个弱学习器1,根据弱学习的学习误差率表现来更新训练样本的权重,使得之前弱学习器1学...

2019-10-14 12:14:53 285

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除