自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(5)
  • 资源 (27)
  • 收藏
  • 关注

原创 学习率的其他优化方法

动量法:SGD方法的一个缺点是,其更新方向完全依赖于当前的batch,因而其更新十分不稳定。 momentum即动量,它模拟的是物体运动时的惯性,即更新的时候在一定程度上保留之前更新的方向,同时利用当前batch的梯度微调最终的更新方向。这样一来,可以在一定程度上增加稳定性,从而学习地更快,并且还有一定摆脱局部最优的能力

2022-05-04 12:13:22 764

原创 学习率问题

学习率 ,如果设关于学习率的函数为 ,因为是要求 的最小值,所以 ,如果 可导,则最小值处 , 而对于 ,因此若存在一个足够大的 使得 ,则必定存在一个合适 的使得 ,此时就是我们要找的学习率;因此 可以先设置一个初始的 ,再进行搜索(可以使用折半查找),找到 异号的位置; Armijo法则:只要所使用的学习率使得函数的减小程度小于给定的值即可; 学习率优化的方法: 1.线性搜索:可以先设置一个初...

2022-03-11 18:30:48 432

原创 softMax的损失函数

K分类,第k类的参数为 ,那么,神经网络中softmax层其实是一个线性网络,所以有这个 ;则概率 , 因此概率密度为: 因此最大似然函数为: 这其实是交叉熵的相反数,对最大似然函数取最大值就是对交叉熵取最小值。上式中的 其实在同一个样本中只有一个为1; 和逻辑斯蒂回归有一样的形式。 对于下式y是标签, 是输出预测值。假设y=[0,1,0,0],=[0.3,0.4,0.1,0.2] 单个训练样本损失函数 ...

2022-03-11 18:14:18 1404

原创 逻辑斯蒂回归

对数回归就是逻辑斯蒂回归,log 逻辑斯蒂回归使用sigmod函数: 逻辑斯蒂回归的损失函数为什么选择使用最大似然函数的方式?这就和最大似然估计的定义有关了,用参数估计的方式来使得出现当前情况的概率最大。并且这个不是损失函数,就是参数估计。梯度下降方法使得误差最小,注意逻辑斯蒂回归的代价函数是和线性回归不同的。为什么选择特殊这个代价函数,其实都是从似然回归得来的。 逻辑斯蒂回归最大化似然函数: ,其实就是最小化交叉熵:,Softmax的损失函数也是对应的; 逻辑斯蒂回归代价函数的由来:

2022-03-11 18:12:15 1159

原创 线性回归损失函数推导

线性回归的最大似然方法就是求似然函数 的最大值。 ,其中 为误差,一般来说服从均值为0的高斯分布;而高斯分布的概率密度为: ,因此 ,从而求似然函数 的最大值,就是求 的最小值; ...

2022-03-11 18:10:01 1533

贪心 算法

贪心算法,能够很大地减少我们程序的复杂度

2008-06-03

程序的回溯法

程序的回溯法,能够减少复杂度

2008-06-03

多线程编程的入门指导

多线程编程的入门指导,多线程是个好方法啊

2008-06-03

递归与分治策略

递归与分治策略,我们解决问题的好方法

2008-06-03

动态规划 dp

动态规划 dp,经常使用的方法

2008-06-03

pku acm 1011

pku acm 1011我自己一步一步的调试,提交,最后终于成功了

2008-06-27

表示学习知识图谱的实体对齐算法.pdf

知识图谱,事理图谱,事件推理

2021-08-03

基于CNN和深层语义匹配的中文实体链接模型.pdf

知识图谱,事理图谱,事件推理

2021-08-03

基于注意力机制的问句实体链接.pdf

知识图谱,事理图谱,实体链接

2021-08-03

餐饮娱乐领域知识图谱构建和应用.pdf

知识图谱,事理图谱,实体链接

2021-08-03

知识图谱在小米的落地与挑战.pdf

知识图谱,事理图谱,小米

2021-08-03

腾讯优图医疗AI的研发与落地.pdf

知识图谱,事理图谱,腾讯

2021-08-03

基于事理图谱的事件演绎与反绎.pdf

基于事理图谱的事件演绎与反绎:知识图谱,事理图谱,事件推理

2021-08-03

VC 文件传输 多线程

局域网与广域网内实现文件传输,一个服务端能就收多个客户端,服务端能同时发送文件给多个客户端,客户端也能发送文件给服务端。多线程

2013-07-03

爱奇艺自然语言处理和视频大数据分析应用.pdf

知识图谱,事理图谱,爱奇艺

2021-08-03

逻辑斯蒂回归模型,java

逻辑斯蒂回归模型 java 代码 ,代码可直接运行

2014-09-01

SVM模型 java代码

SVM模型 java代码 工程可直接运行

2014-09-01

VC编写 自动升级本地程序

VC编写 自动升级本地程序,并自动替换本地程序

2013-07-03

The Art of Computer Programming

The Art of Computer Programming

2008-03-19

朴素贝叶斯分类器(java实现)

朴素贝叶斯分类器(java实现),太高级了,是文本分类的

2014-09-01

汇编语言教程(assembly language)

经典教程,汇编语言,很好的东西

2008-04-13

lucene.jar

lucene.jar 包含分词等 导入后直接可用

2014-09-01

Java_api

Java_api,帮助我们更好地使用JAVA

2008-06-03

算法设计技巧与分析中文版Alsuwaiyel

算法设计技巧与分析中文版,沙特人 Alsuwaiyel .专业课老师爱用的教材

2013-07-03

pku acm 1009

pku acm 1009,report

2008-06-03

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除