自定义博客皮肤VIP专享

*博客头图：

点击选择上传的图片

格式为PNG、JPG，宽度*高度大于1920*100像素，不超过2MB，主视觉建议放在右侧，请参照线上博客头图

请上传大于1920*100像素的图片！

博客底图：

点击选择上传的图片

图片格式为PNG、JPG，不超过1MB，可上下左右平铺至整个背景

栏目图：

点击选择上传的图片

图片格式为PNG、JPG，图片宽度*高度为300*38像素，不超过0.5MB

主标题颜色：

RGB颜色，例如：#AFAFAF

Hover：

RGB颜色，例如：#AFAFAF

副标题颜色：

RGB颜色，例如：#AFAFAF

预览取消提交

自定义博客皮肤

-+

上一步保存

pzj636484的博客

原创学习率的其他优化方法

动量法：SGD方法的一个缺点是，其更新方向完全依赖于当前的batch，因而其更新十分不稳定。 momentum即动量，它模拟的是物体运动时的惯性，即更新的时候在一定程度上保留之前更新的方向，同时利用当前batch的梯度微调最终的更新方向。这样一来，可以在一定程度上增加稳定性，从而学习地更快，并且还有一定摆脱局部最优的能力

2022-05-04 12:13:22 764

原创学习率问题

学习率，如果设关于学习率的函数为，因为是要求的最小值，所以，如果可导，则最小值处，而对于，因此若存在一个足够大的使得，则必定存在一个合适的使得，此时就是我们要找的学习率；因此可以先设置一个初始的，再进行搜索（可以使用折半查找），找到异号的位置； Armijo法则：只要所使用的学习率使得函数的减小程度小于给定的值即可；学习率优化的方法： 1.线性搜索：可以先设置一个初...

2022-03-11 18:30:48 432

原创 softMax的损失函数

K分类，第k类的参数为，那么，神经网络中softmax层其实是一个线性网络，所以有这个；则概率，因此概率密度为：因此最大似然函数为：这其实是交叉熵的相反数，对最大似然函数取最大值就是对交叉熵取最小值。上式中的其实在同一个样本中只有一个为1；和逻辑斯蒂回归有一样的形式。对于下式y是标签，是输出预测值。假设y=[0，1，0，0]，=[0.3，0.4，0.1，0.2] 单个训练样本损失函数 ...

2022-03-11 18:14:18 1404

原创逻辑斯蒂回归

对数回归就是逻辑斯蒂回归,log 逻辑斯蒂回归使用sigmod函数：逻辑斯蒂回归的损失函数为什么选择使用最大似然函数的方式？这就和最大似然估计的定义有关了，用参数估计的方式来使得出现当前情况的概率最大。并且这个不是损失函数，就是参数估计。梯度下降方法使得误差最小，注意逻辑斯蒂回归的代价函数是和线性回归不同的。为什么选择特殊这个代价函数，其实都是从似然回归得来的。逻辑斯蒂回归最大化似然函数：，其实就是最小化交叉熵：，Softmax的损失函数也是对应的；逻辑斯蒂回归代价函数的由来：

2022-03-11 18:12:15 1159

原创线性回归损失函数推导

线性回归的最大似然方法就是求似然函数的最大值。，其中为误差，一般来说服从均值为0的高斯分布；而高斯分布的概率密度为：，因此，从而求似然函数的最大值，就是求的最小值； ...

2022-03-11 18:10:01 1533

贪心算法

贪心算法，能够很大地减少我们程序的复杂度

2008-06-03

程序的回溯法

程序的回溯法，能够减少复杂度

2008-06-03

多线程编程的入门指导

多线程编程的入门指导，多线程是个好方法啊

2008-06-03

递归与分治策略

递归与分治策略,我们解决问题的好方法

2008-06-03

动态规划 dp

动态规划 dp，经常使用的方法

2008-06-03

pku acm 1011

pku acm 1011我自己一步一步的调试，提交，最后终于成功了

2008-06-27

表示学习知识图谱的实体对齐算法.pdf

知识图谱，事理图谱，事件推理

2021-08-03

基于CNN和深层语义匹配的中文实体链接模型.pdf

知识图谱，事理图谱，事件推理

2021-08-03

基于注意力机制的问句实体链接.pdf

知识图谱，事理图谱，实体链接

2021-08-03

餐饮娱乐领域知识图谱构建和应用.pdf

知识图谱，事理图谱，实体链接

2021-08-03

知识图谱在小米的落地与挑战.pdf

知识图谱，事理图谱，小米

2021-08-03

腾讯优图医疗AI的研发与落地.pdf

知识图谱，事理图谱，腾讯

2021-08-03

基于事理图谱的事件演绎与反绎.pdf

基于事理图谱的事件演绎与反绎:知识图谱，事理图谱，事件推理

2021-08-03

VC 文件传输多线程

局域网与广域网内实现文件传输，一个服务端能就收多个客户端，服务端能同时发送文件给多个客户端，客户端也能发送文件给服务端。多线程

2013-07-03

爱奇艺自然语言处理和视频大数据分析应用.pdf

知识图谱，事理图谱，爱奇艺

2021-08-03

逻辑斯蒂回归模型,java

逻辑斯蒂回归模型 java 代码，代码可直接运行

2014-09-01

SVM模型 java代码

SVM模型 java代码工程可直接运行

2014-09-01

VC编写自动升级本地程序

VC编写自动升级本地程序，并自动替换本地程序

2013-07-03

The Art of Computer Programming

The Art of Computer Programming

2008-03-19

朴素贝叶斯分类器（java实现）

朴素贝叶斯分类器（java实现），太高级了，是文本分类的

2014-09-01

汇编语言教程（assembly language）

经典教程，汇编语言,很好的东西

2008-04-13

lucene.jar

lucene.jar 包含分词等导入后直接可用

2014-09-01

Java_api

Java_api，帮助我们更好地使用JAVA

2008-06-03

算法设计技巧与分析中文版Alsuwaiyel

算法设计技巧与分析中文版，沙特人 Alsuwaiyel .专业课老师爱用的教材

2013-07-03

pku acm 1009

pku acm 1009,report

2008-06-03

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示

确定要删除当前文章？

取消删除