
DeepLearning
文章平均质量分 79
tianyunzqs
【纯干货分享,个人学习笔记】欢迎关注个人公众号:NLPer笔记簿
展开
-
bazel编译tensorflow源码
在安装完tensorflow CPU版本后,经常看到如下的警告,该警告虽说可以通过一些python语句来忽略(忽略方法),但总有点眼不见为净的感觉。Your CPU supports instructions that this TensorFlow binary was not compiled to use: AVX2 FMA该警告本质上是说由于机器的CPU支持AVX2的优化,但是安装的tensorflow包没有利用该优化。另一种解决该警告的方式是自己手动编译tensorflow安装包。自己手动原创 2021-05-08 19:30:56 · 7778 阅读 · 4 评论 -
tensorflow/serving部署keras模型
之前写了一篇tensorflow/serving部署tensorflow模型的文章,记录了详细的操作步骤与常见的错误及解决方案,具体见:TensorFlow Serving模型转换与部署本文主要记录tensorflow/serving部署keras模型过程中的一些重要步骤,以便后续查阅。我们在keras中保存模型通常用model.save或者model.save_weights函数。其中,model.save函数保存的模型往往比的是模型的结构与权重,而model.save_weights函数保存的仅仅原创 2021-04-30 14:46:15 · 509 阅读 · 0 评论 -
【踩坑记录】TypeError: can‘t pickle SwigPyObject objects
笔者利用keras训练模型时,当程序运行到保存模型model.save('model.h5')的时候,报如下错误TypeError: can't pickle SwigPyObject objects根据错误提示,可以看到在对模型进行序列化保存的时候,出现了不支持序列化的对象,也就是SwigPyObject对象。然而模型都可以跑通,但是为什么会在保存模型的时候报这样的错误呢?建模过程中也没有引入其他的算子啊,都是模型支持的操作,目前还未搞清楚,但是还是可以通过一种迂回的方法来解决该问题的。既然直接原创 2020-12-18 16:29:15 · 3356 阅读 · 1 评论 -
LSTM解决RNN梯度消失与梯度爆炸问题
<>St=δ(WSt−1+UXt)Ot=δ(VSt)S_{t} = \delta(WS_{t-1} + UX_{t}) \\O_{t} = \delta(VS_{t})St=δ(WSt−1+UXt)Ot=δ(VSt)原创 2019-11-26 15:09:17 · 2378 阅读 · 0 评论 -
深度学习(Deep Learning,DL)的相关资料总结
本文引用地址:http://blog.sciencenet.cn/blog-830496-679604.html 此文来自科学网彭勇博客,转载请注明出处。 有人认为DL是人工智能的一场革命,貌似很NB。要好好学学。0 第一人(提出者) 好像是由加拿大多伦多大学计算机系(Department of Computer Science转载 2015-07-19 12:29:03 · 2424 阅读 · 0 评论 -
分类问题中,常选择交叉熵损失函数而不是MSE损失函数
均方误差(Mean Square Error, MSE)损失函数:对求偏导(对求导类似):交叉熵损失函数: 对求偏导(对求导类似):ps:以上公式中,激活函数取sigmod激活函数参数更新过程:对比公式(2)和(4)可知:MSE损失函数在参数更新的过程会依赖激活函数的偏导数,当激...原创 2019-06-17 15:41:41 · 1037 阅读 · 0 评论