- 博客(26)
- 收藏
- 关注
原创 梯度消失和梯度爆炸
可能原因:1、training sample中出现了脏数据,或输入数据未进行归一化2、学习速率过大,梯度值过大,产生梯度爆炸;3、在某些涉及指数计算,可能最后算得值为INF(无穷)(比如不做其他处理的softmax中分子分母需要计算exp(x),值过大,最后可能为INF/INF,得到NaN,此时你要确认你使用的softmax中在计算exp(x)做了相关处理(比如减去最大值等等));4、不当的损失函数(尤其是自定义的损失函数时);
2024-03-10 17:06:07
1035
原创 正则表达式
10分钟快速掌握正则表达式_哔哩哔哩_bilibilihttps://regex101.comananli案例:限定符used? ab*c ab+c ab{6}c ab{2,6}c ab{2,}c (ab)+或运算符、字符类a (cat|dog) [abc]+ [a-zA-Z0-9] [^0-9]+元字符\d \w \s \D \W \S . 任意字符 ^a a$贪婪匹配和懒惰匹配?<.*>贪婪
2022-04-09 09:52:03
684
原创 机器学习——梯度下降法&优化器
目录梯度下降方法:SGD,Momentum,AdaGrad,RMSProp,Adam概述批量梯度下降法(Batch gradient descent)随机梯度下降法(Stochastic gradient descent)小批量梯度下降在线学习映射化简和数据并行冲量梯度下降,Momentum:其他三种经典的梯度下降方法梯度下降方法:SGD,Momentum,AdaGrad,RMSProp,Adam参考链接:https://blog.csd...
2021-04-05 16:55:28
1890
原创 机器学习——机器学习项目ML解决方案
《Hands-On Machine Learning with Scikit-Learn and TensorFlow》https://book.douban.com/review/8814479/目录Machine Learning Project ChecklistFrame the Problem and Look at the Big PictureGet the DataExplore the DataPrepare the DataShort-List Promi
2021-03-28 19:37:25
352
原创 《数据挖掘与数据化运营实战》
《数据挖掘与数据化运营实战——思路、方法、技巧与应用》数据分析的核心能力综合体:商业理解、数据分析、商业应用思考产品经理:善于总结、善于提炼、善于推而广之、善于把自己的分析“产品化”。数据挖掘商业实践的有效成长之路:“以业务为核心、以思路为重点、以挖掘技术为辅助”...
2021-02-08 17:52:02
386
原创 深度学习-keras & Tensorflow
Kerashttps://keras.io/zh/https://keras-cn.readthedocs.io/en/latest/
2021-01-29 09:42:18
216
原创 横向扩展——项目管理基础
七嘴八舌的讨论:项目的目的是什么?目标、问题梳理!先搞定人、再搞定事搞定人:结构化倾听=接受事实+理解情绪+理解期待行为搞定事:谁提的问题 问题是什么 问题的优先级 需要的资源逻辑思辨能力——短期需求&长期需求、过渡方案常见错误前提假设:只能做一个吗?偷换概念如何融入新环境,Top3问题,比如,中心最重要的三个项目是什么?...
2021-01-14 12:16:47
132
原创 机器学习——无监督学习
《统计学习方法》基本思想方向:聚类、降维、话题分析、图分析。硬聚类:一个样本只能属于一个类,比如聚类算法 软聚类:一个样本可以属于多个类,比如条件概率分布模型概率模型估计假设训练数据由一个概率模型生成,同时利用训练数据学习概率模型的结构和参数。概率模型包括混合模型、概率图模型(有向、无向)。无监督学习的三要素模型、策略、算法。模型函数、条件概率分布。聚类——类别降维——低维向量概率模型估计——混合概率模型有向或无向概率图模型。策略...
2020-12-27 17:41:02
127
原创 通用技能——职场能力建设
推荐职场公众号https://www.zhihu.com/people/ke-pu-zi-xun-70那些真正厉害的员工,都懂得向上管理!https://zhuanlan.zhihu.com/p/337674580?utm_source=wechat_session&utm_medium=social&utm_oi=62530029037997670401 能证明你价值的人,都是值得被管理的对象关于向上管理的解释中,最为人接受的莫过于彼得·德鲁克的这句话:“任..
2020-12-20 12:49:50
407
2
原创 深度学习——常见问题
数据太少怎么搞深度学习?https://mp.weixin.qq.com/s/wn5XYtEguhXAasVx8M37pw在我们讨论利用有限的数据进行深度学习的方法之前,请忘了神经网络并创建一个简单的基准。尝试一些传统模型(如随机森林)通常不需要很长时间。这将帮助你评估深度学习的任何潜在提升,并深入理解在你的问题上深度学习与其它传统方法的权衡取舍。获取更多数据花时间和金钱来收集更多数据。实际上,这通常是你的最佳选择。不确定需要收集多少数据?尝试在增加数据时绘制学习曲线并查看模型性能.
2020-12-20 12:22:42
1001
1
原创 工程开发-DVC数据版本管理
数据版本管理DVC,data version controlhttps://zhuanlan.zhihu.com/p/112343018DVChttps://dvc.org/MLflowhttps://mlflow.org/datanamihttps://www.datanami.com/sacredhttps://github.com/IDSIA/sacred
2020-12-10 21:26:35
634
原创 数据不平衡问题
分类机器学习中,某一标签占比太大(标签稀疏),如何学习?https://www.zhihu.com/question/372186043/answer/1501948720?utm_source=wechat_session&utm_medium=social&utm_oi=625300290379976704
2020-12-09 09:47:22
2750
原创 机器学习面经
【机器学习基础】9 大主题!机器学习算法理论面试题大汇总https://mp.weixin.qq.com/s/1AOTv_bsQhPg3qEZpF6vxQ
2020-11-02 22:49:41
230
原创 机器学习——大数据平台/分布式机器学习框架
基于实时计算Flink的机器学习算法平台及场景介绍https://zhuanlan.zhihu.com/p/212316218?utm_source=wechat_session&utm_medium=social&utm_oi=625300290379976704
2020-11-02 22:48:53
425
原创 深度学习——深度神经网络结构
作者:FJODOR VAN VEEN参与:吴攀、李亚洲转载链接:https://mp.weixin.qq.com/s?__biz=MzA3MzI4MjgzMw==&mid=2650719170&idx=1&sn=68b6b7f87677f5287b6e5a306409653b&chksm=871b07bcb06c8eaa0a649d7d3fd7963423dd4ea51b6e7711bc63653a528fbf196566345ae064&scene=4#
2020-11-02 22:41:39
2360
1
原创 理论知识——数理统计
一个易用、易部署的Python遗传算法库https://zhuanlan.zhihu.com/p/192488077?utm_source=wechat_session&utm_medium=social&utm_oi=625300290379976704最大似然估计(MLE)、最大后验概率估计(MAP),与贝叶斯估计https://blog.youkuaiyun.com/u011508640/article/details/72815981...
2020-11-02 21:18:39
342
原创 机器学习——LR与理论基础
Logistic回归https://baozoulin.gitbook.io/-stanford-machine-learning/week-3/luojihuigui另一种更经典的解释损失函数什么是损失函数?参考链接:https://cloud.tencent.com/developer/article/1165263、https://zhuanlan.zhihu.com/p/58883095损失函数(loss function)是用来估量模型的预测值...
2020-11-02 21:18:01
328
原创 深度学习——batch normalization
参考链接:https://mp.weixin.qq.com/s/XPsRC6rC4_I9a-WPzOTSywTable of Contents什么是Batch Normalization它如何工作优点Batch Normalization的诅咒在使用小batch size的时候不稳定导致训练时间的增加什么是Batch Normalization在训练过程中,当我们更新之前的权值时,每个中间激活层的输出分布会在每次迭代时发生变化。这种现象称为内部协变量移位(IC..
2020-11-02 13:42:16
883
原创 深度学习——图神经网络
AI Lab】深度解析前沿方向:图深度学习的历史、最新进展和应用http://km.oa.com/group/33042/articles/show/439580?kmref=search&from_page=1&no=4
2020-11-01 23:21:42
179
原创 工程开发——web网络爬虫
python uget 自动爬虫selenium高级库的使用you-get# 金融数据(根据XPATH),一般情况用class name区分,复杂情况用xpath
2020-11-01 17:19:18
87
原创 GO 编程语言
Go语言学习点 gomod搭建开发环境 基础语法要熟悉 gin框架与公司的trpc-go框架 https://iwiki.woa.com/display/tRPC/tRPC-Go快速开始在真正开始之前,首先需要掌握基本理论知识,包括但不限于:Go语言基础,所有一切的基石,务必遵循tRPC-Go研发规范。 context原理,必须提前了解,特别是对超时控制的理解会很有帮助。 rpc概念,调用远程服务接口就像调用本地函数一样,能让你更容易创建分布式应用...
2020-10-09 17:21:36
1067
1
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人