- 博客(336)
- 收藏
- 关注

原创 线下读书分享《自尊的六大支柱》
• 1、有意识地生活的实践活在当下,感知(看见 + 知晓 )周围真实的环境,别逃避。你清醒一点。• 2、自我接纳的实践面对真实的自己,理解自己为什么成了现在的你。和自己进入一个和谐的关系。• 3、自我负责的实践你要为自己的愿望、选择、价值观、行为、行动结果负责。没人会来拯救你。• 4、自我肯定的实践尊重自我的愿望、需求和价值观,并把愿望变成现实。• 5、有目的地生活的实践制定目标、采取行动、监控行为是否与目标一致、关注行动结果。• 6、个人诚信的实践。
2024-04-07 11:26:04
874

原创 回顾2023年及过去五年的成长经历
结合工作实践、应用经验,总结好用的方法、联想、提炼、升华方法论,并牢记和复用。成功的经验很重要。失败的经验、痛苦的经验更重要。
2024-02-04 16:03:54
1356

原创 tf.keras官方API文档框架理解
最近看tensorflow2官方API文档,尤其是tf.keras API文档,梳理下其框架,形成脑图,方便自己记忆,也有助于形成一张相互关联的知识图。如下:
2021-07-23 16:06:54
670

原创 学习TensorFlow的过程和经验总结
近日学习使用TensorFlow搭建神经网络建模终于取得了一些微小的成绩:1、学会了使用Squential \ class 搭建神经网络模型2、学会了使用compile来配置模型训练方法,如损失函数、优化器、准确性评价方法3、学会了一些经典的神经网络模型的实现方法4、学会了各优化器的作用和效果5、学会了搭建神经网络进行训练和学习的整体框架和步骤其实,我学习TensorFlow不止一两周了。我是从今年的2月份就开始学习了。当时报名了一个天池的算法比赛,需要使用CNN和RNN模型进行建模,所以
2021-07-22 21:27:28
2067
8

翻译 理解LSTM模型
写在前面:这是翻译自colah的一篇博客,原文关于LSTM神经网络模型的理解写的非常直观、简单易懂,所以翻译过来帮助大家学习理解LSTM模型。当然我不是按照原文一字不落的翻译,而是摘出其中对模型理解最有帮助的部分,然后用我自己理解的方式和语言来写的博文。这是我翻译博文的一贯做法。有兴趣的可以自行去看原文,比较简短,原博客地址:http://colah.github.io/posts/2015-08-Understanding-LSTMs/一、循环神经网络RNNRNN循环神经网络使用循环核来实
2021-06-22 23:29:37
10178
3

转载 【转】王兴饭否190条思考【世界观、人生观、价值观】
101.对三观的不同排序可能反映了人的不同思维模式。我理解的排序是:世界观、人生观、价值观。转自 《同样是技术出身,深夜看完王兴饭否的190条思考,越想越后怕!》作者l王兴 编辑| 易小飒来源l进击的阿秀(ID:zchxuexi)整理自王兴饭否版权申明:内容来源网络,版权归原创者所有。除非无法确认,都会标明作者及出处,如有侵权,烦请告知,会立即删除并致歉。谢谢!知乎上有个问题:王兴是不是被高估了?有个高赞回答说,王兴是真正值得学习的对象,作为身家 200...
2021-05-02 19:52:59
1014

原创 10、《Spark高阶用法之机器学习》笔记
写在前面:在本分类专栏下的1-9翻译文章,和两篇sparkUDF的文章都是属于spark的常规低阶的用法,基本能满足日常的分析功能了。但是这些基本用法并没有涉及、也无法满足机器学习建模的需求。比如拆分特征向量和目标向量,比如生成特征向量,比如使用分类或回归模型,比如使用深度学习模型等....所以,从这篇文章开始,我们开始学习spark的高阶用法,即spark用于机器学习、深度学习。注意要结合官方文档学习,里面有非常详细的API说明和代码示例,非常有助于理解和实践应用。也是日后工作时常备的
2021-04-05 22:48:44
231
1

原创 3、学会在人生需要做选择的时刻去做选择,而不是去怀疑当初选择的对错
不需要怀疑当初的选择是对是错。为什么当时的那个选择会成为你现在心心念念责怪或感恩的对象?当时的你为什么会面临选择?驱动你作出选择的生活原因、心理原因又都是什么?当时的选择有给你带来过高光吗?有让你觉得幸福过吗?既然有,那就不要怀疑当初的选择是对是错。它确实拯救了你,给你带来了幸福。而且我更可以肯定的是,当时的你并没有你现在想象中的那么多选择,你当时应该只有这一条路可以走而已。不信你看看你现在的境况,是不是也没有那么多选择?选择不仅仅是口头上的,更是实际行动产生出可评价结果的。你看看自己有
2021-03-12 16:23:06
1028
2

转载 【转】如何让技术想法更容易被理解?【费曼4步学习法】
转载文章,原文来自阿里云云栖号,地址:https://mp.weixin.qq.com/s/TXX7OTnxa8iiENMOJr3-cQ我这里是对原文的摘录,删掉了一些内容,只保留了我觉得有收获的地方。原文采用的是一种很经典的写作手法。(我忘记叫什么了,姑且叫做三段式、小故事、或者Q&A的写作手法吧~~)首先,描述一个故事,引出一个问题。其次,就该问题指出应该要做的心态和方法的转变。最后,给出一个可行的行动方法或方式。所以,我摘录的时候几乎舍弃了全部的故事描述,或者仅用一句话来总..
2021-02-03 17:54:36
268

转载 【转】阿里毕玄:提升代码能力的4段经历【无它就是实干】
对于程序员而言,我始终认为代码是展现能力的关键。一个优秀程序员写的代码,和一个普通程序员写的代码是很容易看出差别的,代码是展示程序员硬实力的名片。如何提升写代码的能力,始终是一个关键的话题,不过很遗憾这篇文章其实也不是讲具体的步骤、银弹方法、武功秘籍什么的,这篇文章讲讲我自己印象中,对我写代码能力提升比较大的四段经历,也许可供参考。第一段:第一次感受每天亿级系统的挑战2008年,HSF的第二个版本,在当时淘宝最重要的交易中心上线,上线当天造成淘宝网站访问巨慢,交易类的页面几乎打不开,最后..
2021-01-29 11:30:02
237

转载 【转】Elon Musk 【带着目标学习、第一性原理思维,不去追逐平庸的机会,切身感受“追逐的力量”】
以下文章为转载摘录,作者云游小生最近,世界首富换人了!由于特斯拉股票疯狂暴涨,马斯克成了妥妥的新一届全球首富。同时,钟睒睒也力压印度首富安巴尼(Mukesh Ambani),晋身亚洲新首富。网上有媒体称,世界首富和亚洲首富一个卖车一个卖水!但其实这两人能够登上首富的宝座,早已不只是卖车和卖水的事情了。马斯克背后还有 Spacx、The Boring Company、Neuralink;钟睒睒背后还有万泰生物、养生堂等。但马斯克成为世界首富,给我们带来的启发更大,不..
2021-01-18 00:09:13
1106
1

转载 【转】技术人如何加速成长?提升你的思维和学习方式【思想上勤奋、借事修人、第一性原理、结构化思维/金字塔原理、复盘、解构和重组】
原创涵爸阿里技术收录于话题 #技术人成长之路阿里妹导读:每个人都会经历一个新人的阶段,不管是初入职场,还是到一个新的工作环境。作为技术新人,我们常常会面临哪些困惑?普通人和非凡人的差异在哪里?除了体力上的勤奋,还有哪些方法可以加速成长?本文从第一性原理、结构化思维和多维度思考等方面分享如何从思维深度上提升自己,分享关于技术人成长之道的心得体会。一 摘要阿里优秀的人很多,他们身上共同的特质是什么?让我最佩服的是思考力强的人,对事情有深入洞见和观点的人。大多数人还停留在表面看...
2021-01-10 22:56:56
719

原创 2020年我是这么走过来的【目标和渴望、工具和效率、复盘和总结、做人和做事】
2020年很快就过去了。今年对于国家、世界发生了很多大事,对于我个人同样也发生了很多意义非比寻常的事情。2020年,确切地说是2019年的9月-2020年的12月,这一年零四个月的时间对于我来说是非常宝贵的一段人生经历。我满身疲倦的从前家公司离职,全身心地投入到自己喜欢的事情当中。经历无数彻夜奋战,经历了废寝忘食的努力,又经历了社会残忍的拒绝和鞭笞,一次次地失败、一次次的丧、之后又是一次次地爬起来。就在这样普通的日子中,我完成了很多认知上的转变,收获了很多专业上的知识。我放下了一些执念,放下了一些虚妄的
2021-01-10 22:37:40
321
1

转载 【转】机器学习必读TOP 100论文清单:高引用、分类全、覆盖面广丨GitHub 21.4k星
想要入门机器学习,奈何领域的新论文太多,不知道该看哪一篇?自2017年以来,超越SOTA的方法天天有,但往往针对性非常强,不一定是颠覆机器学习圈的重要成果。又回到了熟悉的话题:要想入行,还得看高引用经典论文。这里整合了2012年到2016年的高引TOP 100论文,引用量要求随着年份递减而递增,Hinton、Bengio、何恺明等大牛的论文都在其中,一起来看看吧:清单列表理解、泛化、迁移学习1、Distilling the knowledge in a neural ne...
2020-07-19 19:28:36
358

转载 【转】做ML项目,自查清单帮你理清思路
原文链接:https://towardsdatascience.com/task-cheatsheet-for-almost-every-machine-learning-project-d0946861c6d0【注:与我之前整理的sklearn 快速建模check list 异曲同工】任何科研项目都是系统性的,机器学习项目也不例外,它包含一系列大大小小、或繁或简的要素和组件,如讨论、准备工作、提出问题、模型构建和优化调整等。在这种情况下,开发者很容易漏掉一些重要的东西。八步完成 ML ..
2020-07-14 05:36:31
317

转载 【转】【较全的CTR模型概览】 推荐算法——CTR预估模型
知乎文章 : 推荐算法——CTR预估模型CTR预估模型可以广泛应用于个性化推荐、信息检索、在线广告等领域,用来学习和预测用户的反馈,用户的反馈主要有点击、收藏、购买等。数据CTR预估模型的特征数据往往包含多个特征,这些特征会根据其自身特点被编译成one-hot编码,然后将多个特征对应的编码向量链接在一起构成特征向量。高维、稀疏、以及多类别是输入给CTR预估模型的特征数据的典型特点。Embedding 表示又叫Distributed representation,相对于高维稀疏的.
2020-07-12 16:49:46
2413

转载 【转】基于知识图谱的推荐系统(KGRS)综述
以下文章来源于AI自然语言处理与知识图谱,作者Elesdspline作者信息Elesdspline目前从事NLP与知识图谱相关工作。导语本文是2020年针对知识图谱作为辅助信息用于推荐系统的一篇综述。知识图谱对于推荐系统不仅能够进行更精确的个性化推荐,而且对推荐也是具有可解释性的,有迹可循。本文汇总了近些年来知识图谱辅助推荐系统的一些研究工作,并按不同的方法进行划分类别(下图是我根据论文画出的大纲方法类别图);除此之外,汇总了不同场景下的知识图谱数据集,涵盖7个场景;最后阐述...
2020-07-09 08:35:35
7507
2

转载 转载-从ReLU到GELU,一文概览神经网络的激活函数
选自mlfromscratch作者:Casper Hansen机器之心编译在计算每一层的激活值时,我们要用到激活函数,之后才能确定这些激活值究竟是多少。根据每一层前面的激活、权重和偏置,我们要为下一层的每个激活计算一个值。但在将该值发送给下一层之前,我们要使用一个激活函数对这个输出进行缩放。本文将介绍不同的激活函数。在阅读本文之前,你可以阅读我前一篇介绍神经网络中前向传播和反向传播的文章,其中已经简单地提及过激活函数,但还未介绍其实际所做的事情。本文的内容将建立在你已了解前一篇文章.
2020-05-13 22:00:52
1209
原创 Bert中文文本分类
这是一个经典的文本分类问题,使用google的预训练模型BERT中文版bert-base-chinese来做中文文本分类。可以先在Huggingface上下载预训练模型备用。我使用的训练环境是。
2024-12-27 17:27:56
1690
1
转载 扩散模型 (Diffusion Model) 简介
Diffusion Models 的灵感来自non-equilibrium thermodynamics (非平衡热力学)。理论首先定义扩散步骤的马尔可夫链,以缓慢地将随机噪声添加到数据中,然后学习逆向扩散过程以从噪声中构造所需的数据样本。与 VAE 或流模型不同,扩散模型是通过固定过程学习,并且隐空间具有比较高的维度。总的来看,Diffusion Models 领域正处于一个百花齐放的状态,这个领域有一点像 GAN 刚提出来的时候,目前的训练技术让 Diffusion Models 直接跨越了 GAN 领
2024-11-26 13:57:13
1067
原创 机器翻译基础与模型 之四:模型训练
它们的区别在于合并子词的方式,基于BPE 的方法选择出现频次最高的连续字符进行合并,而基于语言模型的方法则是根据语言模型输出的概率选择要合并哪些子词。因为相互适应的神经元可以更好的描述训练数据中的现象,但是在测试数据上,由于很多现象是未见的,细微的扰动。所谓适定解,需要满足三个条件:解是存在的、解是唯一的、解是稳定的(即 y 微小的变化会导致 x 微小的变化,也被称作解连续)。常用的手段包括两种,一种是采用字词融合的方式构建词表,将未知单词转换为字符的序列并通过特殊的标记将其与普通的单词区分开来。
2024-11-24 17:52:24
1106
原创 机器翻译基础与模型 之三:基于自注意力的模型
Transformer 模型仅仅使用自注意力机制和标准的前馈神经网络,完全不依赖任何循环单元或者卷积操作。很好地解决了单词间长距离依赖的问题。自注意力机制非常适合在 GPU 上进行并行化,因此模型训练的速度更快。
2024-11-20 21:17:00
1177
原创 机器翻译基础与模型 之二: 基于CNN的模型
相比于全连接网络,卷积神经网络最大的特点在于具有局部连接(Locally Connected)和权值共享(Weight Sharing)的特性。
2024-11-20 14:31:28
566
原创 机器翻译基础与模型 之一: 基于RNN的模型
之后中间层会对词嵌入向量进行更深层的抽象,得到输入单词序列的中间表示。LSTM:seq2seq学习的方法,缓解了梯度消失/爆炸问题,通过遗忘门的设计让网络选择性的记忆信息,缓解了序列中长距离依赖的问题。对序列中某个位置的答案进行预测时需要记忆当前时刻之前的序列信息,这就是RNN网络诞生的背景。RNN处理序列问题的实例: 循环单元的输入由上一时刻的输出和当前时刻的输入组成。(2)句子的表示学习,即在词嵌入的基础上获取整个序列的表示。基于规则的-->基于实例的-->基于统计方法的-->基于神经网络的。
2024-11-19 17:41:40
1344
原创 大语言模型LLM综述
(3) 前缀解码器: 也称为非因果解码器架构,修正了因果解码器的掩码机制,使其能够对前缀标记执行双向注意力,并对生成的标记执行单向注意力。(4) 注意力机制和偏差: 原始的Transformer是全自注意力机制,GPT-3采用了稀疏注意力机制,即分解注意力,计算复杂度更低。- GPT -4模型API接口:gpt-4、gpt-4-0314、gpt-4-32k、gpt-4-32k-0314。如BERT、GPT-2。(2)基于启发式的方法: 基于语言的过滤、基于度量的过滤、基于统计的过滤、基于关键词的过滤。
2024-11-13 20:34:13
1326
原创 使用GroundingDINO +SAM实现商品抠图
在电商场景下需要对主商品进行审核、替换商品图背景等场景需求。就需要对商家提供的商品图进行抠图、替换背景等操作。当然有不少的第三方工具可供运营和产品使用,但都至少需要这样几个步骤,上传图片、选择抠图区域或边缘、等待抠图生成、下载抠图结果。且先不管商品图片涉及泄漏的问题,单是抠图效果如何也不是很好保证的。比如有这样一个商品图,我们希望抠出手机这个主商品,去掉背景色和背景物。期望得到的理想效果是这样:[这也是通过我们算法抠图后得到的一个效果图]比如这个抠图软件remove.bg,它抠完后的效果是这样的。
2024-10-24 15:07:05
594
原创 24-25年工作上技术栈能力新要求和规划
24年Q4的工作规划目标已经出来有三周了,因为团队业务目标的调整和平台产品化的转型,对Q4及之后的工作内容和方向提出了新的方向和要求。而广告营销算法的内容则变成集成在平台上的标签能力或定制化的算法服务,变成了打包售卖的形式,不再是之前的按客户定制化服务的模式。工作中有新鲜感、有挑战是我喜欢的,所以,尽管暂时搁置下了之前的技术方向,但我还是很快的调整好了心态,开始研究和整理新工作方向上需要的技术栈能力。接下来就是在给定的Q4时限里学习和应用新的技术能力。
2024-10-23 11:16:08
318
原创 基于行为序列的FastText高相关算法在电商人群挖掘中的实践应用
最近做的项目中有两个是跟白酒相关的,品牌知名度都挺高的(WLY、LZLJ),期望在中秋国庆期间,借助市场的天时地利(规律),在平台上挖掘出一波用户来创造一波营销和创收。项目周期大约3个月左右,从8月-10月。这样的项目属于人货匹配模型中典型的有货找人的情况,一般都有比较固定的算法模型,给出多条人群策略,做赛马实验即可。比如人对货的意向预测模型(即CTR/CVR类的模型),又或者使用推荐算法里的模型(如I2I2U、或者I2U2U模型),或者根据产品和用户的显著性分析做一些规则类的标签组合。
2024-10-22 17:11:57
930
转载 PyOD库-异常检测
PyOD(Python Outlier Detection)是一个用于检测多维数据中异常点的开源库。它支持超过20种主流的异常检测算法,包括经典的统计方法、机器学习模型和集成方法。PyOD的设计考虑了易用性和扩展性,能够轻松集成到各种机器学习工作流中。PyOD库是一个功能强大且全面的异常检测工具包,提供了多种算法和工具,适用于各种异常检测任务。通过PyOD,用户可以轻松实现复杂的异常检测任务,并将其集成到现有的机器学习工作流中。
2024-10-22 13:41:14
130
转载 [转]基于动态规划DTW算法加速衡量两个不同的时间序列的相似性
DTW算法采用了动态规划DP(dynamic programming)的方法来进行时间规整的计算,可以说,动态规划方法在时间规整问题上的应用就是DTW。
2024-07-30 15:54:56
194
原创 使用DTW算法简单实现曲线的相似度计算
如果度量算法符合我们的先验经验,比如我们人工标示最相似的两条曲线,算法给出的距离度量也是最小的,我们判断最不相似的,算法给出的距离度量也是最大的。有了判断两条曲线距离度量的算法,且算法结果具有一定的排序性,那么就可以计算出任两条曲线的距离度量值,根据此值就可以给出与指定股票曲线最相似的TopN股票曲线。dtw算法dtw(x,y)=2 < dtw(x,z)=18 判断曲线y与曲线x的距离小于曲线z与x的距离,即相关性更高,符合期望,所以可以作为股票相关性算法使用。特点:忽略了曲线的振幅,只关注其方向。
2024-07-30 14:22:19
1811
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人