
算法
文章平均质量分 85
浪漫的数据分析
这个作者很懒,什么都没留下…
展开
-
CatBoost 和 Light GBM 和 XGBoost 使用GPU训练对比
Kaggle比赛各种增强算法,CatBoost 和 Light GBM 和 XGBoost每种算法处理类别变量了解参数在数据集上实现每种算法的性能原创 2022-07-11 17:05:08 · 6274 阅读 · 0 评论 -
tensorflow 1.X迁移至tensorflow2 代码写法
这里写目录标题目标:代码改写成tf2格式tf1和tf2区别:改写内容:tf.placeholdertf.Sess,sess.run具体例子1:结论:目标:代码改写成tf2格式把tensorflow 1.X中的代码,迁移到tensorflow2中。一些常见的改写经验。包括sess,tf.placeholder, tf.InteractiveSession(),tf.Session()tensorflow2相比于tensorflow 1.x版本有较大的变化,且网上现在好多文章的代码都是基于tf1.x版本的原创 2021-12-13 01:44:24 · 4706 阅读 · 0 评论 -
tf.nn.dropout和tf.keras.layers.Dropout的区别(TensorFlow2.3)与实验
这里写目录标题场景:dropout和Dropout区别问题描述:结论:深层次原因:dropout是底层API,Dropout是高层API场景:dropout和Dropout区别全网搜索tf.nn.dropout和tf.keras.layers.Dropout区别,发现好多都是错误的讲解,因此有必要进行一次实验和纠错。tf.nn.dropout和tf.keras.layers.Dropout的区别,看本文就足够了。问题描述:tf.nn.dropout和tf.keras.layers.Dropou原创 2021-11-29 01:52:26 · 4677 阅读 · 1 评论 -
tensorflow2 神经网络模型构建4种方法
这里写目录标题学习目标:学习内容:1. 使用现有的预训练模型线下训练,线上加载运行线下训练线上加载迁移学习2.Keras Sequential模式建立模型(不推荐,灵活性太差)3.Functional API 函数api建立模型(最常用,可构建复杂网络)4.tf构建模型Class总结:学习目标:tensorflow2模型构建4种方法,掌握其优缺点。顺便:compile是TensorFlow2专门用来训练模型的,很方便,避免了写Gradenttape那种形式化结构,直观明了,一定要掌握。学习内容:原创 2021-11-29 01:27:03 · 3194 阅读 · 0 评论 -
阿里DIN模型(深度兴趣网络)详解及理解
这里写目录标题目标:模型产生原因:核心思想:模型介绍:Base model改进模型模型算法设计论文的算法改进参考资料目标:掌握2017年阿里提出的深度兴趣网络(Deep Interest Network for Click-Through Rate Prediction)以及后续的DIEN。本篇介绍DIN原文:Deep Interest Network for Click-Through Rate Prediction21 Jun 2017Deep Interest Evolution Net原创 2021-11-16 01:46:13 · 10253 阅读 · 1 评论 -
XGBoost对比RandomForest、GBDT、决策树、SVM,XGB+LR精度还能提升
目标:对比各种模型,XGBoost直接判了RandomForest、GBDT、决策树、SVM等死刑,XGB+LR精度还能提升。XGBoost:目前树模型的天花板,所有决策树中,XGBoost的精度最高,运行速度也还不错,所以竞赛中,结构化数据的比赛,基本都是用它了。另外,实验表明,XGBoost+LR精度还能进一步提升。学习内容:模型对比具体:1、 比较在测试集上的AUC表现2、 比较模型完成端到端训练预测的时间3、 了解算法的优缺点最终对比结果:结果如下:模型测试精度原创 2021-11-14 23:41:40 · 7075 阅读 · 0 评论 -
Facebook的GBDT+LR模型python代码实现
目标:实现GBDT+LR模型代码,并比较和各种RF/XGBoost + LR模型的效果,发现GBDT+LR真心好用啊。内容:构造GBDT+LR步骤训练阶段:1、 获取特性信息2、训练GBDT分类器3、遍历GBDT树的叶子节点,拼接成一个常常的一维向量4、 训练OneHot编码器5、 训练LR模型预测阶段:1、把带预测的特征输入到GBDT2、获得叶子节点,拼接成一个常常的一维向量3、获得OneHot向量4、LR预测结果这里发现了上篇文章的一个错误:就是GBDT树的叶子节点,输原创 2021-11-13 17:16:48 · 2844 阅读 · 0 评论 -
传统推荐算法Facebook的GBDT+LR模型深入理解
目标:深入理解Facebook 2014年提出的的GBDT+LR模型。优快云上泛泛而谈的文章很多,真正讲解透彻的没几篇。争取我这篇能讲解透彻。今晚又想了许久,想通了一些原理。也分享出来。算法背景:FaceBook一推出这一模型就引起了业内的轰动,因其设计的巧妙以及预测效果的精良,很多公司一度极力推广,在数据比赛KDD中也经常使用。尽管GBDT+LR依然存在其问题点,但是在当时数据量没有特别大的情况下,这一模型几乎处于横扫千军的状态。后期模型被不停的优化,于是产出了:XGBoost/GBDT+原创 2021-11-11 23:06:14 · 3540 阅读 · 0 评论 -
推荐系统XDeepFM模型--DeepFM和DCN升级版
xDeepFM模型目标:引言:xDeepFM模型介绍:2.1 Compressed Interaction Network(CIN)xDeepFM复杂度分析Experiment产出:Conclusion参考资料:目标:学习模型xDeepFM模型,包含我个人的一些理解。深入理解模型。结合卷积神经网络CNN理解模型原理。昨晚想了一晚上才想通,都失眠了。微软亚洲研究院2018年提出xDeepFM模型,可以理解为对DeepFM和DCN升级版。相对于DeepFM,升级为自动构建高阶交叉特征相对于DCN,从原创 2021-11-08 01:49:32 · 4024 阅读 · 0 评论 -
推荐算法DCN(Deep & Cross)自动构造高阶交叉特征原理介绍
目标:斯坦福与Google联合发表在AdKDD 2017上的论文《Deep & Cross Network for Ad Click Predictions》。特点:对Wide@Deep模型的升级,可以自动自动构造高阶交叉特征。可以说和华为同期提出的DeepFM属于同一种思想,并且走得更远。看了下作者,好像也是中国人。中国不注重AI人才,导致大量的AI领军人物流失。真是可惜。华为同期提出的DeepFM只是用了FM替换了Wide@Deep中的Wide(LR)部分,没有提出更多的创新,DCN创新更原创 2021-11-06 04:05:27 · 3274 阅读 · 0 评论 -
基于协同过滤算法的在线鲜花店推荐系统详解及GitHub下载
[[TOC]]基于协同过滤的在线鲜花店推荐系统项目需求:基于店铺的客户订单记录,实现店铺的推荐需求:基于RFM模型,得到客户的价值分类,对高价值客户进行重点跟踪,推荐其潜在的商品列表,即实现:给定用户编号,返回10个推荐商品列表。对店铺滞销商品,进行有针对性的促销活动,推荐给最有可能购买的10个用户,结合一些针对性的促销优惠活动,向10个用户推荐。即实现:给定物品编号,返回10个推荐用户列表。店铺尚未搭建Spark大数据环境,可搭建TensorFlow2的环境,因此使用Tenso原创 2021-10-21 21:09:13 · 1156 阅读 · 0 评论 -
线性模型LN、单神经网络SNN、深度神经网络DNN与CNN测试对比
上篇提到的卷积神经网络对手写数字的识别,识别率为99.15%,作为对比,我们对比一下线性模型LN、单神经网络SN、深度神经网络DNN对相同的测试数据进行模拟,才能看到卷积神经网络的强大。测试结果如下:模型名称正确率卷积神经网络99.15%线性模型31.32%单神经元模型92.49%深度神经网络96.97%结论和分析:卷积神经网络在图像处理领域无人能敌。模型名称分析原因线性模型只能划分线性问题,非线性问题无能为力单神经元模型原创 2021-03-18 23:59:10 · 1677 阅读 · 0 评论 -
卷积神经网络(CNN)详解及TensorFlow2代码实现
卷积神经网络名字听着挺吓人,本文用通俗易懂的方式解释。人人都能看懂。文章目录卷积是什么一、卷积神经网络介绍卷积层--提取局部图片特征扩充--padding,保持卷积后图片的长和宽保持不变池化层---降低维度,降低模型复杂度和计算量全连接层--输出结果二、TensorFlow2代码实现1.导入数据2.用TensorFlow2构建一个CNN网络总结卷积是什么卷积神经网络就是传统神经网络运用了矩阵卷积的技术。二维线性卷积:矩阵举例:(摘抄自)现在有一张图片 f(x,y) 和一个kernel核原创 2021-03-18 17:04:37 · 9437 阅读 · 1 评论 -
数据挖掘的11大算法及python实现(个人笔记整理,非教学用)
分类算法:C4.5,朴素贝叶斯(Naive Bayes),SVM,KNN,Adaboost,CARTl 。聚类算法:K-Means,EMl 。关联分析:Aprioril 。连接分析:PageRank文章目录前言一、C4.5 算法二、SVM 算法三、KNN算法四、AdaBoost算法五、CART算法六、Apriori算法七、K-Means算法八、朴素贝叶斯(Naive Bayes)算法九、EM算法十、PageRank算法二、使用步骤1.引入库2.读入数据总结前言国际权威的学术组织 ICDM (the原创 2021-03-05 19:19:43 · 17265 阅读 · 1 评论 -
网络爬虫2:抓取网易云音乐评论用户ID及主页地址
本文目标:上篇我们获得了热门歌手歌曲的ID和URL地址。本篇进一步获取评论用户ID及主页地址。终极目标:1、通过热门歌手,抓取歌曲ID。2、通过歌曲ID,抓取评论用户ID。3、通过评论用户ID,发送定向推送消息。上一篇完成了步骤1,本文完成步骤2。题外话:上篇用的requests无页面的方法获取歌曲ID,速度比较快,但是获取到2000条左右就会被服务器识别成爬虫而被禁IP,通过连接手机热点,重启飞行模式后再连接就又可以获取2000条。上篇我们用MYSQL存储爬取结果,本次也将使用相同方法原创 2021-02-19 18:08:37 · 3186 阅读 · 2 评论 -
时间序列分析源资料汇总
时间序列分析在GitHub上有个专题,这里给出地址便于以后学习:时间序列分析总体介绍:Time Series analysis tsaSTL 分解介绍:STLDecompose后续陆续补充。转载 2021-01-27 14:42:38 · 442 阅读 · 0 评论 -
时间序列分析之:傅里叶变换找周期
时间序列分析万万没想到吧,信号处理的技术,能用在数据分析中。谁叫我是学通信出生的呢?承接上一篇:函数分解本节承接上文找函数的周期。文章目录时间序列分析傅里叶变换一、傅里叶变换(FFT)是什么?二、使用步骤1.新建FFT函数2.测试函数总结傅里叶变换通信专业的我,看到找周期时,不由自主想起了傅里叶变换。傅里叶变换就是把时域上的信号,变换到频域上,用很多个正弦波来合成时域信号。所以,我们找信号幅度最大的那个正弦波的频率,作为函数的周期。傅里叶变换最详细的介绍见这个文:详细得令人发指一、原创 2021-01-27 11:10:18 · 30476 阅读 · 22 评论 -
时间序列分析之:函数分解decompose
时间序列分析——函数分解第一篇 函数分解函数分解decompose文章目录时间序列分析——函数分解前言一、函数分解是什么?二、建立分解函数1.功能2.测试函数总结前言这几天一直在深思,如何建立一个和实际比较贴切的金融模型,能反映现实生活?比如我们听到国家又放水了,我们可以预期物价又得上涨了,但是如何通过模型来反映这种相关关系呢?伙伴杨RC说用EXCEL建了个模型来预测本期深圳车牌竞价,以达到最小的成本拍到车牌,这个想法不错,Good lucky to my brother。简单的模型可原创 2021-01-26 12:18:56 · 14942 阅读 · 3 评论 -
你真的认真想过了吗?
贷的款,迟早是要还的。 ------ 爱心觉罗 . 辑 . 虾扯文章目录前言一、重新建模目标函数二、绘制模型图1.装修贷转化为同期房贷的利率变化图2.还款差额函数图3.最佳还款月的利率结论知识图谱三、代码1.装修贷转化为同期房贷的利率变化图代码2.差额函数的生成图示代码前言 昨天用Python简单的计算了装修贷和房贷的比较关系,我们的结论是装修贷会比同期房贷利率高,还得到了装修贷的年利率简单的估算关系。我们初步的结论是装修贷没有房贷划算。高中同届唯一考上清华的同学看了说..原创 2020-12-31 19:33:37 · 631 阅读 · 1 评论