- 博客(17)
- 收藏
- 关注
原创 Transformer相关问题
参考 https://blog.youkuaiyun.com/wwlsm_zql/article/details/129298747。
2023-03-27 17:34:31
188
原创 MLR(mixed logistic regression)算法原理及实现
MLR(mixed logistic regression)算法参考https://zhuanlan.zhihu.com/p/77798409?utm_source=wechat_session原文:《Learning Piece-wise Linear Models from Large Scale Data for Ad Click Prediction》MLR算法创新地提出并实现了直接在原始空间学习特征之间的非线性关系MLR算法模型,这是一篇来自阿里盖坤团队的方案(LS-PLM),发表于2
2020-05-29 16:39:49
14548
2
原创 决策树 xgb lgb可视化
https://blog.youkuaiyun.com/l_xzmy/article/details/81532281
2019-08-21 18:08:01
929
原创 统计期刊排名
Statistical Journal Ranking-统计期刊排名用期刊排名来评估学者不是一个好方法,只是权宜之计,而且将期刊排名不是一件轻松的事情。有一篇论文《How Do Statisticians Perceive Statistics Journals?》报告了国际统计界对期刊排名的一些调查结果。http://www.tandfonline.com/loi/utas20http...
2019-06-05 20:27:38
6026
转载 吴恩达团队提出倒计时回归模型:用AI技术预测病患死亡时间
https://blog.youkuaiyun.com/weixin_34248705/article/details/87943737
2019-05-29 16:25:03
135
原创 tensorflow2.0安装
1、首先基于自己安装的Anaconda 创建环境一个尝鲜环境:conda create -n tf2.0 python=3.62、然后进入刚刚创建好的环境:conda activate tf2.03、执行下面的安装命令:pip install tensorflow-gpu==2.0.0-alpha0 #GPU版本pip install tensorflow==2.0.0...
2019-05-20 14:58:54
913
原创 tensorflow contrib.layers 模块
tf.contrib.layers.optimizers模块:tf.contrib.layers.optimizers包括的优化器有Adagrad,SGD,Momentum等。它们用来解决数值分析的优化问题,比如,优化参数空间寻找最优模型;tf.contrib.layers.regularizers模块:tf.contrib.layers.regularizers包括的正则化有L1规则化和L2规...
2019-05-16 21:27:59
5520
原创 机器学习之特征编码
为什么特征编码通常工业数据都是比较脏的,特征变量除了数值外可能还会包括字符等特征值,但一般的机器学习模型一般都是处理数值型的特征值,因此需要将一些非数值的特殊特征值转为为数值,这就要用到特征编码。编码方式我们通常会使用两种方式来实现,分别是:独热编码: 自然数编码:label-encoding和one-hot encoding。一般如果特征是定类数据,模型对数值大小次序敏感则选择onehot...
2019-04-22 12:44:39
1405
原创 特征探索性分析Exploring_features
特征探索性分析数据和特征决定了机器学习的上限,而模型和算法只是逼近这个上限而已。那特征工程到底是什么呢?顾名思义,其本质是一项工程活动,目的是最大限度地从原始数据中提取特征以供算法和模型使用。通过总结和归纳,人们认为特征工程包括以下方面加载数据import numpy as npimport pandas as pdfrom sklearn.model_selection impo...
2019-04-15 18:14:07
1055
原创 xgb.cv进行交叉验证
模型评估的方法留出法留出法是将原数据集分成互斥的两组,一组作为训练集,另一组作为测试集交叉验证发交叉验证(cross-validation 简称cv)将数据集分为k等份,对于每一份数据集,其中k-1份用作训练集,单独的那一份用作验证集。通常情况下,留一法对模型的评估可能会不准确,一般采用xgboost.cv可以进行交叉验证以下基于kaggle的heart-disease数据进行...
2019-04-13 18:39:53
20197
6
原创 用xgboost获取特征重要性原理及实践
1.xgboost对特征重要性排序的原理xgboost根据结构分数的增益情况计算出来选择哪个特征作为分割点,而某个特征的重要性就是它在所有树中出现的次数之和。也就是说一个属性越多的被用来在模型中构建决策树,它的重要性就相对越高2 xgboost特征重要性排序的方法xgboost可以通过get_score获取特征重要性for importance_type in (‘weight’, ‘...
2019-04-13 17:39:49
22921
4
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人