
机器学习算法及Sklearn实践
文章平均质量分 93
GladyoUcaMe
就爱打篮球
展开
-
自适应性数据中心在线能效预测解决方案
2019华为开发者大赛,SoftCOM通信智能(NAIE)赛道获奖方案分享大赛依托于NAIE平台,从导入数据、特征操作、模型训练,到模型打包与验证,全流程开发算法模型。从琅琊榜上的提交记录可以看到,大家平时学业繁重或是工作繁忙,只能熬夜编码,周末更是黄金时间。除了参赛选手,还有平台团队的陪伴,随时解决大家的疑问。大赛过程中每一个关于平台使用的问题,都会得到及时反馈并有效解决,这一点相信每一位参赛选手都深有体会。所以,文章开始我要向平台团队每一位夜以继日的耕耘者致敬。希望平台越来越棒,这样一个平台也必然越来原创 2021-03-11 22:32:28 · 590 阅读 · 1 评论 -
机器学习算法(降维)总结及sklearn实践——主成分分析(PCA)、核PCA、LLE、流形学习
降维图谱降维什么时候会用到降维维数灾难降维的主要方法1.投影(Projection)主成分分析(PCA)保留最大方差的超平面主成分(Principle Componets)奇异值分解(SVD)投影到 d 维空间Scikit-Learn实现PCA方差解释率(Explained Variance Ratio)核 PCA(Kernel PCA)调整超参数引入模型,通过最优化模型表现调参直接基于最小重建误...原创 2019-04-03 01:05:24 · 10171 阅读 · 6 评论 -
推荐系统算法原理一览——协同过滤算法VS隐语义模型
算法原理及简介代码实践及分析原创 2019-05-22 01:11:58 · 559 阅读 · 0 评论 -
一个完整的机器学习项目实战代码+数据分析过程:哈佛大学能耗预测项目(Prediction of Buildings Energy Consumption)
能耗预测项目资料获取获取方式一:Prediction of Buildings Energy Consumption项目介绍主页获取方式二:详细相关代码分析结果获取方式三:提取码:9uu2原创 2019-04-11 23:27:44 · 9247 阅读 · 18 评论 -
多个模糊匹配条件下对两个数据集的高效聚合方法(加权最近邻优化)及实例代码
背景介绍:现在某一社交软件,收集各20W+的男女数据集df_T054包括:ID、性别、生日、身高系数、工资系数等信息[‘ID’,‘DataType’,‘CallRecordUEID’,‘Height’,‘Salary’]其中,身高系数、工资系数为male和female各自性别集合里统计出来的标准化数据,例如分位数等。(这样男间女比较身高,薪资才有意义)需求很简单,尽可能为female找到最满...原创 2019-05-17 22:35:34 · 1080 阅读 · 7 评论 -
推荐系统实践(1)——windows环境下安装scikit-surprise实现协同过滤算法
关于Surprise功能及使用直接看官方文档Surprise是一个用于推荐系统构建和分析的开源库。surprise官方文档(最好的学习资源没有之一):http://surpriselib.com/windows环境下安装scikit-surpriseconda install -c conda-forge scikit-surprise需要注意的是目前清华镜像停止了服务,用清华的可以把...原创 2019-05-22 23:52:24 · 684 阅读 · 0 评论