- 博客(4)
- 收藏
- 关注
原创 推荐系统
1 数据探索 数据来源于kaggle竞赛:Event Reconmendation EngineChallenge 根据过去用户对他们所看到的活动和他们在app里所点击的活动等,这些用户对活动反应的统计信息,来预测用户对某个活动是否感兴趣。数据集信息:train.csv :训练集,共6列,1.5w个样本,没有缺失值user event invited timestamp ...
2018-06-04 14:19:57
296
原创 机器学习的降维和聚类
1 降维--PCA(Principal Components Analysis,PCA),主成分分析PCA:将原始的D维数据投影到低维空间,并尽可能的保留更多的重要信息。主要是通过计算原始数据集的协方差矩阵,并求得协方差最大时的特征值,及其所对应的特征向量,这些特征向量就是更重要的特征向量。PCA的算法原理:X为N*D的数据集,N表示样本数目,D表示样本的特征维度,xi表示第i个样本,i=1,.....
2018-05-24 15:41:40
4401
原创 利用tensorflow实现经典神经网络(一)-resnet
本文将从三个方面来讲解resnet的实现,分别是resnet的由来,resnet的原理以及resnet的tensorflow实现。1 resnet的提出ResNet最初的灵感出自这个问题:深度学习网络的深度对最后的分类和识别的效果有着很大的影响,所以正常想法就是能把网络设计的越深越好,但是事实上却不是这样,常规的网络的堆叠(plain network)在网络很深的时候,效果却越来越差了,即准确率会...
2018-05-17 20:59:38
8676
2
原创 Ames 房价预测
Ames房价预测是Kaggle上的一个竞赛任务。原始数据集一共有81个特征,其中数值型特征38个,非数值型特征43个,并且有缺失值。本文的解题步骤为数据探索 特征工程 模型构建和模型评估1 数据探索通过数据的探索,了解各个特征的特性以及相互之间的关系,为第二步的特征工程,做准备 1.1 首先,我们需要导入相关包并读入数据导入相关包:import pandas as pdimport ...
2018-05-07 20:18:04
2837
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人