
机器学习
Ginray
这个作者很懒,什么都没留下…
展开
-
Kaggle——Digit Recognizer (Keras+CNN)
Digit Recognizer是Kaggle的入门题,我尝试下训练一个卷积神经网络来解决该问题,主要记录下写代码中遇到的一些问题。代码:import tensorflow as tfimport pandas as pdfrom keras.models import Sequential, load_modelfrom keras.layers import Dense, Conv2D,...原创 2018-07-03 13:59:44 · 791 阅读 · 0 评论 -
Kaggle——Titanic: Machine Learning from Disaster (XGBoost +神经网络)
今天没什么动力写代码,正确率也一直停在80%上不去,整理下之前写的代码吧。代码整体的逻辑是使用XGBoost 和神经网络训练两个结果,然后和之前表现最好的结果放在一起投票,然后得出最终的结果。代码结构: 对于特征选择,我首先去掉了Name', 'Ticket', 'PassengerId'然后对sex、Pclass、SibSp、Embarked 进行了特征因子化...原创 2018-07-10 19:56:48 · 2285 阅读 · 0 评论 -
trick---减少存储稀疏矩阵所需内存
import numpy as npimport pandas as pd# This trick will enable those participants with less than 16GB of RAM to effectively# iterate on Santander competition. The code below shows how to save arou...原创 2018-07-27 14:02:20 · 791 阅读 · 0 评论 -
seaborn 常用函数
seaborn 相当于对matplotlib的一些函数进行了封装,使用起来还是很方便的。train.csv数据来源:https://www.kaggle.com/c/house-prices-advanced-regression-techniques/data...原创 2018-08-14 15:37:14 · 1627 阅读 · 0 评论 -
AlexNet总结与Keras实现
这周读了AlexNet的论文,大概总结下论文的内容。0、论文地址http://https//papers.nips.cc/paper/4824-imagenet-classification-with-deep-convolutional-neural-networks.pdf 1、激活函数和之前通常使用的softmax或者tanh激活函数不同,论文中使用了ReLU激活函数,论...原创 2018-11-20 20:08:30 · 6421 阅读 · 7 评论 -
2019.3.31网易游戏数据挖掘(算法US)笔试编程题第二题题解---HMM
因为考试中没有截图下来,所有只能说个大致的题意。第一题是一题SQL语句转编程语言。如果拿了70分的话应该是没考虑group by 和之后的去重。如果拿了80分的话是没有考虑到需要size>0。第二题其实是一题HMM,通过HMM前向算法就可以做出来。前向算法本质上属于动态规划的算法,也可以用DP去做。第三题要自己根据题目给出的公式计算梯度。第二题的思路其实和刘...原创 2019-04-01 13:51:58 · 1164 阅读 · 0 评论 -
Deep&Cross Network模型与TensorFlow实现
0、DCN网络模型结构:特征分为类别型与数值型,类别型特征经过 embedding 之后与数值型特征直接拼接作为模型的输入。所有的特征分别经过 cross 和 deep 网络,经过拼接后输出。1、embedding层这部分和DeepFM所用到的方法一致,都采用了NLP中常用的word2vec思想。不同的是DCN网络中只需要对离散特征做embedding,连续特征不需要进行em...原创 2019-05-11 15:10:06 · 1761 阅读 · 6 评论