- 博客(4)
- 资源 (17)
- 收藏
- 关注
原创 推荐系统论文阅读笔记(二)DeepFM: A Factorization-Machine based Neural Network for CTR Prediction
参考博客:https://www.jianshu.com/p/6f1c2643d31b1. 思路low-order和high-order的feature interaction同样重要,FM擅长发现low-order的特征交互,DNN擅长发现high-order的特征交互。DeepFM将FM和DNN联合在一起,综合了二者的优点。相较于Wide&Deep,DeepFM不需要对原始特征进行人工特征工程的工作,FM会自动学习特征交互。点击率预测——CTR(click-through rate)对于推
2021-06-18 15:05:22
312
原创 推荐系统论文阅读笔记(一)Wide & Deep Learning for Recommender Systems
Wide & Deep Learning for Recommender Systemswide and deep 模型的核心思想是结合线性模型的记忆能力(memorization)和 DNN 模型的泛化能力(generalization),在训练过程中同时优化 2 个模型的参数,从而达到整体模型的预测能力最优。1. Wide&Deep模型介绍wide部分,也就是广义线性模型,广泛用于大规模的回归和分类问题。一般:线性模型 + 特征交叉优点是具有较强的记忆能力,并且可解释性很强缺
2021-06-18 09:42:07
751
原创 python爬虫实践-02-大众点评评论爬取-破解CSS字体加密
本文以页面https://www.dianping.com/shop/jh631305VtnDuXpl/review_all为例,对大众点评的CSS+SVG字体加密的反爬机制进行破解,解析得到评论信息。warning:大众点评反爬策略更新的很快,即使机制没变,也会在其它地方设置障碍,让你之前的爬虫完全没法用。比如我在写这篇博客的前几天写好的爬虫,解析出了映射表,结果写博客的时候就用不了。而且它不仅更换了相应的文件,还把文件的格式给改了,这样对文件的解析也得重新来,比如这次,它就把svg的文件格式给改了,解
2021-06-13 19:10:14
2028
3
原创 python爬虫实践-01-携程酒店评论的爬取
0 关键携程网其最大的特点就是:基本上所有的有效数据都是通过Ajax异步请求获取的。本博客的主要内容为:构造Ajax请求,获得返回的reviews数据,由于返回的数据为JSON格式,很好分析判定是否爬完酒店评论直接获取评论数目,想要通过评论下方页码获得总页数比较麻烦,通过分析返回的reviews数据,发现其中有评论数据字段。通过分析不存在评论页面的Ajax请求的返回数据特征,完成爬取结束的判断。下面以https://hotels.ctrip.com/hotels/375126.html
2021-06-12 21:36:35
8321
19
算法导论(高清第三版).pdf
2019-05-28
Qt Creator快速入门_第三版__霍亚飞编著.pdf
2019-05-28
计算机网络 自顶向下方法 原书第6版.pdf
2019-05-28
Matlab经典教程——从入门到精通(原版pdf,非扫描)
2019-05-28
Python源码剖析.pdf
2019-05-28
Windows程序设计(第6版)(中英文都在、高清、有目录)
2019-05-24
现代操作系统 原书第4版[高清扫描版].pdf(中文版、高清)
2019-05-24
程序设计II项目练习-仓库管理系统
2019-05-12
离散数学及其应用-第七版-课后习题答案(偶数题英文+奇数题中文)
2019-03-09
计算机网络-自顶向下方法-课后习题答案
2019-03-09
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人