- 博客(6)
- 收藏
- 关注
原创 推荐系统实践学习笔记(二):代码实现
写在前面:今天基于Movielens数据集把《推荐系统实践》上的部分算法实现了一下,顺便巩固python和pandas库的使用,发现书本上的代码有很多不靠谱之处(也许是我水平不够),所以基本都是自己写的,不当之处,还望指正。
2016-10-08 15:33:39
7661
4
原创 推荐系统实践学习笔记(一)
写在前面:这几天学习了一下《推荐系统实践》这本书,出于兼顾学生读者和工程师读者的考虑,作者在理论上讲得不算太深,但是非常系统、全面。由于看得比较快,其中的方法没有来得及一一实现,打算写几篇博客记录一下,便于日后有空时翻看实践。
2016-10-02 21:26:40
4444
原创 机器学习基础(二):决策树
写在前面:决策树是一种常用的分类方法,也是我开始学习数据挖掘后接触的第一个算法,它的原理非常好理解,但在学习过程中也有一些容易忽略的细节,今天就来总结一下。
2016-10-02 15:10:46
1508
原创 机器学习基础(一):K-means聚类
写在前面 前几天参加了我在校招季的第一次面试,发现整个过程中只有讲到自己课题的时候才特别流畅,果然熟练度是一样很难替代的东西,只有花时间实践才能不断地加强。和面试官的交流让我意识到自己学习方法的不足,以往对待任何问题,只是习惯地去看公式、敲代码,很少彻底地/从数学的角度思考:这种方法为什么能解决这个问题?所以,今天我想好好总结一下几种最基础的机器学习算法,弥补之前学习的纰漏之处。
2016-09-27 19:10:36
1416
1
原创 拉勾网职位数据爬取与分析(一)
写在前面:开始数据挖掘的学习已有一段时间,由于研究生阶段一直使用C++,代码的熟练度还远远不够,对算法的理解也不够深刻。因此,想要写点东西记录自己学习的过程,希望可以在积累中不断提升自己。今天写一写最近几天爬取分析拉勾网岗位数据的过程,用到了python数据整理常用的pandas库、可视化操作的matplotlib和seaborn库、爬虫算法常用框架scrapy。
2016-09-23 22:30:00
6978
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人