- 博客(4)
- 收藏
- 关注
原创 Python学习笔记(四)——基于SVD的协同过滤(推荐算法)
奇异值分解(Singular value decomposition)是一种矩阵分解技术,也是一种提取信息的方法。将一个比较复杂的矩阵用更小更简单的3个子矩阵的相乘来表示,这3个小矩阵描述了大矩阵重要的特性,可以起到降维简化数据,去除数据噪声的作用。 一、SVD定义: 1.回顾特征值和特征分解: ①特征值 如果一个向量v是 NxN 方阵A的特征向量,那么可以用下式表示: 其中λ...
2019-03-30 14:45:53
4000
2
原创 Python学习笔记(三)——基于用户的协同过滤(推荐算法)
一、基本原理 用户A,和用户C都喜欢物品A,和物品C,表明他们兴趣相同,则可向用户A推荐物品D 那么如何表示两个用户兴趣相同呢? 有如下用户对物品的评分矩阵 item1 item2 item3 item4 item5 Bob 5 3 0 5 5 Alice 5 0 0 4 5 C...
2019-03-25 21:17:49
9014
3
原创 Python学习笔记(二)——pandas
一、Pandas数据结构 Pandas的数据结构为Dataframe和series。Dataframe 类似于 numpy 中的二维数组,可以通用numpy数组的函数和方法。series类似于numpy中的一维数组,一位数组的函数和方法都通用,且可通过索引标签的方式获取数据,还具索引的自动对齐功能。 1.Dataframe创建: ①通过二维数组创建 arr2 = np.array(np....
2019-03-25 00:00:44
321
原创 Python学习笔记(一)——浏览器自动化测试工具Selenium
看了网友用Python通过影评来分析电影是好片还是烂片,自己也有了个想法想去分析下百度贴吧的帖子是精品帖子还是水帖子。目前正在熟悉工具的使用。 会用到的库:Selenium, pandas(数据模型),jieba(分词器),snownlp(情感分析),worldcloud(生成词云) 1.pycharm安装 Selenium,pandas与numpy库,均使用pip来自动安装 pip ...
2018-10-13 19:51:33
935
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人
RSS订阅