
算法
文章平均质量分 80
JimmyLoveLife
IT界不新的新人
展开
专栏收录文章
- 默认排序
- 最新发布
- 最早发布
- 最多阅读
- 最少阅读
-
集体智慧编程 读书笔记 二
还是第二章, 后面内容 这部分讲了基于物品的协作过滤, 之前讲基于用户的协作过滤, 基于物品的协作过滤适用于大数据集, 因为我们可以体检对数据进行处理, 物品的变化很小,所以计算一次后,以后可以较少的修改,这部分内容比较简单,当有数据集后, 计算每种物品的topmatch 物品def buildSimilarItems(prefs, n=10): result =原创 2014-02-12 12:47:05 · 1115 阅读 · 0 评论 -
集体智慧编程 读书笔记 三
第三章 先是讲述聚类算法,第一步工作是构建数据集,书中给了现成数据集的下载地址, 还有feed list的下载地址, 给出了利用feed list 调用feedparser 处理成博客以及相应的单词的表格, 自己实现的时候没有必要这么来做, 一个是list里好多地址连不上, 都是国外的, 看懂代码即可, 我们可以直接把数据集下载下来, 书中给的地址已经改变所以新地址应该是:数据集:原创 2014-02-14 14:27:46 · 1247 阅读 · 1 评论 -
集体智慧编程读书笔记 三 cont
继续来看第三章, 下面是用图形显示树首先下载 PIL, 这个库目前不支持 python 3, 下面地址上有高手改过的版本可以用:http://www.lfd.uci.edu/~gohlke/pythonlibs/#pil显示画图不是本书重点, 就不解释了, 就是教你怎么用PIL画图列聚类原创 2014-02-27 11:24:46 · 790 阅读 · 0 评论