
Data mining
文章平均质量分 82
iofu728
A lazy man
展开
-
Frequent Pattern
博客引流作为Data mining 的第一篇 先来讲讲频繁模式频繁模式是推荐算法的基础主要解决的是从一堆数据中挖掘出频繁的组合模式举个简单的例子可能买了Mac的人,过几天会去买贴膜可能买考研英语书的人,过几天会去买考研数学书如何在大量数据中找到可能相关的几个问题,称之为Frequent Pattern频繁程度通过支持度、置信度两个参数来衡量A->B support: 即模式...原创 2018-10-26 16:38:01 · 1048 阅读 · 0 评论 -
如何优雅的理解PageRank
博客引流终于Tex调好了 刚好最近又多次提及PageRank 于是~目测这一系列 有个两三篇blogPageRank 是 由佩奇(Larry Page)等人提出 的 Google 最为有名的技术之一我 乔治 甘拜下风PageRank 是一种基于随机游走 的 评价网站权值的算法言而总之 PageRank是一种十分重要的算法 不管在学术界 还是在产业界Node Similarity ...原创 2018-10-31 01:24:38 · 4462 阅读 · 0 评论 -
大图中如何快速计算PPR
大图中计算Person PageRank原创 2018-11-07 19:32:14 · 1872 阅读 · 1 评论 -
numpy 最后一卷
点这里排版更好This is a note for numpy-1001. np.add.reduce() > np.sum() * np.sum(Z) # 调用np.add.reduce()实现 * np.add.reduce(Z) # 在reshape的时候会产生一个数组 * np.logical_and.reduce(arr3[:, :-1]<a...原创 2018-12-19 13:43:56 · 340 阅读 · 0 评论