
数据挖掘
爱吃香菜和葱
菜鸟一枚,多多指教
展开
专栏收录文章
- 默认排序
- 最新发布
- 最早发布
- 最多阅读
- 最少阅读
-
链路分析(Link analysis)
随机游走(random walk)Flow Formulation当某个网页的输入链接越多时,说明该网页越重要(Page is more important if it has more out-links)首先定义某一页的rank:rj=∑i→jridir_{j}=\sum_{i \rightarrow j} \frac{r_{i}}{\mathrm{d}_{i}}rj=i→j∑...原创 2019-12-04 11:22:50 · 2750 阅读 · 0 评论 -
聚类
聚类算法在实际应用中非常常见,例如,对音乐CD进行聚类,以达到对音乐CD的目的,从而合理地给用户推荐CD;文件中单词的聚类,以将具有相同主题的文章汇合在一块。本文主要介绍以下几种常见的聚类算法,例如:层次聚类算法(Hierarchical algothrim)、k-means算法、 BFR Algorithm、 CURE Algorithm。层次聚类(Hierarchical)层次聚类的一般过...原创 2019-11-28 15:39:48 · 1554 阅读 · 0 评论 -
机器学习
感知器学习(Perceptrons)感知器学习的一般形式:f(x)={+1 if w1x1+w2x2+…wdxd≥θ−1 otherwise f(\mathbf{x})=\left\{\begin{array}{ll}{+1} & {\text { if } \mathbf{w}_{1} \mathbf{x}_{1}+\mathbf{w}_{2...原创 2019-11-11 15:36:15 · 197 阅读 · 0 评论 -
数据降维
SVD分解对于原创 2019-11-06 21:37:02 · 368 阅读 · 0 评论 -
推荐系统
在引入推荐系统这个概念前,我们首先讲述Long Tail现象。对于实体商店而言,由于其货架是有限的,所以要尽可能挑选卖的好的商品摆在货架上。Long Tail是指大部分的商品的popularity没那么高。同理对于线上商店来说,虽然可以摆出很多商品,但推荐给某个用户的商品也是有限的。基于内容的推荐系统(Content-Based Recommendations)主要思想:根据用户对打分比较高...原创 2019-11-04 17:15:41 · 290 阅读 · 0 评论 -
社会网络挖掘
社会网络挖掘大规模图的分析--社区探测Girvan-Newman算法流程边介数(betweenness)的计算边介数的计算过程模块度(Modularity)功能快捷键合理的创建标题,有助于目录的生成如何改变文本的样式插入链接与图片如何插入一段漂亮的代码片生成一个适合你的列表创建一个表格设定内容居中、居左、居右SmartyPants创建一个自定义列表如何创建一个注脚注释也是必不可少的KaTeX数学公...原创 2019-10-24 11:08:37 · 1409 阅读 · 0 评论