数据挖掘
文章平均质量分 91
LiFeitengup
大连理工大学数学硕士在读关注计算机视觉机器学习数据分析Email-lifeiteng0422gmail.com
展开
专栏收录文章
- 默认排序
- 最新发布
- 最早发布
- 最多阅读
- 最少阅读
-
The Elements of Statistical Learning学习开篇
这学期开了机器学习讨论班,为了下学期的《机器学习与数据分析》课程做准备。 先期讲解《The Elements of Statistical Learning》这本书,此书已经出到第二版。豆瓣截图:评价非常高 本书主页:http://www-stat.stanford.edu/~tibs/ElemStatLearn/ Trevor Hastie, Robert Tibsh原创 2012-11-30 20:47:16 · 4307 阅读 · 0 评论 -
聚类小文(一)
聚类 二维空间中六个数据点集原创 2013-05-29 23:58:48 · 1897 阅读 · 0 评论 -
推荐系统—影视评分预测(续)
在上一篇文章推荐系统—影视评分预测中提出了,几点思考: =============================一、theta/x的意义?============================= 首先是模型:以下的model1/model2都把user想简单了 (1)model1:给定x=(romance,action),回归优化theta。 首先模型就给x赋予了意义(movi原创 2013-06-29 21:45:31 · 5057 阅读 · 9 评论 -
Map-Reduce Algorithm Design
记录: map-reduce design pattern 初始化应该尽可能放到 configure中 例子1.word count 优缺点: =================================== Combiner Design (mean1+mean2)/cnt = mea原创 2013-10-04 21:41:46 · 3682 阅读 · 0 评论 -
文本自动分类
文本自动分类 python原创 2013-10-04 19:05:01 · 13376 阅读 · 7 评论 -
文本自动分类(续)
文本自动分类 朴素贝叶斯原创 2013-10-09 19:02:50 · 5176 阅读 · 1 评论 -
K-Means 和K-Medoids算法及其MATLAB实现
K-Means和K-Medoids算法是学习领域比较普通的聚类算法(无监督学习),本文介绍原理及Matlab实现代码。1.问题: 给定数据点集P,d-by-N,将这些数据点集聚类到K类中去同时要求下式值最小:Sk是聚类形成的数据集合,mk是每个类集合的“中心”——K-Means与K-Medoids唯一不同的地方原创 2012-11-30 22:38:34 · 21579 阅读 · 8 评论 -
基于用户的最近邻推荐
课程 Python代码: __author__ = 'LiFeiteng(Email: lifeiteng0422@gmail.com)' # -*- coding: utf-8 -*- import numpy as np class UserUserRec: def __init__(self): self.U = 0 # user number self.M = 0 #原创 2013-10-22 16:51:32 · 3568 阅读 · 1 评论
分享