- 博客(22)
- 收藏
- 关注
原创 面试总结(截至2016/4/14)
第一个版块 一:推荐系统的相关知识*重点内容* 一个推荐系统的整体框架:存储,推荐引擎,日志系统,UI,用户 一般是由几个算法混合而成,形成初始推荐结果,然后进行过滤,排名,给出推荐解释。 常见的推荐算法: 1. 协同过滤:基于物品&用户的推荐 用户—物品相似度矩阵,SVD分解,找出最相似的K个物品,根据目标用户对邻接物品评测来预测目标物品对物品的评价。 评价:新奇度
2016-04-14 19:37:16
638
原创 Cracking the code interview总结
1. 第八章:递归 程序调用自己称为递归。把大问题化成与自身相类似的小问题。递归需要边界条件,递归前进段,递归返回段。当边界条件不满足时,递归前进,当边界条件满足时,递归返回。空间成本&时间成本相对较大。 (1)动态规划: 节约时间&空间,把重复性的计算记录下来。如斐波拉契数列,采用递归的算法复杂度为O(n^2),动态规划为O(n).if(n<=1) return ;fris
2016-04-14 14:09:30
1742
原创 Java常见面试题
1:关键字static 属于类,方便在没有创建对象的情况下来进行调用(方法/变量),但是static方法不能访问非静态的类,因为非静态的类是属于对象的。 static变量,为静态成员变量,类被初次加载的时候初始化值,被对个对象共享,方便优化代码。 类的执行是从main方法,但是执行前先加载类(加载时注意有没有static方法/变量),在进行构造函数等。public class Test ext
2016-04-13 09:45:46
440
原创 珍藏的链接
最好的Python机器学习库: https://mp.weixin.qq.com/s?__biz=MzA4Mzc0NjkwNA==&mid=401299851&idx=2&sn=b782be57f41d9e1a82f451b97e3eadcb&scene=0#rd
2015-12-10 19:21:43
5175
原创 机器学习领域的会议&大牛
机器学习领域的大牛们: http://emuch.net/html/201209/4842092.html http://blog.youkuaiyun.com/xiaxiazls/article/details/7237373 机器学习好的会议: https://www.dropbox.com/s/6ljj5msjrfyftsq/%E5%B8%B8%E8%A7%81%E4%BC%9A%E8%AE%AE
2015-11-23 13:49:23
522
原创 theano
一:简介 Keras是基于Theano的一个深度学习框架,它的设计参考了Torch,用Python语言编写,是一个高度模块化的神经网络库,支持GPU和CPU。使用文档:http://keras.io/ 使用上的问题可以到github提issue:https://github.com/fchollet/keras
2015-11-23 13:42:41
622
原创 百度实习
1:process.py#coding:utf-8__author__ = 'jinduo'import sysdef C_area(poi_file,filename): #创建字典 C_POI文件,guid:name dict_poi = {} dict_bid_null ={} dict_name_wrong={} f_C_POI = open(p
2015-11-13 15:45:59
1013
转载 python数据挖掘常用包
原文链接: http://qxde01.blog.163.com/blog/static/67335744201368101922991/ Python在科学计算领域,有两个重要的扩展模块:Numpy和Scipy。其中Numpy是一个用python实现的科学计算包。包括:一个强大的N维数组对象Array; 比较成熟的(广播)函数库; 用于整合C/C++和Fortran代码的工具包; 实用的
2015-11-09 14:26:45
6336
原创 Tushare学习笔记
学习连接:http://tushare.waditu.com/ python 下载包的地址:https://pypi.python.org/pypi 通联数据token:c873bf443ea91eae100adac4276e978554fdffe0697f93fb4e77bfb8c0efc792 金小朵加油撒~~~ 几个重要的函数: 获取历史数据函数:ts.get_hist_data('
2015-11-09 14:25:07
3333
转载 推荐系统——SVD/SVD++
1,SVD源代码:svd.py#Ver1.0#Zero @2012.5.2#import mathimport randomimport cPickle as pickle#calculate the overall averagedef Average(fileName): fi = open(fileName, 'r') result = 0.0 cnt =
2015-06-14 11:59:38
4777
转载 几种常见的误差评估方法
1.RMS:均方根误差2.RMSE:均方根误差它是观测值与真值偏差的平方和观测次数n比值的平方根,在实际测量中,观测次数n总是有限的,真值只能用最可信赖(最佳)值来代替.方根误差对一组测量中的特大或特小误差反映非常敏感,所以,均方根误差能够很好地反映出测量的精密度。3.标准差(Standard Deviation)标准差是方差的算术平方根,也称均方差(mean square error),是各数据
2015-06-14 10:09:07
18659
1
原创 python—pysqlite的使用
1,数据库连接对象的创建con = sqlite.connect("mydbs.db")con有以下几个常用的属性: commit():提交一个事物 close():关闭数据库连接 rollback():回滚一个事物 cursor():创建一个游标对象2,游标对象 所有的SQL执行语句都是在游标对象下进行的。cur=con.cursor()游标对象有以下操作: execute(): 执行
2015-05-28 18:23:55
1206
原创 python—BeautifulSoup学习总结
1,BeautifulSoup( )接受的参数: soup 就是BeautifulSoup处理格式化后的字符串 (1)类似html_doc = """<html><head><title>The Dormouse's story</title></head><body><p class="title"><b>The Dormouse's story</b></p><p class="s
2015-05-28 16:16:57
801
原创 《集体智慧编程》—K均值聚类
源码: 注: import clusters 来源于另外一篇博客 参考链接这里写链接内容 data数据集由generatefeedvector.py生成 参考链接这里写链接内容# --coding:utf-8--import randomimport clustersdef kcluster(rows,distance =clusters.pearson,k=4): #q确定每
2015-05-21 17:04:05
1084
原创 《集体智慧编程》——分级聚类的实现
**(博客-单词)**一:feeflist.txt http://blog.youkuaiyun.com/hlx371240/rss/list http://blog.youkuaiyun.com/sunflower606/rss/list http://blog.youkuaiyun.com/leshami/rss/list http://blog.youkuaiyun.com/cuit/rss/list http://blog.c
2015-05-20 14:23:09
1456
原创 《推荐系统实战》——基于物品的协同过滤实现
一:物品相似度计算&推荐源代码(算法参考项亮《推荐系统实战》P55): 其他代码模块参考我的另外一篇博客: 这里写链接内容 def ItemSimilarity(self, train=None): train = self.traindata or train #calculate co-rated users between items C =
2015-05-15 21:54:53
1804
原创 Librec学习笔记
librec是一个JAVA编写的推荐系统库,里面实现了大部分经典的推荐算法。在官网上下载这里写链接内容 下载方式: 1,可以在eclipse中使用命令git clone https://github.com/guoguibing/librec.git下载 2,也可以在https://github.com/guoguibing/librec.git 点击download zip注意:不要下载
2015-05-12 19:22:55
3339
原创 Python学习笔记
一:python类的使用方法 基本操作同C++ 属性+方法=类 类是对象的模板 初始化:def init(self,[agv1,agv2…]) 其中self指向具体的对象,参数个数可以使任意的。 析构函数:def del(self) 系统自带 使用:对象名=类名(参数列表) 对象名.方法名(参数列
2015-05-06 11:01:55
722
原创 《推荐系统实战》-基于用户的系统过滤推荐
参考书籍:项亮《推荐系统实战》 参考链接这里写链接内容# - * * coding: utf -8 - * -import randomimport mathclass UserBasedCF: def __init__(self,datafile = None): self.datafile = datafile self.readData()
2015-05-04 10:20:19
1895
原创 推荐系统学习总结
说明:之前学过的知识的总结 推荐系统: 协同过滤推荐:基于物品的推荐&基于用户的推荐 步骤: user-based 建立用户-物品评分举证 对矩阵进行SVD分解具体代码实现 目标用户的邻居用户 物品的预测评分 推荐评分最高K个物品__author__ = 'DELL'from math import sqrt'''critics={'Cathy':{'a':2.5,'b':3.
2015-05-03 15:21:50
881
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人