金小朵-优快云博客

原创面试总结（截至2016/4/14）

第一个版块一：推荐系统的相关知识*重点内容* 一个推荐系统的整体框架：存储，推荐引擎，日志系统，UI，用户一般是由几个算法混合而成，形成初始推荐结果，然后进行过滤，排名，给出推荐解释。常见的推荐算法： 1. 协同过滤：基于物品&用户的推荐用户—物品相似度矩阵，SVD分解，找出最相似的K个物品，根据目标用户对邻接物品评测来预测目标物品对物品的评价。评价：新奇度

2016-04-14 19:37:16 638

原创 Cracking the code interview总结

1. 第八章：递归程序调用自己称为递归。把大问题化成与自身相类似的小问题。递归需要边界条件，递归前进段，递归返回段。当边界条件不满足时，递归前进，当边界条件满足时，递归返回。空间成本&时间成本相对较大。（1）动态规划：节约时间&空间，把重复性的计算记录下来。如斐波拉契数列，采用递归的算法复杂度为O(n^2),动态规划为O(n).if(n<=1) return ;fris

2016-04-14 14:09:30 1742

原创 Java常见面试题

1：关键字static 属于类，方便在没有创建对象的情况下来进行调用（方法/变量），但是static方法不能访问非静态的类，因为非静态的类是属于对象的。 static变量，为静态成员变量，类被初次加载的时候初始化值，被对个对象共享，方便优化代码。类的执行是从main方法，但是执行前先加载类（加载时注意有没有static方法/变量），在进行构造函数等。public class Test ext

2016-04-13 09:45:46 440

原创珍藏的链接

最好的Python机器学习库： https://mp.weixin.qq.com/s?__biz=MzA4Mzc0NjkwNA==&mid=401299851&idx=2&sn=b782be57f41d9e1a82f451b97e3eadcb&scene=0#rd

2015-12-10 19:21:43 5175

机器学习领域的大牛们： http://emuch.net/html/201209/4842092.html http://blog.youkuaiyun.com/xiaxiazls/article/details/7237373 机器学习好的会议： https://www.dropbox.com/s/6ljj5msjrfyftsq/%E5%B8%B8%E8%A7%81%E4%BC%9A%E8%AE%AE

2015-11-23 13:49:23 522

原创 theano

一：简介 Keras是基于Theano的一个深度学习框架，它的设计参考了Torch，用Python语言编写，是一个高度模块化的神经网络库，支持GPU和CPU。使用文档：http://keras.io/ 使用上的问题可以到github提issue:https://github.com/fchollet/keras

2015-11-23 13:42:41 622

原创百度实习

1：process.py#coding:utf-8__author__ = 'jinduo'import sysdef C_area(poi_file,filename): #创建字典 C_POI文件，guid:name dict_poi = {} dict_bid_null ={} dict_name_wrong={} f_C_POI = open(p

2015-11-13 15:45:59 1013

转载 python数据挖掘常用包

原文链接： http://qxde01.blog.163.com/blog/static/67335744201368101922991/ Python在科学计算领域，有两个重要的扩展模块：Numpy和Scipy。其中Numpy是一个用python实现的科学计算包。包括：一个强大的N维数组对象Array；比较成熟的（广播）函数库；用于整合C/C++和Fortran代码的工具包；实用的

2015-11-09 14:26:45 6336

原创 Tushare学习笔记

学习连接：http://tushare.waditu.com/ python 下载包的地址：https://pypi.python.org/pypi 通联数据token：c873bf443ea91eae100adac4276e978554fdffe0697f93fb4e77bfb8c0efc792 金小朵加油撒~~~ 几个重要的函数：获取历史数据函数：ts.get_hist_data('

2015-11-09 14:25:07 3333

转载推荐系统——SVD/SVD++

1，SVD源代码：svd.py#Ver1.0#Zero @2012.5.2#import mathimport randomimport cPickle as pickle#calculate the overall averagedef Average(fileName): fi = open(fileName, 'r') result = 0.0 cnt =

2015-06-14 11:59:38 4777

转载几种常见的误差评估方法

1.RMS:均方根误差2.RMSE:均方根误差它是观测值与真值偏差的平方和观测次数n比值的平方根，在实际测量中，观测次数n总是有限的，真值只能用最可信赖（最佳）值来代替.方根误差对一组测量中的特大或特小误差反映非常敏感，所以，均方根误差能够很好地反映出测量的精密度。3.标准差（Standard Deviation）标准差是方差的算术平方根，也称均方差（mean square error），是各数据

2015-06-14 10:09:07 18659 1

原创 python—pysqlite的使用

1，数据库连接对象的创建con = sqlite.connect("mydbs.db")con有以下几个常用的属性： commit（）：提交一个事物 close（）：关闭数据库连接 rollback（）：回滚一个事物 cursor（）：创建一个游标对象2，游标对象所有的SQL执行语句都是在游标对象下进行的。cur=con.cursor()游标对象有以下操作： execute(): 执行

2015-05-28 18:23:55 1206

原创 python—BeautifulSoup学习总结

1，BeautifulSoup( )接受的参数： soup 就是BeautifulSoup处理格式化后的字符串 (1)类似html_doc = """<html><head><title>The Dormouse's story</title></head><body><p class="title"><b>The Dormouse's story</b></p><p class="s

2015-05-28 16:16:57 801

原创《集体智慧编程》—K均值聚类

源码：注： import clusters 来源于另外一篇博客参考链接这里写链接内容 data数据集由generatefeedvector.py生成参考链接这里写链接内容# --coding:utf-8--import randomimport clustersdef kcluster(rows,distance =clusters.pearson,k=4): #q确定每

2015-05-21 17:04:05 1084

原创《集体智慧编程》——分级聚类的实现

**（博客-单词）**一：feeflist.txt http://blog.youkuaiyun.com/hlx371240/rss/list http://blog.youkuaiyun.com/sunflower606/rss/list http://blog.youkuaiyun.com/leshami/rss/list http://blog.youkuaiyun.com/cuit/rss/list http://blog.c

2015-05-20 14:23:09 1456

原创集体智慧编程-单词统计

这里写链接内容

2015-05-18 19:45:13 828

原创《推荐系统实战》——基于物品的协同过滤实现

一：物品相似度计算&推荐源代码（算法参考项亮《推荐系统实战》P55）：其他代码模块参考我的另外一篇博客：这里写链接内容 def ItemSimilarity(self, train=None): train = self.traindata or train #calculate co-rated users between items C =

2015-05-15 21:54:53 1804

原创 Librec学习笔记

librec是一个JAVA编写的推荐系统库，里面实现了大部分经典的推荐算法。在官网上下载这里写链接内容下载方式： 1，可以在eclipse中使用命令git clone https://github.com/guoguibing/librec.git下载 2，也可以在https://github.com/guoguibing/librec.git 点击download zip注意：不要下载

2015-05-12 19:22:55 3339

原创 Python学习笔记

一:python类的使用方法基本操作同C++ 属性+方法=类类是对象的模板初始化:def init(self,[agv1,agv2…]) 其中self指向具体的对象，参数个数可以使任意的。析构函数：def del(self) 系统自带使用：对象名=类名（参数列表）对象名.方法名（参数列

2015-05-06 11:01:55 722

原创《推荐系统实战》-基于用户的系统过滤推荐

参考书籍：项亮《推荐系统实战》参考链接这里写链接内容# - * * coding: utf -8 - * -import randomimport mathclass UserBasedCF: def __init__(self,datafile = None): self.datafile = datafile self.readData()

2015-05-04 10:20:19 1895

原创推荐系统学习总结

说明：之前学过的知识的总结推荐系统：协同过滤推荐：基于物品的推荐&基于用户的推荐步骤： user-based 建立用户-物品评分举证对矩阵进行SVD分解具体代码实现目标用户的邻居用户物品的预测评分推荐评分最高K个物品__author__ = 'DELL'from math import sqrt'''critics={'Cathy':{'a':2.5,'b':3.

2015-05-03 15:21:50 881

原创欢迎使用优快云-markdown编辑器

书山有路勤为径，学海无涯苦作舟！数学公式编辑：这里写链接内容

2015-05-03 13:55:10 335

sunflower606的博客