- 博客(56)
- 资源 (50)
- 收藏
- 关注
原创 paddlepaddle入门学习-房价预测
1、数据读取如何把数据放到模型里去训练呢?我们知道,基本的方法一般有两种:一次性加载到内存:模型训练时直接从内存中取数据,不需要大量的IO消耗,速度快,适合少量数据。 加载到磁盘/HDFS/共享存储等:这样不用占用内存空间,在处理大量数据时一般采取这种方式,但是缺点是每次数据加载进来也是一次IO的开销,非常影响速度。 在PaddlePaddle中我们可以有三种模式来读取数据:分...
2019-05-22 11:38:37
685
原创 mac下caffe的安装
1、安装home_brew/usr/bin/ruby -e "$(curl -fsSL https://raw.githubusercontent.com/Homebrew/install/master/install)"2、安装依赖包(1)brew install -vd snappy leveldb gflags glog szip lmdb(2)bre
2016-10-26 10:41:02
3529
原创 从一道面试题理解双重指针
#include using namespace std;void GetMemory1(char **p, int num){ *p = (char *)malloc(sizeof(char) * num);}void GetMemory2(char *p, int num){ p = (char *)malloc(sizeof(char) * num);}
2015-03-31 12:21:45
1406
转载 pattern recognition and machine learning这本书怎么看?
这篇是今年最后一篇博客了,年中的时候写过一部分,没能坚持下来。在新的一年里,希望自己能够在技术上有所突破,在推荐系统、机器学习、自然语言处理处理领域成为初级专家。转自知乎:http://www.zhihu.com/question/20970802,作者 杨超本书是经典中的经典我完整看了3遍以上 要算上没看完的几次 得有快10遍 (剖析自己,没有一本是认真看完的)是的 前几次我
2015-02-16 10:35:19
3592
原创 2014年年终总结与计划
感觉这一年是比较累也比较充实的一年,主要做成了两件事,一个是换房成功,另一个是做了自己喜欢的工作。曾经望着北京市区的高楼大厦,想起自己偏远的房子。为什么这么多房子,却没有一套属于自己的。每次满怀期待的去远郊的房子,可是心情总是被遥远的路途打败。这件事终于在14年有了转机,由于卖掉了自己在公司的股票,再加上老婆那边给予了支持,把房子卖掉,在二环边上买了一套。卖房的过程很漫长,跑了很多趟,
2014-12-31 19:04:25
1066
原创 [leetcode] Path sum
1、题目描述Given a binary tree and a sum, determine if the tree has a root-to-leaf path such that adding up all the values along the path equals the given sum.For example:Given the below binary t
2014-10-16 20:12:20
915
原创 [leetcode] Word Break
1、题目描述Given a string s and a dictionary of words dict, determine if s can be segmented into a space-separated sequence of one or more dictionary words.For example, givens = "leetcode",di
2014-10-13 20:05:18
878
原创 [mahout in action] 调通第一个例子
import java.io.File;import java.io.IOException;import java.util.List;import org.apache.mahout.cf.taste.common.TasteException;import org.apache.mahout.cf.taste.impl.model.file.FileDataModel;impor
2014-09-25 19:49:33
1708
原创 [mahout in action] Mahout的下载、安装
1、下载mahoutURL:http://mahout.apache.org/当前版本为0.9,
2014-09-25 19:29:52
2673
原创 [leetcode] Best Time to Buy and Sell Stock
#leetcode# Best Time to Buy and Sell StockProblem:Say you have an array for which the ith element is the price of a given stock on day i.If you were only permitted to complete at most one tr
2014-09-25 18:39:33
876
原创 POJ2503 Babelfish
#include #include #include struct DictNode{ char key[32]; char value[32];};int comp_value(const void* a,const void* b){ return strcmp(((DictNode*)a)->value , (char *)b);}int co
2014-08-12 09:42:29
927
翻译 google news recommendation - 基于点击行为的用户个性化新闻推荐
1 摘要2 简介新闻阅读,随着互联网的发展,访问方式已经从订阅纸质媒体扩展到访问数目众多的网络新闻源。新闻聚集网站如google news、yahoo news,从不同的新闻网站采集数据,并提供一个聚合的视图。对于这样的新闻服务网站来说,一个严重的问题是文章的数目对于用户来说是巨大的。因此挑战是如何帮助用户找到他们感兴趣的新闻(听上去好有诱惑力呀)。基于内容的推荐是解决信息过载
2014-07-30 16:22:05
6518
转载 国外程序员整理的机器学习资源大全
原文链接: awesome-machine-learning 翻译: 伯乐在线 - toolate译文链接: http://blog.jobbole.com/73806/本文汇编了一些机器学习领域的框架、库以及软件(按编程语言排序)。C++计算机视觉CCV —基于C语言/提供缓存/核心的机器视觉库,新颖的机器视觉库OpenCV—它提供C++, C, Py
2014-07-22 11:15:40
2524
原创 推荐系统评价方法
一、现有评价指标调研1、 推荐系统实验方法在介绍评价指标之前,先讨论下计算和获取这些指标的主要实验方法。(1) 离线实验离线实验一般有如下步骤:S1 通过日志系统获取用户行为数据,并按照一定格式生成数据集;S2 将数据集分成训练集和测试集;S3 在训练集上训练用户兴趣模型,在测试机上进行预测;S4 通过预先定义的离线评测指标,评价测试集上的预测结果;
2014-07-18 15:46:38
4961
原创 梯度下降原理及在线性回归、逻辑回归中的应用
参考文献:http://blog.sina.com.cn/s/blog_62339a2401015jyq.html
2014-07-03 16:47:00
8698
原创 逻辑回归简介
回归问题在参数空间上(不妨假设为二维空间)有一些样本点,找一条曲线尽量拟合所有的样本点。这里面的“找一条”曲线不是漫无边际的找,而是先假定曲线的形式,如:直线、二次曲线等等,然后来学习确定曲线的各项参数。一方面,算法没有那么神奇,不能够告诉我们用什么类型的曲线拟合最好;另一方面,如果最初的假定就错了(用直线拟合最好,但是认为选择了二次曲线),最终的效果也是不好的。
2014-07-01 12:08:14
11042
转载 关键词抽取简介
转自:http://ling0322.info/2014/04/08/introduction-to-keyphrase-extraction.html关键词提取就是从文本里面把跟这篇文章意义最相关的一些词抽取出来。这个可以追溯到文献检索初期,当时还不支持全文搜索的时候,关键词就可以作为搜索这篇论文的词语。因此,目前依然可以在论文中看到关键词这一项。除了这些以外,关键词还可以在
2014-07-01 11:41:24
11928
转载 第八讲. 支持向量机进行机器学习——Support Vector Machine
http://blog.youkuaiyun.com/abcjennifer/article/details/7849812本栏目(Machine learning)包括单参数的线性回归、多参数的线性回归、Octave Tutorial、Logistic Regression、Regularization、神经网络、机器学习系统设计、SVM(Support Vector Machines 支持向量
2014-06-23 10:32:32
11340
转载 Python程序员的10个常见错误
关于PythonPython是一门解释性的,面向对象的,并具有动态语义的高级编程语言。它高级的内置数据结构,结合其动态类型和动态绑定的特性,使得它在快速应用程序开发(Rapid Application Development)中颇为受欢迎,同时Python还能作为脚本语言或者胶水语言讲现成的组件或者服务结合起来。Python支持模块(modules)和包(packages),所以也
2014-06-20 10:23:09
2129
转载 机器学习中的数学(2)-线性回归,偏差、方差权衡
线性回归定义: 在上一个主题中,也是一个与回归相关的,不过上一节更侧重于梯度这个概念,这一节更侧重于回归本身与偏差和方差的概念。 回归最简单的定义是,给出一个点集D,用一个函数去拟合这个点集,并且使得点集与拟合函数间的误差最小。 上图所示,给出一个点集(x,y), 需要用一个函数去拟合这个点集,蓝色的点是点集中的点,而红色的曲线是函数的曲线,第一
2014-06-10 16:36:43
1056
转载 回归(regression)、梯度下降(gradient descent)
转自 - http://www.cnblogs.com/LeftNotEasy/archive/2010/12/05/mathmatic_in_machine_learning_1_regression_and_gradient_descent.html回归与梯度下降: 回归在数学上来说是给定一个点集,能够用一条曲线去拟合之,如果这个曲线是一条直线,那就被称为线性回归,如果曲线
2014-06-10 16:22:56
1105
转载 线性判别分析(LDA), 主成分分析(PCA)
转自 http://www.cnblogs.com/LeftNotEasy/archive/2011/01/08/lda-and-pca-machine-learning.html
2014-06-10 11:03:09
1032
转载 强大的矩阵奇异值分解(SVD)及其应用
转自:http://www.cnblogs.com/LeftNotEasy/archive/2011/01/19/svd-and-applications.html前言: 上一次写了关于PCA与LDA的文章,PCA的实现一般有两种,一种是用特征值分解去实现的,一种是用奇异值分解去实现的。在上篇文章中便是基于特征值分解的一种解释。特征值和奇异值在大部分人的印象中,往往是停留
2014-06-10 11:00:01
1195
转载 libMF源码分析
libMF是由台湾大学林智仁老师实验室开发的,一个用于推荐系统领域的矩阵分解开源库。矩阵分解通常用于协同过滤方法。libMF的主要特点:用了user和item的隐含特征,user和item的评分偏差bias及所有评分的评分值。libMF可以用于多核CPU的并行化计算,并且还可以有效利用CPU的SSE指令以达到加速计算的目的。官网地址注意,本文分析的是libMF的第一个版本v1.0。现在
2014-06-03 10:58:06
2904
转载 用 WEKA 进行数据挖掘,第 1 部分: 简介和回归
什么是数据挖掘?数据挖掘,就其核心而言,是指将大量数据转变为有实际意义的模式和规则。并且,它还可以分为两种类型:直接的和间接的。在 直接的 数据挖掘中,您会尝试预测一个特定的数据点 — 比如,以给定的一个房子的售价来预测邻近地区内的其他房子的售价。在 间接的 数据挖掘中,您会尝试创建数据组或找到现有数据内的模式 — 比如,创建 “中产阶级妇女”的人群。实际上,每次的美国人口统计
2014-05-08 15:32:01
1218
原创 关联规则挖掘 - Apriori算法
Apriori 介绍Apriori 算法使用频繁项集的先验知识,使用一种称作逐层搜索的迭代方法, k 项集用于探索 (k+1) 项集。首先,通过扫描事务(交易)记录,找出所有的频繁 1 项集,该集合记做 L1 ,然后利用 L1 找频繁 2 项集的集合 L2 ,L2 找 L3 ,如此下去,直到不能再找到任何频繁 k 项集。最后再在所有的频繁集中找出强规则,即产生用户感兴趣的关联规则。
2014-05-07 15:55:12
1825
转载 A Large set of Machine Learning Resources for Beginners to Mavens
转自:我爱机器学习(52ml.net) » 《A Large set of Machine Learning Resources for Beginners to Mavens》Machine Learning 101:I. Introduction to Machine Learninghttp://homepages.inf.ed.ac.uk/rbf/IAPR/re
2014-05-06 14:53:10
2715
转载 最大熵模型介绍及实现
最大熵模型介绍Overview统计建模方法是用来modeling随机过程行为的。在构造模型时,通常供我们使用的是随机过程的采样,也就是训练数据。这些样本所具有的知识(较少),事实上,不能完整地反映整个随机过程的状态。建模的目的,就是将这些不完整的知识转化成简洁但准确的模型。我们可以用这个模型去预测随机过程未来的行为。在统计建模这个领域,指数模型被证明是非常好用的。因此,
2014-04-29 15:33:17
53436
1
原创 Java中super关键字的用法及示例
注意到这个关键字一段时间了主要是下面想到的,问题是为什么要在super的setup函数前面?@Overrideprotected void setup(Context context) throws IOException, InterruptedException { super.setup(context);}(1)子类的构造函数如果要引
2014-04-24 14:56:57
8034
1
转载 SIFT算法详解
尺度不变特征变换匹配算法详解Scale Invariant Feature Transform(SIFT)Just For Funzdd zddmail@gmail.com or (zddhub@gmail.com)对于初学者,从David G.Lowe的论文到实现,有许多鸿沟,本文帮你跨越。1、SIFT综述尺度不变特征转换(Scale
2014-04-24 12:16:18
1108
转载 AWK 简明教程
转自:酷壳,有一些网友看了前两天的《Linux下应该知道的技巧》希望我能教教他们用awk和sed,所以,出现了这篇文章。我估计这些80后的年轻朋友可能对awk/sed这类上古神器有点陌生了,所以需要我这个老家伙来炒炒冷饭。况且,AWK是贝尔实验室1977年搞出来的文本出现神器,今年是蛇年,是AWK的本命年,而且年纪和我相仿,所以非常有必要为他写篇文章。之所以叫AWK是因为其取了
2014-04-18 10:41:26
822
转载 斯坦福大学自然语言处理第七课“情感分析(Sentiment Analysis)”
一、课程介绍斯坦福大学于2012年3月在Coursera启动了在线自然语言处理课程,由NLP领域大牛Dan Jurafsky 和 Chirs Manning教授授课:https://class.coursera.org/nlp/以下是本课程的学习笔记,以课程PPT/PDF为主,其他参考资料为辅,融入个人拓展、注解,抛砖引玉,欢迎大家在“我爱公开课”上一起探讨学习。课件汇
2014-04-17 11:05:41
28997
转载 探索推荐引擎内部的秘密:深入推荐引擎相关算法 - 聚类
智能推荐大都基于海量数据的计算和处理,然而我们发现在海量数据上高效的运行协同过滤算法以及其他推荐策略这样高复杂的算法是有很大的挑战的,在面对解决这个问题的过程中,大家提出了很多减少计算量的方法,而聚类无疑是其中最优的选择之一。 聚类 (Clustering) 是一个数据挖掘的经典问题,它的目的是将数据分为多个簇 (Cluster),在同一个簇中的对象之间有较高的相似度,而不同簇的对象差别较大。
2014-04-14 09:56:15
2047
Advanced Linux Programming
2008-11-04
linux内核源码分析
2008-11-04
ACE自适配通信环境.pdf
2008-10-16
Inside the C++ Object Model
2008-10-16
计算机程序设计艺术 第1卷 基本算法(第3版)
2008-10-16
软件架构设计的思想与模式
2008-10-16
rfc793 tcp协议
2008-10-14
xerces src_2_8_0
2008-09-18
log4j日志使用说明
2008-06-03
你必须知道的495个C语言问题
2009-05-08
数据库系统概念第四版 part2
2009-04-14
数据库系统概念第四版 part1
2009-04-14
Java核心技术 卷Ⅱ:高级特性
2009-03-30
微软研发致胜策略(PDF)
2009-03-23
数据结构算法与应用-C++语言描述
2009-03-11
TCPIP协议详解卷一:协议
2009-03-06
TCPIP协议详解卷三:TCP事务协议HTTPNNTP和UNIX域协议
2009-03-06
Windows 网络编程 第二版 英文版
2009-02-25
UNIX环境高级编程
2009-02-16
Computer Networks, Fourth Edition
2009-02-12
面向对象设计60条原则
2009-01-20
Learning the bash Shell - 2nd Edition (o'reilly).chm
2008-11-04
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人