- 博客(19)
- 资源 (11)
- 收藏
- 关注
原创 2012 阿里推荐活动小结
寻路推荐--阿稳标题"寻路"说的很形象,阿稳做讲座的功力很深厚,ppt的逻辑组织的非常好,整个讲座的思路都是先提出问题,再探讨解决办法。几个问题都是推荐实现过程中的典型问题,下面总结一下:*
2012-12-14 10:09:34
666
原创 刘鹏讲座小结
目的:任何广告相关的技术开发,想法都先要看立足于广告主,用户,平台哪一点用户吸引模型:曝光》理由》兴趣》理解》印象》转化展示广告发展:排期》(切分流量)demo定向》(不想切太细,不好卖)Ad network(批发)》(零售,细化到单个pv)Exchange核心公式:roi=imp*ctr*value (所有的广告产品都立足于该公式) cpm广
2012-12-12 10:03:34
882
原创 Input Format相关知识小结
1. hadoop为什么只能设置reduce数,而不能设置map数? 首先单个文件(即hadoop fs -ls看到的文件)的split计算公式:split数目=file_size/max(min_format_size, min_split_size, min(block_size, max_split_size) 默认情况下,min_split_size=1, max_spl
2012-12-06 18:17:04
963
原创 参加2012 resys会议小结
今天的会议包括facebook的石言心,hulu的项亮,腾讯的王益以及百度的刘其文,具体报告信息可以参见:http://www.resyschina.com/2012/石言心报告有价值的内容很多,报告的标题虽然是"facebook推荐系统“,但更多的却是与广告系统的内容。报告的分享很有条理,重点说下自己印象比较深刻的内容:* 特征的选择离线特征:包括user的demograph
2012-12-05 10:01:38
1334
原创 Git-push代码分析
介绍 git-push的功能主要是用本地的分支来更新远程分支,当我们想要更新服务器上的某个分支时,就需要用到这个命令。对应的源代码主文件为builtin-send-pack.c。用法 利用man git-push能看到git-push的帮助文档git-push
2011-08-25 16:20:59
1203
原创 Git 源代码分析
Git介绍 Git --- The stupid content tracker, 傻瓜内容跟踪器。Linus 是这样给我们介绍 Git 的。 Git 是用于 Linux 内核开发的版本控制工具。与常用的版本控制工具 CVS, Subversion 等不同,它采用了分布式
2011-08-25 16:19:52
3610
转载 输入法核心数据结构及算法的设计
转载自: http://blog.youkuaiyun.com/monkey_d_meng/article/details/6559309突然想到了去年腾讯招实习生时笔试的附加题目,就是让你给出一个输入法的设计方案,要求能够提供智能的输入提示,具体题目要求我不太记得了,简单岂见我们只
2011-08-25 16:01:25
1019
原创 GDB pretty printer: linux下用gdb调试c++时如何更好的查看STL容器值
GDB pretty printer 提供了更方便的STL容器显示方法能够方便debug,虽然以前也有通过其它脚本方式显示STL内容的方法,但是这种方案应该是效果最好的。看下效果:对于一个 vector > m_nodeLevel;的显示如下(gdb) p n
2011-08-25 15:59:16
2751
转载 SVM入门(十)将SVM用于多类分类
转载自: http://www.blogjava.net/zhenandaci/archive/2009/03/26/262113.html从 SVM的那几张图可以看出来,SVM是一种典型的两类分类器,即它只回答属于正类还是负类的问题。而现实中要解决的问题,往往是多类
2011-08-25 15:55:46
779
转载 SVM入门(九)松弛变量(续)
转载自 http://www.blogjava.net/zhenandaci/archive/2009/03/17/260315.html接下来要说的东西其实不是松弛变量本身,但由于是为了使用松弛变量才引入的,因此放在这里也算合适,那就是惩罚因子C。回头看一眼引入了松
2011-08-25 15:54:37
431
转载 SVM入门(八)松弛变量
转载自 http://www.blogjava.net/zhenandaci/archive/2009/03/15/259786.html现在我们已经把一个本来线性不可分的文本分类问题,通过映射到高维空间而变成了线性可分的。就像下图这样: 圆形和方形
2011-08-25 15:53:55
347
转载 SVM入门(七)为何需要核函数
转载自 http://www.blogjava.net/zhenandaci/archive/2009/03/06/258288.html生存?还是毁灭?——哈姆雷特 可分?还是不可分?——支持向量机 之前一直在讨论的线性分类器,器如其名(汗,这是什么说法啊)
2011-08-25 15:52:48
324
转载 SVM入门(六)线性分类器的求解——问题的转化,直观角度
转载自:http://www.blogjava.net/zhenandaci/archive/2009/03/01/257237.html让我再一次比较完整的重复一下我们要解决的问题:我们有属于两个类别的样本点(并不限定这些点在二维空间中)若干,如图, 圆
2011-08-25 15:51:56
365
转载 SVM入门(五)线性分类器的求解——问题的描述Part2
转载自 http://www.blogjava.net/zhenandaci/archive/2009/02/14/254630.html从最一般的定义上说,一个求最小值的问题就是一个优化问题(也叫寻优问题,更文绉绉的叫法是规划——Programming),它同样由两
2011-08-25 15:51:03
346
转载 SVM入门(四)线性分类器的求解——问题的描述Part1
转载自 http://www.blogjava.net/zhenandaci/archive/2009/02/13/254578.html上节说到我们有了一个线性分类函数,也有了判断解优劣的标准——即有了优化的目标,这个目标就是最大化几何间隔,但是看过一些关于SVM的
2011-08-25 14:09:14
354
转载 SVM入门(一)至(三)
从网上看到的,写的非常浅显易懂,非常适合SVM入门转载自:http://www.blogjava.net/zhenandaci/archive/2009/02/13/254519.html(一)SVM的八股简介支持向量机(Support VectorMachine)是
2011-08-25 12:23:11
411
转载 GBDT算法
从网上看到一个关于该算法的小结,说的不错转载自:http://hi.baidu.com/hehehehello/blog/item/b2d09752cbda41140df3e35e.html1)为了建树时计算均方差,GBDT是对每个分类单独生成一个对连续值划分的决策树
2011-08-25 12:22:27
1612
转载 淘宝吴雪军:自然语言处理技术在搜索和广告中的应用
本文为淘宝广告技术部广告算法负责人、淘宝网研究员吴雪军在8月3日CTO俱乐部沙龙演讲实录转载自: http://news.youkuaiyun.com/a/20110809/302848.html编者按:本文为淘宝广告技术部广告算法负责人、淘宝网研究员吴雪军在8月3日CTO俱乐部沙龙
2011-08-25 12:20:39
983
转载 计算广告学体系
从网上看到的,觉得不错转载自: http://hi.baidu.com/gaoliang641/blog/item/ce04042bbc75cc2b1e308976.html
2011-08-25 10:02:43
609
UNIX.Network.Programming.Volume.1.3rd.Ed.The.Sockets.Networking.API-LiB
2009-04-25
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人
RSS订阅