原文地址——http://www.readwriteweb.com/archives/recommendation_engines.php
下面是我自己翻译的文字,在这存稿
去年10月,DVD在线租赁商 Netflix发布了一项不同寻常的有奖竞赛。Netflix提供了100万的悬赏金,要求是:谁能把他们的产品推荐引擎质量提升10%,将获得这笔巨额奖金。 Netflix因它的革新、大胆的动作而出名,不过,100万这个数字,对于这样的重大事件来说并不算多。
竞赛还在进行当中(至少会持续到2011年10月2日),这是不是一场炒作,或是低廉价格的研究呢?Netflix真的很需要更好的商业推荐引擎么?或则,它们很自信这个推荐已经很好了?今天的Netflix正在面临一个正在苏醒的巨人BlockBuster(注:Blockbuster已经通过收购CinemaNow公司而获得了下载服务)。它正在寻找一个竞争优势的切入点。而优秀的推荐系统能够黏住和吸引用户。例如;当一个用户归还一部电影,可以推荐另一部她/他可能感兴趣的电影-这样就增长了归还交易的可能性。
浏览和推荐
优秀的推荐引擎不仅使Netflix与众不同,对其他在线交易也很重要。网上有两个基本的活跃因素-搜索和浏览。当一个消费者很清楚的知道她的需求时,她会搜索。但是当她没有特定的目的时,她会浏览。这种浏览对推荐系统是个绝佳的机会,因为用户并没有专注的找特定的东西-她现在是愿意接受建议的。在浏览的过程中,用户的吸引力(和钱)慢慢被抓住。通过给用户展示吸引人的东西,网站使交易成功的可能性最大化。所以如果网站能增加给用户推荐的机会,它会赚更多的钱。显然,这是一个很棘手的问题,但是解决它的动机却是很大。主要的方式如下:
个性化推荐-建立在用户以往行为的推荐
社会化推荐-根据过往同好者的历史推荐
基于产品的推荐-根据商品本身推荐
复合推荐-前3种推荐的组合
我们看看经典的amazon,网络新手Pandora和del.icio.us,研究他们之间的不同之处
Amazon-推荐之王
amazon被认为是网络商店的领袖,尤其是在推荐领域。在过去的十年中,公司投入了大量的资金和人力,建立一系列智能推荐,记录用户的浏览历史,过去的购买资料,以及其他同类商品的购买者-所有的一切都是为了让你买更多的东西。让我们看看Amazon的各类推荐系统是如何工作的。下面是我登录的时候,在主区域展示给我的内容
浏览过该商品的人都购买了什么?(图片)
上面是社会化推荐。它从数据上推荐为什么我应该买这类的产品。请注意,这个推荐也是个性化推荐,它是建立在我最近的点击记录基础上推荐的。(图)
这是基于产品的推荐,具体说是新书推荐。点击“为什么给我推荐这个?”会显示最近的购买记录。这个推荐也是个性化推荐,因为是依据我过去的行为来推荐的。
有4个方面在网页上展现,每一个有个性化算法的不同组合。我们总结如下(图)
毫不奇怪,系统稳定并且全面。所有的推荐都是建立在个人行为,加上商品本身特征,或是amazon上其他人的行为。你是否喜欢来购买是因为这个和你以前的购买有关,或者它是个流行品,系统促使你买更多的东西放在购物车中。
超越Amazon
Amazon系统很知名。这是协作商店的特点,操作机制也很难被复制。amazon花了10多年的时间建立和优化它。需要依靠大量的商品数据,收集用户在几分钟和几年前的操作行为。新公司如何来竞争呢?
令人惊讶的是,这有一条路。答案是和网络购物没有什么关系的遗传学-基因。如你所知,这项科学研究DNA-基因-是如何编译人类的特征和行为的。例如:家庭成员的外貌和行为很相像,因为共同分享一系列的基因。基因作为科学,已经有150年的历史了,一直被认为在医药和历史上是非常有力量的工具。但是在2000年1月6日,事情出现了意外的变化-Tim Westergren 和他的朋友决定把基因观念应用到mp3
Pandara-建立在基因上的推荐系统
音乐染色体项目发布,把音乐分解成基础的基因成分。想法背后是,我们喜欢音乐是因为被某些特征所吸引-所以为什么不设计个音乐推荐系统,在众多歌曲中推荐出类似的音乐呢。这种推荐引擎属于产品推荐分类中。但是具有深刻创新意义的是,产品的相似性。相似的物品,就像一首歌,需要通过一系列基因的包装来识别(图)
经过几年的努力和处理大量的音乐,项目积累了足够多的数据,并发布了名字叫“Pandora”的服务。Pandora因为准确率高,低成本的登入,成为了热点。用户只需要挑选一首曲子,或是歌曲,就可以建立小站,马上播放相似的音乐。
没有多少人能抵抗住这种马上满足感。事实是Pandora明白,是音乐相似的东西抓住了用户,而不用学习用户喜欢什么。Pandora需要用户的品味或是记忆,它有自己建立的音乐DNA。当然,有时候并没有这么完美,比如当用户口味可能并不是完整的表现出来时,就大错特错了
这种基于基因的方法是否能应用在其他领域-比如图书,电影,酒类,餐馆或是旅游目的地呢?是什么构成了每个分类的基因呢?比如,能这样描述酒的特征么?基因可能是描述酒的味道的物质,黑莓口味,粗烈的,果味,复合型,混合型等。对于一本书,基因能描述情节的段落么?如果基因是物体的属性,在我们心目中是独一无二的,我们应该可以用基因定义其他事情。在过去几年中,我们一直在线上应用。这个称之为标签。
Del.icio.us-标签能成为基因么?
Pandora初期投入大量的资金,因为数千首音乐需要人工标注。社会化书签现象Del.icio.us做法则不同-它让人们自己来评注。这种自发组织的方法进展的非常好,Del.icio.us很快流行。现在Del.icio.us被认为不仅仅是书签收藏-这里也是新闻网站和搜索引擎。但是Del.icio.us是推荐系统么?
答案是肯定的。这是基于一个基因的基础推荐系统-单一标签。比如,在上面的图片中,我们看到Linux标签的关注链接,我们也看到相关标签,像open source和ubuntu。但是更多的令人兴奋的推荐系统是建立在多标签基础上。但是现在这种方法并不是总生效,所以还不是很显著。幸运的是,它可以在读/写网页上生效,并生成强大的类似的blog列表
Del.icio.us的方法保持了自助组织分类和推荐系统的可能性。当用户足够多,链接足够多,社会化标签能形成一个系统,这个系统可以在图书/酒类/音乐中同样工作的很好。当然,标签够好就能成为基因。
总结
推荐引擎是线上商务系统和用户体验的重要组成部分。零售商有强烈的意愿给浏览型用户提供推荐,促进更多的交易。amazon,网络购物的领先者,是拥有强大个性化推荐的提供商。其他零售商面对的问题是缺少用户信息和基础。
最近关于推荐引擎的各种方法,比如来自基因灵感的Pandara,社会化标签先锋Del.icio.us,都很吸引人。这些方法能提供即时满意,不需要问用户的喜好和过去的历史。
不管未来会出现什么,amazon,pandora以及Del.icio.us是目前杰出的推荐技术的代表。我们向您推荐他们,并密切观察它们的未来。