今日头条推荐特性

百科中对今日头条技术特点的描述如下社交和用户行为分析:
根据微博行为、阅读行为、地理位置、职业、年龄等挖掘出兴趣。通过社交行为分析,5秒钟计算出用户兴趣;通过用户行为分析,用户每次动作后,10秒内更新用户模型。
自然语言处理和图像识别技术:
对每条信息提取几十个到几百个高维特征,并进行降维、相似计算、聚类等计算去除重复信息;对信息进行机器分类、摘要抽取,LDA主题分析、信息质量识别、敏感词过滤、正能量指数计算等处理
基于机器学习的推荐引擎:
根据人的特征、环境特征、文章特征三者的匹配程度进行推荐
推荐时考虑信息质量以及正能量指数,推荐热度高、正能量值高的文章给更多人
实时海量数据处理构架:
实时推荐,0.1秒内计算推荐结果,3秒完成文章提取、挖掘、消重、分类,5秒计算出新用户兴趣分配,10秒内更新用户模型。
精准定位人群进行传播:
根据用户所在城市,自动识别本地新闻,精准推荐给当地居民
可根据用户年龄、性别、职业等特征,自动计算并推荐其感兴趣的资讯
传递社会正能量的武器
通过对海量信息的计算,可对社会突发事件做舆情预判,及时放大有价值的正能量事件
通过转发到社交网络,实现正能量的进一步传播和放大
构建知识型社会的有利武器
精准识别用户的兴趣爱好,每天推荐符合其职业、生活需要的积极向上的知识性内容。

日头条会在用户绑定微博后的 5 秒钟之内为用户建立起一个 DNA 兴趣图谱。这个图谱类似于一个数学模型,主要根据用户 SNS 账号上的标签、关注人群、好友、评论 / 转发、收藏等数据,以及用户的手机、位置、使用时间等数据提取而来。当中包括可视的(兴趣、爱好等比较好衡量的因素)和不可视的(文艺、清新等主观因素)两大主题,上万个维度。系统还会自动记录用户的阅读情况,不断摸索用户的兴趣,同时也在不断优化推荐的算法。换句话说,用得越多,就会越智能。


张一鸣认为,所谓个性化推荐,本质上是不需要用户做出任何选择的,因为每选择一样都要思考一下,过程还是比较痛苦的。只有让用户越方便,越偷懒的应用,才能体现出真正的个性化推荐。因此今日头条最大的亮点在于只需绑定社交账号,从此不再需要任何操作。由于看好这种“社交数据挖掘 + 个性化推荐”的模式,今日头条获得来自 SIG,以及华尔街著名经济学家,投资银行家,硅谷创业公司 CEO 的的数百万美元 A 轮投资。


除了今日头条,张一鸣的团队还开发了“好看图片”、“内涵漫画”、“笑多了会怀孕”等其他个性化阅读类应用,也都是来自对社交数据挖掘,判断什么笑话、图片是最受关注的。大数据挖掘已经开始成为趋势,不过在移动应用领域还没有一些比较成功的案例。基于社交数据挖掘的个性化阅读推荐,今日头条算是一次不错的尝试。相信不久后会有越来越多基于数据挖掘的应用诞生。
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值