会玩会生活!兴趣标签体系的背后方案是(1)

兴趣标签体系解决方案

上图是兴趣标签体系的整体解决方案。主流程是基于平台内商品/内容的文本信息进行文本分词清洗,与运营同学提供的关键词进行文本匹配,召回兴趣领域对应的商品/内容等行为标的。

再通过计算用户对商品/内容的行为,汇总得到用户-兴趣领域的得分,汇总生成兴趣人群。在用关键词召回时,对于一些无法枚举或者行业经验不足的情况,我们通过关键词关联进行了补充。

得益于圈子文化喜欢标榜个性的特点,95后的大部分兴趣领域都可以用具有唯一意义的关键词来描述。因此,理解用户兴趣的问题就转化成了以下两个问题:

  • 如何通过关键词召回兴趣人群

  • 如何筛选合适的关键词


 如何通过关键词召回兴趣人群


选型初期,我们与闲鱼社区的工程团队一起,讨论了两套方案:

**【方案1】**直接计算用户-关键词之间的关联关系,并将这种关联关系导入到在线平台,实现在线或近线的检索召回。这种方式具备很好的灵活性和可扩展性,但可能会存在由于关键词分词而带来的歧义。

例如,当我想找到搜索了「复古 摄影」的用户时,「复古摄影」可能会被分词为「复古」和「摄影」分别进行召回,这就可能召回的是搜索了「复古 口红」和「日系 摄影」的用户,影响了人群打标的准确性。

此外,全量的用户-关键词关联数据量非常大,会在很大程度上影响检索效率。考虑到初期重点运营长尾兴趣领域,我们将实现方式调整为方案2。

**【方案2】**通过用户-商品-关键词的方式进行关联。经过多年沉淀,闲鱼平台集合了丰富的用户行为数据。

我们首先通过关键词匹配对应的商品,匹配内容包含商品的标题、描述等文本信息,商品的集合作为兴趣内容的表达。接着统计用户在召回商品上的行为(如浏览、收藏、互动、交易等),并在行为类型、行为频次和行为时间上进行加权,得到「用户-商品」的行为程度得分。

由于兴趣标签属于长周期标签,所有用户打标流程都可以放在离线计算完成,再将打标好的数据导入线上平台,依托闲鱼强大的人群运营平台和精准投放链路,实现最终的人群精准运营。

理论上,用户在兴趣商品上的所有「用户-商品」行为得分加和即为用户-兴趣得分。但是在做兴趣粒度的汇总时,我们希望能够将用户在平台的其他行为偏好也纳入考虑——由于兴趣领域相对较为长尾,有些用户虽然对兴趣领域商品有过一些行为,但综合观察可以发现该用户在平台非常活跃,对其他领域的行为偏好可能还更加浓厚——这种用户如果在排序中非常靠前,会对那些在平台活跃度一般,但对兴趣领域十分关注的用户造成打击。

而我们构建兴趣标签的其中一个重要目标,就是为了能够拉动长尾的兴趣类用户在平台更多地发现适合自己的内容和相同喜好的用户,进而提升长尾流量的活跃度与粘性。为此,我们在计算用户-兴趣得分时,借鉴了文本挖掘中的TF-IDF算法,计算该兴趣领域对用户的重要程度。

通过关键词与用户行为计算用户-兴趣得分

TF-IDF是一种文本挖掘算法,用以计算某个单词对一篇文章的重要程度。其主要思想是:如果某个单词在一篇文章中出现的频率高,并且在其他文章中很少出现,则认为此单词能够很好地标记文章的主题,具有良好的区分能力。TF-IDF其实是TF*IDF,其中:

体现了该单词在单文件中的出现频率;

体现了该单词在文件集合中的类别区分能力。

单词在同一份文件中出现的频率越高,且文件集合中包含该词的文件数越少,说明单词的文本分类能力越强,越能体现文件主题。

这里,我们将一个兴趣领域看做一个单词,一个用户看做一个文件,全量用户看做文件集合,则用户在不同兴趣领域的TF-IDF可表示为:

通过这种方式,我们可以真正对兴趣领域有偏好的用户,标记为兴趣人群。

 如何筛选合适的关键词

兴趣领域关键词的筛选主要采用「典型关键词+热搜词」的方式。

典型关键词由业务同学基于运营经验给出,往往包含了如经典产品系列,入门级汉服品牌等最能体现圈子文化的词汇。

通过这些关键词,我们可以召回基础行为人群。但95后们追新求变的性格使得兴趣圈子里的生命周期短,更新换代非常快。

针对这个问题,我们以基础人群为标准,计算了人群近期热搜词,同样作为关键词进行人群召回,在保证人群规模的同时保证了人群的时效性。

「典型关键词+热搜词」找到领域关键词

下图是一个JK人群的关键词召回示意,图中由内而外分别是「标签-核心词-热搜词」。

JK标签关键词云

对于一些较为宽泛的兴趣领域,如植物,宠物等,我们希望能够深入到更加细分的领域进行运营。

但由于领域本身范围很大,业务同学也无法枚举所有细分领域。这种情况下,我们充分利用了集团内成熟的类目体系,以最细叶子类目名称(如宠物类目下还可以细分为猫,狗,鱼,仓鼠等叶子类目,植物下还有多肉,盆景等叶子类目)作为初始关键词,通过关联关系找到更多同一细分领域下的衍生关键词,从而形成细分领域的关键词集合,召回对应人群,形成标签。

下图为宠物类目的细分示意图,图中由内而外分别是「细分领域叶子类目–衍生关键词–兴趣领域词」

宠物标签关键词云

还有一些兴趣领域,很难通过单一关键词进行准确的描述。以复古怀旧类兴趣为例,拥有这种兴趣偏好的用户,其本质上是对“复古”这一抽象的风格概念有兴趣,它涵盖的商品或内容往往横跨美妆、服饰、绘画、摄影甚至收藏等多个领域。

这种情况下,我们同样基于关联关键词的思路,召回与复古相关的关键词组成词组,进行文本匹配和用户召回。

应用效果

========


目前标签体系已经完成了第一阶段的建设。第一阶段重点对95后最热衷的兴趣领域进行打标,成果如下:

  • 标签数量20+,精准覆盖95后兴趣领域,如JK、lolita、汉服、二次元等

  • 95后群体中已有超过50%的用户打上了兴趣标签,为业务精细化运营提供了充分的资源

除了覆盖量上的突破,标签体系同样在实际业务中拿到了投放效果,验证了人群的准确度。在一期建设完成后,我们将标签体系应用于闲鱼的直播业务,带来了实际的效果提升:

  • 对比以往默认的内容展示,兴趣人群-兴趣领域主播的匹配方式点击转化成倍提升,显著提高推荐效率

  • 由于兴趣类主播在首页曝光、点击量的提升,长尾的兴趣内容类主播获得了更多的流量,很大程度上提升了主播的积极性

===

===

未来规划

========


由于项目时间紧急,兴趣标签以快速实现业务目标为准则进行了初版建设,后续随着业务的发展,我们的标签体系也会逐渐完善

  • 在现有关键词发现的基础上,完善关键词挖掘能力,能够自动化地嗅探到领域内关键词汇,提升人群召回效率
    自我介绍一下,小编13年上海交大毕业,曾经在小公司待过,也去过华为、OPPO等大厂,18年进入阿里一直到现在。

深知大多数Java工程师,想要提升技能,往往是自己摸索成长或者是报班学习,但对于培训机构动则几千的学费,着实压力不小。自己不成体系的自学效果低效又漫长,而且极易碰到天花板技术停滞不前!

因此收集整理了一份《2024年Java开发全套学习资料》,初衷也很简单,就是希望能够帮助到想自学提升又不知道该从何学起的朋友,同时减轻大家的负担。img

既有适合小白学习的零基础资料,也有适合3年以上经验的小伙伴深入学习提升的进阶课程,基本涵盖了95%以上Java开发知识点,真正体系化!

由于文件比较大,这里只是将部分目录截图出来,每个节点里面都包含大厂面经、学习笔记、源码讲义、实战项目、讲解视频,并且会持续更新!

如果你觉得这些内容对你有帮助,可以扫码获取!!(备注Java获取)

img

Ending

Tip:由于文章篇幅有限制,下面还有20个关于MySQL的问题,我都复盘整理成一份pdf文档了,后面的内容我就把剩下的问题的目录展示给大家看一下

如果觉得有帮助不妨【转发+点赞+关注】支持我,后续会为大家带来更多的技术类文章以及学习类文章!(阿里对MySQL底层实现以及索引实现问的很多)

吃透后这份pdf,你同样可以跟面试官侃侃而谈MySQL。其实像阿里p7岗位的需求也没那么难(但也不简单),扎实的Java基础+无短板知识面+对某几个开源技术有深度学习+阅读过源码+算法刷题,这一套下来p7岗差不多没什么问题,还是希望大家都能拿到高薪offer吧。

《互联网大厂面试真题解析、进阶开发核心学习笔记、全套讲解视频、实战项目源码讲义》点击传送门即可获取!
2)]

[外链图片转存中…(img-YfipsnNQ-1713518412903)]

吃透后这份pdf,你同样可以跟面试官侃侃而谈MySQL。其实像阿里p7岗位的需求也没那么难(但也不简单),扎实的Java基础+无短板知识面+对某几个开源技术有深度学习+阅读过源码+算法刷题,这一套下来p7岗差不多没什么问题,还是希望大家都能拿到高薪offer吧。

《互联网大厂面试真题解析、进阶开发核心学习笔记、全套讲解视频、实战项目源码讲义》点击传送门即可获取!

### 基于微信小程序使用Java和MySQL设计实现生鲜超市平台 #### 一、项目概述 构建一个完整的生鲜超市平台涉及多个方面的工作,包括但不限于前端展示层的设计与开发(即微信小程序)、业务逻辑处理层的搭建(采用Java作为服务器端编程语言),以及持久化存储方案的选择(选用关系型数据库MySQL)。此平台旨在提供给用户便捷的商品浏览、购买体验的同时,也方便商家进行有效的店铺运营管理工作。 #### 二、技术选型说明 - **前端**:利用微信官方提供的开发者工具创建并维护整个应用界面;通过WXML+WXSS+CJS来编写页面结构样式脚本文件。 - **后端服务端**:Spring Boot框架简化了传统Java Web项目的配置过程,使得快速上手变得容易。对于RESTful API接口的支持让前后端分离更加彻底。 - **数据库**:选择开源的关系型数据库管理系统MySQL保存所有的业务数据,如商品详情、订单记录等重要信息。 #### 三、核心功能模块解析 ##### (一)角色权限控制机制 为了保障系统的安全性,在登录验证环节引入JWT(JSON Web Token),并对不同类型的账户赋予特定的操作权限。管理员可以执行增删改查所有资源的动作;而普通消费者仅限于查看公开售卖的产品列表和个人已提交过的购物清单等内容[^2]。 ##### (二)商品管理子系统 该部分主要围绕着商品生命周期展开工作——从最初录入新货品直至最终下架淘汰旧款式的全过程均需被有效跟踪记录下来。具体来说就是实现了上述提到过的一系列基础操作之外还增加了针对促销活动设置折扣价标签等功能特性[^1]。 ```java // 示例代码片段 - 添加新产品条目到数据库中 public void addProduct(Product product){ String sql = "INSERT INTO products (name, price, image_url) VALUES (?, ?, ?)"; jdbcTemplate.update(sql, new Object[]{product.getName(), product.getPrice(), product.getImageUrl()}); } ``` ##### (三)订单处理流程自动化 每当顾客确认收货之后便会触发后台自动完成交易结算任务,并同步更新对应货物剩余库存量数值变化情况。此外还会定期清理超期未支付状态下的预购单据以防占用过多不必要的空间资源浪费现象发生。 ##### (四)购物车临时储存区 允许访客自由挑选心仪之物加入虚拟篮子里暂存起来待后续结账时再统一计算总价金额数目多少即可。同时支持批量移除不想要的东西从而提高效率减少误操作几率。 ##### (五)分类导航栏布局优化 为了让查找目标变得更加直观简单明了,特意设置了多级联动菜单形式供用户按需筛选感兴趣领域内的相关内容项。比如先选定大类目“水果”,接着细分至具体的品种像苹果香蕉之类的选项可供进一步探索发现更多好物推荐哦! ##### (六)全文检索引擎集成部署 考虑到实际应用场景中的复杂需求特点,特别集成了Elasticsearch搜索引擎用来加速模糊匹配速度提升用户体验满意度水平。即使输入关键词存在拼写错误也能精准定位关联度较高的候选对象集合返回给调用方参考采纳使用[^3]。 #### 四、总结陈词 综上所述,这样一个基于微信生态体系打造而成的小程序版线上商城解决方案不仅能够满足日常生活中人们对于新鲜食材采购方面的基本诉求,而且凭借其背后强大的技术支持团队保驾护航确保各项性能指标始终处于行业领先位置之上不断追求卓越进步永不止步。
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值