本次分享主题是小红书社区反作弊探索与实践,主要讨论业务风控工作落地的解题思路。内容围绕下面四点展开:社区反作弊的意义、社区黑灰产生态、作弊防控策略和社区反作弊实践。以下全文根据费栋在 DataFun 智能风控论坛中的分享整理。
费栋:小红书社区风控策略算法负责人。本科毕业于南京大学,硕士就读于巴黎高科。现就职于小红书,从零到一搭建社区反作弊识别框架,负责社区风控安全策略算法体系建设
在讨论社区反作弊之前,我们先明确一下什么是作弊以及作弊会带来的行业风险。
1. 作弊的定义和行业风险
发现风险和定义问题是风控工作中非常关键的一环,但也是经常被大家忽略的一环。本文给出个人的定义,即“一切通过非正常手段去滥用产品功能,以谋取利益的行为”。关键词“牟利”,不论哪个行业,作弊一定是趋利的。
不同行业的作弊风险形式并不固定,其需要结合产品形态和业务模式来界定。比如,电商场景下作弊可能带来的风险有刷单、薅羊毛和黄牛等。支付场景的主要风险有交易诈骗,洗钱以及信用卡套现等。
那么,社区场景下又面临着哪些风险呢?
小红书 UGC 社区的环境下,面临的主要风险有如下几类,数据刷量(数据造假)、内容引流、欺诈以及虚假种草。
2. 社区反作弊的意义
多数场景下,反作弊的价值通过挽回 XX 资损来衡量。比如,电商的薅羊毛,支付的反信用卡套现,活动的骗补贴等,衡量标准可以是为平台节约了多少资损。那在社区中,该如何去衡量价值呢?或者说社区反作弊的意义是什么?
• 产品生存
面向监管:如果反作弊做得不到位,相应风险问题的浓度就有可能会变高,比如诈骗和刷单问题。近期,有关部门针对互联网诈骗展开行动,如断卡行动、清网行动等等。如果这些问题得不到有效解决,会给平台带来监管的风险。
机器资源:大量的作弊行为可能占用网络资源,造成服务的堵塞,影响用户使用功能。
从以上两个角度考虑,作弊在短期内是有可能影响产品和平台生存。
• 数据准确率
作弊行为会产生大量的垃圾数据,而数据是产品乃至战略决策的重要支撑。如无法分辨虚假数据,当其量级和占比达到一定程度时,可能导致分析、决策的偏差和失误,影响业务的判断。
• 平台生态
健康和真诚的内容生态和真实的数据是用户体验的保障。
我