用算法来防范水军评分站点的福音

本文探讨了豆瓣、时光网等平台的评分算法,分析了这些算法如何应对水军干扰,并介绍了贝叶斯评分算法的工作原理及其应用。

摘要生成于 C知道 ,由 DeepSeek-R1 满血版支持, 前往体验 >

(先观影者)看了电影后的打分在4分以上(5分满分)或8.8分与9.1分之间(10分满分),但是上画第一天,电影评分就从9.1分直降至3分”

《王的盛宴》事件引发了不少对评分类网站水军的讨论。不管是电影评分还是游戏评分类站点,都可能遇到这种麻烦,那么对于用户和站点来说,怎样的算法才能相对更好的避免水军带来的干扰呢?

工具/原料

  • 豆瓣评分算法

  • 时光网评分算法

  • 贝叶斯算法

  • 手游全书评分算法

方法/步骤

  1. 1

    首先我们来看看这次争议巨大的豆瓣评分算法

    豆瓣的评分机制是最低一分,最高五分,五个档次。

    豆瓣公式为得分=(5X1+4X2+3X3+2X4+X5)*2

    由于豆瓣上的用户在打分的时候加入了很多情绪化的因素。常常有打分两极分化的情况出现。豆瓣上之所以不少评分泾渭分明,在很大程度上,是和其五级简单打分制度相关的。其评分制度够简单,用户就越容易走极端。豆瓣上的评分很侧重情绪分,很能够代表豆瓣群体的判断,而不是所谓的”伪客观“。

  2. 2

    再看看时光网的评分算法

    时光网采用最简单的平均分算法,同时使用不同于豆瓣的十分制。

    这种算法毋庸置疑,提高平均分数,更多用户会选择中间段的分数进行打分,相对中庸的七八分明显增多。而因为用户中庸模棱两可的想法,更没有起到真是反应分数的作用。十分制会增加用户的认知成本,有十个选择出现的时候,用户会花更多时间考虑自己要如何打分,也降低用户参与度。

    二者共同的地方在于,在评分早期遭受水军袭击后,不管是刷高分还是刷低分,都会很快的在评分上显示出来,于是造成了评分与实际质量的巨大差距,并可能对用户有极大的误导和跟风作用。那么这种简单的加权和平均算法不能满足我们的需要,有什么办法能避免水军带来的巨大影响呢?

  3. 3

    贝叶斯算法也许能帮助为之发愁的厂商和用户们。贝叶斯算法是著名的电影数据库站点IMDB在使用的评分方法。

    用公式来表达一下这个算法:

    - WR,加权得分(weighted rating)

      - R,该内容的平均得分(Rating)。

    - v,票数(votes)。

    - m,基准票数

    - C,站点所有内容的平均分。

    简单的表示就是

    得分=(票数÷(票数+基准票数))×均分+(基准票数÷(票数+基准票数))×总均分

    其实这公式只有一个目的,让得分偏向平均分一些,如果投票越多,它的评分就越接近真实的平均分。否则就越接近所有游戏电影的平均分。其难点在于如何选择基准票数,并使得各个片子适当的拉开差距。

    这里就有一个问题:如何让冷门的内容和热门的内容所得的分数,具有可比性。这就是基准票数存在的意义,它给了一个合理的思路,如果要比较两个游戏的好坏,至少应该请同样多的人玩过。

    有人基准票数,任意两个内容,就站在了同一起点。

    用算法来防范水军评分站点的福音
  4. 4

    由于imdb不方便测试,我们找到了另一个使用这个算法的站点:

    手游全书

    我们对一款暂无评分的游戏使用了几个马甲进行投票,全部投十分,发现分数确实上涨了,但也只涨到了6.9。而如果这在豆瓣和时光,就已经肯定是全十分了。这可能是gamebook.91.com站点设置的基准票数m较少,如果对应用户群体巨大,那么调整相应的m值,就能达到同样抑制初期水军的作用。

    当然"贝叶斯算法"也不是万能的,主要问题是它假设用户的投票是完全呈正态分布。比如,游戏X有10个玩家评分,5个为五星,5个为一星;游戏Y也有10个观众评分,都给了三星。这两个游戏的平均得分(无论是算术平均,还是贝叶斯算法)将都是三星,但是实际上游戏X可能比游戏Y更值得玩。不过这就是另一个话题了。 

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值