机器如何计算“相关性”?

本文讨论了如何通过计算和整理社会民生类文章来实现更好的新闻关联策略。通过预先处理前一天的文章,形成内聚性强的文章组,并为每组提炼出代表性的关键词,以此为基础进行跨文章的主题思想关联。

摘要生成于 C知道 ,由 DeepSeek-R1 满血版支持, 前往体验 >

 

机器只是知道关键词。

 

绝对不可能知道语义。

 

所以无从判断中心思想。

 

我们的观点是:

 

这是一个策略问题。

 

比方说网易新闻,http://gd.news.163.com/06/1024/04/2U61I1M40036000Q.html(中间有自动标出来的TAG,但不够准确),既然一个新闻两三百字难以确定。毕竟某些仅仅提到过一次的词语也可能才真正是主题思想。

 

那么,到了我们这边,我们由于不是做新闻的,所以,能玩的很多。

 

比如说,事先把昨天一整天的社会民生的文章计算,整理出许多内聚性很强的文章组,每组这样就会有一组词语来代表这组的主题思想。

 

然后,读者阅读其中一篇时,那么这片文章所属的组的代表词语,就可以关联到很多其他文章。

 

这样,发散性会好一点。

 

而不会说,抢劫案的新闻匹配的都是抢劫案。

 

可能会使派出所、治安联防等的昨日新闻都关联进来。

 

也就是说,单纯靠一篇新闻去玩,是不靠谱的

 

这就是一个策略问题,思路问题。

 

不过,产品设计人员一定要考虑到,用户真的会按照你的这种思路浏览吗?

 

您看六间房里面的相关推荐。

 

可不是这么样子的。

 

发散性很强。

 

引入各种策略。来让用户感觉好看。

 

 

Trackback: http://tb.blog.youkuaiyun.com/TrackBack.aspx?PostId=1354655


评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值