手机名称联想

碰到个问题,从一家网站抓手机名称是没事的,但是跟另一家就不同,

比如:诺基亚 8800(黑色)与诺基亚 8800,这样简单的不同,

或者:苹果 iPhone 3G 与 Apple iPhone 3G,这样的不同,

 

类似这样,可能对大网站来说,是要加规则,或者通过用户行为,说简单了就是从用户query和点击入手,

比如呢,用户搜索 Apple iPhone 3G,但是呢,我站内没法全部匹配到,因为没这规则,所以呢,会进行切词,

切词 后 得到 1. Apple iPhone 3G 2. Apple iPhone 3. iPhone 3G 哎,就到这了,可以找到 苹果 iPhone 3G,

那么这就形成了一次规律,就是 Apple iPhone 3G -> 苹果 iPhone 3G,

网站规模小,但是如果有若干次用户都这么做,那么就应该从这个规律上升到规则了,下次就可以不用切词直接返回,

搜素策略变为:query : Apple iPhone 3G -> 苹果 iPhone 3G  找不到 再进行上面的22切词,之类的,

那么这个仅仅是搜索的策略,我现在是入库,还需要处理么?

下次再说,O(∩_∩)O~

 

 

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值