淘宝穿衣搭配算法_方案二

本文探讨了如何通过预测商品的特征将其转换为分词结果,并利用相似度匹配技术进行推荐。具体流程包括从dim_fashion_matchsets中提取推荐搭配,通过与商品类别对比剔除不相关商品,最终生成推荐结果。此过程涉及IdToItem和ToTerms的转换,以及使用CommonCount和ToCats文件进行数据处理。

test_item预测的item由id变成它对应的分词结果,代表的是预测的商品是怎么样的一个商品 (test_IdToItem.java)IdToItem.txt
ToTerms.txt将dim_fashion_matchsets中各搭配的item由id变为dim_items.txt中的对应的分词
上面两者做相似度匹配,记录行号,将推荐搭配的行号,按相似度由高到低推荐给它,推荐结果line.txt.(CommonCount.java)可能出现问题Too many file open,截取后面一段的文件重新操作就可以了
最后回到matchsets,将与预测商品同类的商品剔除,保留其搭配的商品,其中预测的是否为同类商品,是根据他们的类别cat是否相同来判断的(未剔除)

比如line.txt第一个数为5735,即matchsets中第5735的推荐搭配最适合,找到dim_fashion_matchsets第5735行的数据 :
912534,932752,658698,519908,70341,3050430,300564,1071257,1590463,2240550,84524,3204531,3267304,3185197,1273818,1334655
而并不是这一行所有商品我们都需要,我们去ToCats.txt 中找到,第一个预测商品的对应的类别cat,第一行对应399,同时,去ToCat.txt中找到第5735行,对应matchsets中第5735行的所有商品的类别:487 487 487 487 399 399 399 399 220 220 220 220 317 317 317 317,相比对,我们需要剔除掉类别为399的商品

评论
成就一亿技术人!
拼手气红包6.0元
还能输入1000个字符
 
红包 添加红包
表情包 插入表情
 条评论被折叠 查看
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值