Expedia:1st Place Solution
对 https://www.kaggle.com/c/expedia-hotel-recommendations/forums/t/21607/1st-place-solution-summary 总结翻译
- 距离矩阵完整
将‘用户’和‘旅店’映射到球体位置。如果我们可以成功做到这样,我们可以“扩大泄漏”。对以前发生的距离,以及潜在的任何例子,用户和酒店之间的距离都将变成已知的。
这种方法最明显的问题是如何解决当前的组合不同的列来辨认用户和宾馆位置。对于用户,元组U=(user_location_country, user_location_region, user_location_city)是一个很自然的选择。对于宾馆的事将更少的明显。两个类似决定宾馆位置H1=(hotel_country, hotel_market, hotel_cluster)和H2=(srch_destination_id, hotel_cluster)。H1和H2都被用来做特征,而且依靠最终模型去筛选出哪个更有用。
&