推特搜索结果个性化与回归特征子集选择策略
1. 推特搜索结果个性化
在推特搜索中,为了实现搜索结果的个性化,提出了一种名为PWEBA的新颖方法。该方法利用神经词嵌入技术,旨在为用户提供更符合其需求的搜索结果。
为了评估PWEBA方法的有效性,采用了两种不同的离线评估方法:使用推特列表和使用主题标签。这两种方法在代表用户选择搜索查询的方式以及确定给定用户的给定查询相关推文方面有所不同。
实验结果基于三个在文献中广泛使用的指标:P@k、平均精度(AP)和倒数排名(RR),并结合上述两种离线评估方法。结果表明,PWEBA方法在P@k、AP和RR指标上均优于其他方法。
未来的研究方向主要有两个方面:
- 借助搜索引擎(如谷歌)扩展推文文本,使推文更具信息量。
- 研究在构建用户画像时如何纳入用户社交网络中的朋友信息。
2. 回归任务中的特征子集选择
在工业应用中,回归任务(如传感器值预测)起着至关重要的作用。以汽车行业为例,现代汽车拥有数百个过程变量,用于预测目标传感器值。由于系统的复杂性,每个特征子集与目标之间往往呈现出不同类型的相关性。捕捉这些局部交互可以改善回归模型。
然而,现有的许多特征选择算法专注于获取特征的单一投影,无法充分利用不同变量子集之间的多种局部交互。因此,高效地选择多个不仅有助于提高预测质量,而且具有多样性(即包含互补信息)的子集仍然是一个挑战。
为了解决这个问题,提出了一种名为Diverse Subset Selection Strategy(DS3)的框架,该框架包含两个关键组件:
- 基于多种相关属性的特征选择技术。
超级会员免费看
订阅专栏 解锁全文
996

被折叠的 条评论
为什么被折叠?



