27、偏好挖掘:算法与应用解析

偏好挖掘:算法与应用解析

1. 复杂偏好构造器

偏好可以通过复杂偏好构造器进行归纳组合。帕累托偏好(Pareto preference)$P = P1 ⊗ P2$ 将底层偏好视为同等重要,而优先级偏好(Prioritized preference)$P = P1 \& P2$ 则认为 $P1$ 比 $P2$ 更重要。例如,$P = POS(author, {Douglas Adams, Edgar Wallace}) \& NEG(binder, {paperback})$ 表示对作者道格拉斯·亚当斯(Douglas Adams)和埃德加·华莱士(Edgar Wallace)有正向偏好,对平装书有负向偏好,且后者的偏好重要性较低。这种偏好构造器的定义已被证明适合描述复杂的用户需求。

2. 网络应用中用户日志数据的要求

数据挖掘得益于大量数据的可用性,因为大量记录可确保模式的统计显著性。用户交易的日志数据有多种来源,如 Web 服务器日志文件或应用服务器上的交易日志。
- Web 服务器日志 :当用户访问网站时由 Web 服务器生成,可符合标准化格式,如通用日志文件格式。日志数据包含客户端主机的 IP、当前时间戳和用户正在访问的 URL。URL 中存储着关于用户需求的有价值信息,但 Web 服务器日志也有缺点,如“添加到购物车”或“更改商品”等事件不可用,用户还可禁用浏览器中的 cookie,导致无会话信息或用户标识。对 Web 服务器日志进行偏好挖掘需要一些数据预处理,需从记录的 URL 中提取用户输入并存储在关系数据库中,同时需要用户标识以分别检测每个客户的偏好。
- 应用服务器日志

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值