12、邮件优先级排序与回归分析:原理、实践与应用

邮件优先级排序与回归分析:原理、实践与应用

邮件优先级排序

权重数据构建

在邮件优先级排序中,我们构建了基于训练数据中所有邮件消息词频的最终权重数据。过程与垃圾邮件分类中计算词频的方法类似,但这次会根据这些计数分配对数转换后的权重。 msg.weights 数据框隐含的假设是,与我们之前见过的其他消息相似的新消息比完全陌生的消息更重要。
我们有五个权重数据框用于排序:
1. from.weight :社交活动特征。
2. senders.df :线程中发件人的活动。
3. thread.weights :线程消息活动。
4. term.weights :活跃线程中的术语。
5. msg.weights :所有邮件中的常用术语。

训练和测试排序器

为了为训练数据中的每条消息生成优先级排名,我们需要将上一节中生成的所有权重相乘。具体步骤如下:
1. 定义 get.weights 函数

get.weights <- function(search.term, weight.df, term=TRUE) {
    if(length(search.term) > 0) {
        if(term) {
            term.match &l
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值