Deep Neural Networks for YouTube Recommendations 踩坑指南

本文探讨了特征预处理的策略,包括线性单调和均匀分布特征的处理,正态分布特征的分桶,枚举值特征的离散化和embedding,以及缺失值的填充。在模型训练中,分析了用户向量无区分度的原因和解决办法,如加入序列特征,尝试不同激活函数,检查item向量的区分度等。针对模型不收敛的问题,提出了负样本构造的改进,调整batch_size和学习率,删除重复特征,以及处理全空用户和平均向量item的样本。此外,还提到了温度系数和正则化的潜在作用。

摘要生成于 C知道 ,由 DeepSeek-R1 满血版支持, 前往体验 >

特征预处理:

  1. 分析特征 和 label 的关系,如果是线性单调的(特征值越大,label 为正的比例越大)或均匀分布的(无论特征值是多少,label 分布都一样),可以直接作为连续值使用,需要进行 max - min 归一化
  2. 假如一些连续型特征,比如年龄特征是个正态分布,则需要分桶,保证每个桶和 label 是单调的
  3. 其他的枚举值特征都需要离散化,或者 embedding 化,简单枚举值可以尝试用 01 代替
  4. 特征 fillna 使用所有样本在当前特征下的 mean 值,不要用 -1(树模型一般使用 -1)
  5. embedding 特征用最长的序列(30天点击的 item 平均向量,不要再把 last_14, last_3, last_1 等平均向量都加入)
  6. embedding 特征的空值填充,使用平均向量代替

模型训练:

用户向量没有区分度原因:

  1. 用户特征只用了泛化特征(需要加入点击 item embedding 序列特征)
  2. 加入 BN 或者正则试一下
  3. 使用 lecky_relu 代替 relu 试一下,避免很多神经元值为 0
  4. 查看 item vector 是否有区分度

模型不收敛(val_auc 只在 0.5 左右):

  1. 负样本的构造,不可以用曝光未点击,而需要用热度全局负采样(负采样的倍数需要试验)
  2. 加大 batch_size 和学习率,避免陷入局部最优
  3. 减去多个重复序列特征
  4. 删除枚举值特征(特征不重要且过于稀疏)
  5. 样本的 RandomSample ,需要按照用户先排序,使相同用户不同时出现在训练集和测试集中,否则会导致 auc 达到不准确的 0.9
  6. 网络最后一层之前不要激活(sigmoid 或者 softmax 之前不要激活),不然会导致 auc 为 0.5 附近(最后一层输出加 relu 激活可能导致输出值是0,如果用 sigmoid 那么求出的概率是 0.5,-log0.5等于0.69。而且,由于relu输出值为0的时候,relu的导数为0,梯度没办法回传,因此损失就一直固定在 0.69,且prediction 趋近 -1。)
  7. 去除 user 特征全空的样本(如 daily 样本中有 30% 的用户,都是特征全空的用户,也就是 T-30 内无行为的用户,会导致这部分样本过大, 从而导致模型学习过拟合)
  8. 去除 item 向量为平均向量的样本(这样同样会导致正负样本里,都有很多 item vector 一样的样本,导致模型学习过拟合)
  9. 温度系数(没有尝试)
  10. learning rate再乘个 0.1 看看
  11. 加正则化(导致 user_vector 几乎一样)

参考:https://www.zhihu.com/question/315120636/answer/1687203383

智能网联汽车的安全员高级考试涉及多个方面的专业知识,包括但不限于自动驾驶技术原理、车辆传感器融合、网络安全防护以及法律法规等内容。以下是针对该主题的一些核心知识解析: ### 关于智能网联车安全员高级考试的核心内容 #### 1. 自动驾驶分级标准 国际自动机工程师学会(SAE International)定义了六个级别的自动驾驶等级,从L0到L5[^1]。其中,L3及以上级别需要安全员具备更高的应急处理能力。 #### 2. 车辆感知系统的组成与功能 智能网联车通常配备多种传感器,如激光雷达、毫米波雷达、摄像头和超声波传感器等。这些设备协同工作以实现环境感知、障碍物检测等功能[^2]。 #### 3. 数据通信与网络安全 智能网联车依赖V2X(Vehicle-to-Everything)技术进行数据交换,在此过程中需防范潜在的网络攻击风险,例如中间人攻击或恶意软件入侵[^3]。 #### 4. 法律法规要求 不同国家和地区对于无人驾驶测试及运营有着严格的规定,考生应熟悉当地交通法典中有关自动化驾驶部分的具体条款[^4]。 ```python # 示例代码:模拟简单决策逻辑 def decide_action(sensor_data): if sensor_data['obstacle'] and not sensor_data['emergency']: return 'slow_down' elif sensor_data['pedestrian_crossing']: return 'stop_and_yield' else: return 'continue_driving' example_input = {'obstacle': True, 'emergency': False, 'pedestrian_crossing': False} action = decide_action(example_input) print(f"Action to take: {action}") ``` 需要注意的是,“同学”作为特定平台上的学习资源名称,并不提供官方认证的标准答案集;建议通过正规渠道获取教材并参加培训课程来准备此类资格认证考试
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值